データ入力ツール

ツールごとに学習

データ入力ツールには、「ツールごとに学習」が用意されています。サンプルワークフローを参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。

データ入力ツールを使用して、データをファイルまたはデータベースに接続してワークフローに追加します。

注記

ワイルドカードを使用して Hadoop 分散ファイルシステムで複数の .csv ファイルを読み取ると、エラーが発生します。

ツールの設定

データ入力ツールの設定ウィンドウには、 ファイルまたはデータベースを接続する と オプション の 2 つのセクションがあります。

ファイルまたはデータベースを接続する

以下の手順では、データ接続マネージャー (DCM) を無効にした場合のプロセスについて説明します。有効にすると、[ ファイルまたはデータベースを接続 ] ドロップダウンが [ 接続を設定します ] ボタンに置き換えられ、ここから [ データ接続 ] ウィンドウが開き、DCM でサポートされているデータソースのみが表示されます。テクノロジを選択すると DCM が開きます。

キャンバス上のデータ入力ツールを使用して、次の手順に従います。

[ 設定 ]ウィンドウで、[ ファイルまたはデータベースを接続 ]ドロップダウンを選択します。
Designer では、 [データ接続] ウィンドウが表示されます。[ 最近 ]、[ 保存済み ]、[ ファイル ]、[ データソース ]、[ Server ] のいずれかを使用してデータ接続を設定します。

保存済み

保存済み 接続を選択します。接続の名前を変更および編集するには、保存された接続の管理を使用します。

ファイル

ローカルディレクトリまたはネットワークディレクトリ内のファイルに接続するには、次の 4 つのオプションがあります。

ファイル接続 で、 ファイルを選択 してファイルを参照します。
ファイルを ファイル接続 にドラッグします。
サポートされているすべてのファイルタイプ で、その種類のファイルを参照するファイルタイプ拡張子を選択します。
データ接続 を閉じ、ファイルをキャンバスに直接ドラッグします。

データソース

データソースには、サポートされているデータソースと頻繁に使用されるデータソースが表示されます。

ツール: インストールされていないツールに対して [クイック接続] を選択すると、Alteryx コミュニティのそのツールをダウンロードしてインストールする手順を表示するブラウザーが開きます。ページの指示をよくお読みください。ツールをインストールすると、キャンバス上のデータ入力ツールがデータソースタブで選択したツールに変わります。
データソース:
- ODBC は、その特定のドライバーを使用するシステム上の DSN のフィルター処理された一覧を表示する ODBC 接続ウィンドウを起動します。
- OleDB は、ネイティブ Windows OleDB マネージャーを起動します。
- OCI は、ネイティブ Oracle OCI 接続マネージャーを起動します。ここから、この接続に使用する tnsnames.ora ファイル、ユーザー名とパスワードの資格情報で定義されているネットサービス名を選択します。
- バルクは、選択した接続タイプのバルク接続を設定できるようにする特別なダイアログを開きます。
- クイック接続: SQL または Oracle クイック接続の場合、既存の保存済み接続を使用するか、または新規の保存済み接続を作成できます。詳細については、以下のページを参照してください。
  - SQL
  - Oracle
- 他のすべてのクイック接続は、別のツールを使用します。

Server

Serverには、ローカルコンピュータに追加されている各Server UIとその URL が表示されます。各 Server 名の下のリストには、利用可能な Server に保存されている保存済みの接続が含まれています。

[+ Server] を選択して、別の Alteryx Server を追加します。

複数のファイルを選択

ファイル参照ウィンドウで、ファイルパスの一部としてワイルドカードを入力します。

次のようなデータファイルが複数ある場合を考慮してください。

フィールドの数が同じで、各フィールドのデータ型が同じ
同じディレクトリ内の類似名

注記

すべてのファイルのフィールド数が同じで、各フィールドのデータ型が同じであれば、単一のデータ入力ツールで *.csv や 2019*.csv などのワイルドカード形式を使用して、複数のファイルを読み取ることができます。Designer では、最初に読み取ったファイルに基づいて、フィールド数とファイルタイプを設定します。一致しないファイルはスキップされ、警告が表示されます。*.csv などのワイルドカード構文を使用する場合、どのファイルを最初に読み込むかは指定することはできません。どのファイルを 1 番目として指定するかは、システムにに委ねられています。

複数のファイルに共通するファイル名を入力し、後続のすべての文字の代わりであれば「* (アスタリスク)」を、1文字の代わりであれば「?」を追加します。ファイル名を指定するときに、すべてのファイルに共通のファイル拡張子を含めます。

例 1

このパスは、 data\datafiles ディレクトリ内のファイル名が ABCD で始まるすべての .csv ファイルを取り込みます。

data\datafiles\ABCD*.csv

ABCD_4.csv および ABCD_012.csv が取り込まれます。

例 2

このパスは、 data\datafiles ディレクトリ内の ABCD_ で始まり 1 文字の追加があるすべての .csv ファイルを取り込みます。

data\datafiles\ABCD_?.csv

Excel

Excel入力を選択 で、Excel 入力のいずれかを選択します。

Excelファイルで使用可能なシートから選択する シートを選択 します。
- 範囲 (セル、行、列) を選択 : 必要に応じて、シート内のセル、行、列の範囲を選択します。
Excelファイルで使用可能な名前付き範囲から選択する 名前付き範囲 を選択します。
シート名のリストのみをインポート は、シート名を値として含む単一の列を持つ出力を作成するために使用します。このオプションを選択すると、関連データは出力されません。

選択した Excel シートが開いている場合は、エラーメッセージが表示され、続行できません。シートを閉じ、 Excel入力を選択 ダイアログで更新ボタンを選択し、入力プロセスを終了します。

データ入力ツールは、定義 されていない 列をスキップします。定義された列とは、データを含んでいるか、ユーザーによってクリアされたデータを以前に含んでいた列です。定義されていない列を含めるには、[ Excel入力を選択 ] ダイアログの [ 範囲　(セル、行、列) を選択 ] オプションで範囲を指定します。

Gzip と Zip ファイル

詳細については、 Gzipファイルサポートと Zipファイルサポートを参照してください。

gz、tgz、.zipファイルを選択すると、 [抽出するファイルの種類] ウィンドウが表示されます。ドロップダウンを使用して、使用するファイルタイプを選択します。

ファイルの選択 : 抽出するファイルの横にあるチェックボックスをオンにします。

Alteryxでサポートされていないファイルを含め、GzipファイルまたはZipファイル内のすべてのファイルを表示するには、 抽出するファイルタイプを選択 の下にある その他のファイル を選択します。ファイルの種類を選択して、 他のファイルを解析 します。

重要

Alteryx はGalleryでは GzipとZipファイルをサポートしていません。

サポートされているファイルの種類

Alteryx カルガリー	.cydb
Alteryx データベース	.yxdb
Alteryx Spatial Zip	.sz
Avro	.avro
コンマ区切り値 (CSV)	.csv
dBase	.dbf
ESRI Personal GeoDatabase	.mdb
ESRI Shapefile	.shp
Extensible Markup Language	.xml
Flat ASCII	.flat
GIS	.grc、.grd
Google Earth/Google Maps	.kml
Gzip	.gz、.tgz
IBM SPSS	.sav
JSON	.json
MapInfo Professional Interchange Format	.mif
MapInfo Professional Table	.tab
Microsoft Access 2000-2003	.mdb
Microsoft Access 2007、2010、2013、2016	.accdb
Microsoft Excel バイナリ	.xlsb
Microsoft Excel 1997-2003	.xls
Microsoft Excel	.xlsx
Microsoft Excel Macro-Enabled	.xlsm
QlikView	.qvx
SAS	.sas7bdat
SQLite	.sqlite
SRC Geography	.geo
テキスト	.txt、.asc
Zip	.zip

不明なファイルタイプ

不明なファイルタイプには、Alteryxがネイティブで読み取れないその他のファイルタイプを含みます。データ入力ツールを使用して不明なファイルタイプを読み取ると、[ファイルタイプを解決] ウィンドウには、次のオプションが表示されます。

組み込み型として読み込む : ファイルの構造が似ているファイルタイプを選択します。
固定幅のテキストファイルとして読み込む : このオプションを選択すると、スライド式ルーラーを使用して列を割り当てることができます。このオプションの詳細については、フラットファイルレイアウトを参照してください。
区切りテキストファイルとして読み込む : データの列区切りとなる単一の区切り記号がある場合は、このオプションを選択します。適切な区切り文字タイプを選択し、オプションでデータに最初の行にフィールド名が含まれているかどうかを選択します。

オプション

ファイル形式オプションを選択します。オプションは、接続先のファイルまたはデータベースによって異なります。詳細については、ファイル形式オプションを参照してください。

データレイアウトのプレビュー

プレビュー ウィンドウでデータレイアウトをプレビューします。データレイアウトのプレビューは、ワイドファイルでは 100 レコード以下に制限されています。データに 1500 列が含まれている場合、少なくとも 1 レコード、最大 2 行が表示されます。すべてのデータを表示するには、閲覧ツールを使用します。

重複した列名

入力ファイルに同じ名前の列が複数含まれている場合、Designer は次のルールに従って重複した列の名前を自動的に変更します。

重複する名前の末尾が 1 または 9 の場合

重複する列名の最後の文字が 1 または 9 の場合、Designer は重複する列名にアンダースコア「_」と 2 で始まる数字を追加します。

元の列名	重複列 (Designer によって変更された名前)
A1	A1_2
A9	A9_2

重複する名前の末尾が 2～8 (両端含む) の数字の場合

重複する列名の最後の文字が 2 と 8 の間 (両端を含む) の数字の場合、Designer はその数字をインクリメントして重複する列名を変更します。

ただし、最後から2番目の文字も数字である場合、Designer は重複する列名にアンダースコア「_」と 2 で始まる数字を追加します。

元の列名	重複列 (Designer によって変更された名前)
A2	A3
A5	A6
A22	A22_2

重複した名前の末尾が英文字または特殊文字の場合

重複する列の最後の文字が英文字または特殊文字の場合、Designer は 2 で始まる数字を追加して、重複する列名を変更します。

元の列名	重複列 (Designer によって変更された名前)
age	age2
registered?	registered?2

注記

Visual Query Builderではマルチバイト文字を正しく表示できません。テーブルタブを代わりに使用してください。

データ出力ツールをデータ入力ツールに変換

データ出力ツールをデータ入力ツールに変換できます。

データ入力ツール に変換する データ出力ツール を右クリックします。
データ入力に変換 を選択します。

データ出力ツールがデータ入力ツールになります。

このセクションの内容: