データ入力ツール
ツールごとに学習
データ入力ツールには、「ツールごとに学習」が用意されています。 サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。
データ入力ツールを使用して、データをファイルまたはデータベースに接続してワークフローに追加します。
注記
ワイルドカードを使用して Hadoop 分散ファイルシステム で複数の .csv ファイルを読み取ると、エラーが発生します。
ツールの設定
データ入力ツールの 設定ウィンドウ には、 ファイルまたはデータベースを接続する と オプション の 2 つのセクションがあります。
ファイルまたはデータベースを接続する
以下の手順では、データ接続マネージャー (DCM) を無効にした場合のプロセスについて説明します。有効にすると、[ ファイルまたはデータベースを接続 ] ドロップダウンが [ 接続を設定します ] ボタンに置き換えられ、ここから [ データ接続 ] ウィンドウが開き、DCM でサポートされているデータソースのみが表示されます。テクノロジを選択すると DCM が開きます。
キャンバス上のデータ入力ツールを使用して、次の手順に従います。
[ 設定 ]ウィンドウで、[ ファイルまたはデータベースを接続 ]ドロップダウンを選択します。
Designer では、 [データ接続] ウィンドウが表示されます。[ 最近 ]、[ 保存済み ]、[ ファイル ]、[ データソース ]、[ Server ] のいずれかを使用してデータ接続を設定します。
[最近の接続] セクションには、最近設定されたファイルとデータ接続が含まれています。最近の接続を選択するか、 リストの消去 を選択して最近の接続を削除できます。
保存済み 接続を選択します。接続の名前を変更および編集するには、 保存された接続の管理 を使用します。
ローカルディレクトリまたはネットワークディレクトリ内のファイルに接続するには、次の 4 つのオプションがあります。
ファイル接続 で、 ファイルを選択 してファイルを参照します。
ファイルを ファイル接続 にドラッグします。
サポートされているすべてのファイルタイプ で、その種類のファイルを参照するファイルタイプ拡張子を選択します。
データ接続 を閉じ、ファイルをキャンバスに直接ドラッグします。
データソース
データソース には、サポートされているデータソースと頻繁に使用されるデータソースが表示されます。
ツール: インストールされていないツールに対して [クイック接続] を選択すると、Alteryx コミュニティのそのツールをダウンロードしてインストールする手順を表示するブラウザーが開きます。ページの指示をよくお読みください。ツールをインストールすると、キャンバス上のデータ入力ツールがデータソースタブで選択したツールに変わります。
データソース:
ODBC は、その特定のドライバーを使用するシステム上の DSN のフィルター処理された一覧を表示する ODBC 接続ウィンドウを起動します。
OleDB は、 ネイティブ Windows OleDB マネージャーを起動します。
OCI は、ネイティブ Oracle OCI 接続マネージャーを起動します。ここから、この接続に使用する tnsnames.ora ファイル、ユーザー名とパスワードの資格情報で定義されているネットサービス名を選択します。
バルクは、選択した接続タイプのバルク接続を設定できるようにする特別なダイアログを開きます。
クイック接続: SQL または Oracle クイック接続の場合、既存の保存済み接続を使用するか、または新規の保存済み接続を作成できます。詳細については、以下のページを参照してください。
他のすべてのクイック接続は、別のツールを使用します。
Server
Serverには、ローカルコンピュータに追加されている各Server UIとその URL が表示されます。各 Server 名の下のリストには、利用可能な Server に保存されている保存済みの接続が含まれています。
[+ Server] を選択して、別の Alteryx Server を追加します。
ファイル参照ウィンドウで、ファイルパスの一部としてワイルドカードを入力します。
次のようなデータファイルが複数ある場合を考慮してください。
フィールドの数が同じで、各フィールドのデータ型が同じ
同じディレクトリ内の類似名
注記
すべてのファイルのフィールド数が同じで、各フィールドのデータ型が同じであれば、単一のデータ入力ツールで *.csv や 2019*.csv などのワイルドカード形式を使用して、複数のファイルを読み取ることができます。Designer では、最初に読み取ったファイルに基づいて、フィールド数とファイルタイプを設定します。一致しないファイルはスキップされ、警告が表示されます。*.csv などのワイルドカード構文を使用する場合、どのファイルを最初に読み込むかは指定することはできません。どのファイルを 1 番目として指定するかは、システムにに委ねられています。
複数のファイルに共通するファイル名を入力し、後続のすべての文字の代わりであれば「* (アスタリスク)」を、1文字の代わりであれば「?」を追加します。ファイル名を指定するときに、すべてのファイルに共通のファイル拡張子を含めます。
例 1
このパスは、
data\datafiles
ディレクトリ内のファイル名が
ABCD
で始まるすべての .csv ファイルを取り込みます。
data\datafiles\ABCD*.csv
ABCD_4.csv
および
ABCD_012.csv
が取り込まれます。
例 2
このパスは、
data\datafiles
ディレクトリ内の
ABCD_
で始まり 1 文字の追加があるすべての .csv ファイルを取り込みます。
data\datafiles\ABCD_?.csv
Excel入力を選択 で、Excel 入力のいずれかを選択します。
Excelファイルで使用可能なシートから選択する シートを選択 します。
範囲 (セル、行、列) を選択 : 必要に応じて、シート内のセル、行、列の範囲を選択します。
Excelファイルで使用可能な名前付き範囲から選択する 名前付き範囲 を選択します。
シート名のリストのみをインポート は、シート名を値として含む単一の列を持つ出力を作成するために使用します。このオプションを選択すると、関連データは出力されません。
選択した Excel シートが開いている場合は、エラーメッセージが表示され、続行できません。シートを閉じ、 Excel入力を選択 ダイアログで 更新 ボタンを選択し、入力プロセスを終了します。
データ入力ツールは、定義 されていない 列をスキップします。定義された列とは、データを含んでいるか、ユーザーによってクリアされたデータを以前に含んでいた列です。定義されていない列を含めるには、[ Excel入力を選択 ] ダイアログの [ 範囲 (セル、行、列) を選択 ] オプションで範囲を指定します。
詳細については、 Gzipファイルサポート と Zipファイルサポート を参照してください。
gz、tgz、.zipファイルを選択すると、 [抽出するファイルの種類] ウィンドウが表示されます。ドロップダウンを使用して、使用するファイルタイプを選択します。
ファイルの選択 : 抽出するファイルの横にあるチェックボックスをオンにします。
Alteryxでサポートされていないファイルを含め、GzipファイルまたはZipファイル内のすべてのファイルを表示するには、 抽出するファイルタイプを選択 の下にある その他のファイル を選択します。ファイルの種類を選択して、 他のファイルを解析 します。
重要
Alteryx はGalleryでは GzipとZipファイルをサポートしていません。
.cydb | |
.yxdb | |
Alteryx Spatial Zip | .sz |
.avro | |
コンマ区切り値 (CSV) | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
Extensible Markup Language | .xml |
.flat | |
GIS | .grc、.grd |
Google Earth/Google Maps | .kml |
.gz、.tgz | |
IBM SPSS | .sav |
.json | |
MapInfo Professional Interchange Format | .mif |
MapInfo Professional Table | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007、2010、2013、2016 | .accdb |
Microsoft Excel バイナリ | .xlsb |
Microsoft Excel 1997-2003 | .xls |
.xlsx | |
Microsoft Excel Macro-Enabled | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
テキスト | .txt、.asc |
.zip |
不明なファイルタイプには、Alteryxがネイティブで読み取れないその他のファイルタイプを含みます。 データ入力ツール を使用して不明なファイルタイプを読み取ると、[ファイルタイプを解決] ウィンドウには、次のオプションが表示されます。
組み込み型として読み込む : ファイルの構造が似ているファイルタイプを選択します。
固定幅のテキストファイルとして読み込む : このオプションを選択すると、スライド式ルーラーを使用して列を割り当てることができます。このオプションの詳細については、 フラットファイルレイアウト を参照してください。
区切りテキストファイルとして読み込む : データの列区切りとなる単一の区切り記号がある場合は、このオプションを選択します。適切な区切り文字タイプを選択し、オプションでデータに最初の行にフィールド名が含まれているかどうかを選択します。
オプション
ファイル形式オプションを選択します。オプションは、接続先のファイルまたはデータベースによって異なります。詳細については、 ファイル形式オプション を参照してください。
データレイアウトのプレビュー
プレビュー ウィンドウでデータレイアウトをプレビューします。データレイアウトのプレビューは、ワイドファイルでは 100 レコード以下に制限されています。データに 1500 列が含まれている場合、少なくとも 1 レコード、最大 2 行が表示されます。すべてのデータを表示するには、 閲覧ツール を使用します。
重複した列名
入力ファイルに同じ名前の列が複数含まれている場合、Designer は次のルールに従って重複した列の名前を自動的に変更します。
重複する名前の末尾が 1 または 9 の場合
重複する列名の最後の文字が 1 または 9 の場合、Designer は重複する列名にアンダースコア「_」と 2 で始まる数字を追加します。
元の列名 | 重複列 (Designer によって変更された名前) |
---|---|
A1 | A1_2 |
A9 | A9_2 |
重複する名前の末尾が 2~8 (両端含む) の数字の場合
重複する列名の最後の文字が 2 と 8 の間 (両端を含む) の数字の場合、Designer はその数字をインクリメントして重複する列名を変更します。
ただし、最後から2番目の文字も数字である場合、Designer は重複する列名にアンダースコア「_」と 2 で始まる数字を追加します。
元の列名 | 重複列 (Designer によって変更された名前) |
---|---|
A2 | A3 |
A5 | A6 |
A22 | A22_2 |
重複した名前の末尾が英文字または特殊文字の場合
重複する列の最後の文字が英文字または特殊文字の場合、Designer は 2 で始まる数字を追加して、重複する列名を変更します。
元の列名 | 重複列 (Designer によって変更された名前) |
---|---|
age | age2 |
registered? | registered?2 |
注記
Visual Query Builderではマルチバイト文字を正しく表示できません。テーブルタブを代わりに使用してください。
データ出力ツールをデータ入力ツールに変換
データ出力ツール をデータ入力ツールに変換できます。
データ入力ツール に変換する データ出力ツール を右クリックします。
データ入力に変換 を選択します。
データ出力ツールがデータ入力ツールになります。