
データ入力ツール
ツールごとに学習
データ入力ツールには、「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、Alteryx Designer でこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。
データ入力ツールを使用して、データをファイルまたはデータベースに接続してワークフローに追加します。
ワイルドカードを使用して Hadoop 分散ファイルシステムで複数の .csv ファイルを読み取ると、エラーが発生します。
ツールの設定
データ入力ツールの設定ウィンドウには、ファイルまたはデータベースを接続する と オプション の 2 つのセクションがあります。
ファイルまたはデータベースを接続
以下の手順では、データ接続マネージャー (DCM) を無効にした場合のプロセスについて説明します。有効にすると、[ファイルまたはデータベースを接続] ドロップダウンが [接続を設定します] ボタンに置き換えられ、ここから [データ接続] ウィンドウが開き、DCM でサポートされているデータソースのみが表示されます。テクノロジを選択すると DCM が開きます。
キャンバス上のデータ入力ツールを使用して、次の手順に従います。
- 設定ウィンドウで、ファイルまたはデータベースを接続 ドロップダウンを選択します。
- Designer は データ接続 ウィンドウを表示します。[最近]、[保存済み]、[ファイル]、[データソース]、[Server] のいずれかを使用してデータ接続を設定します。
[最近の接続] セクションには、最近設定されたファイルとデータ接続が含まれています。最近の接続を選択するか、リストの消去を選択して最近の接続を削除できます。
保存済み 接続を選択します。接続の名前を変更および編集するには、保存された接続の管理 を使用します。
ローカルディレクトリまたはネットワークディレクトリ内のファイルに接続するには、次の 4 つのオプションがあります。
- ファイル接続で、ファイルを選択してファイルを参照します。
- ファイルを ファイル接続 にドラッグします。
- サポートされているすべてのファイルタイプ で、その種類のファイルを参照するファイルタイプ拡張子を選択します。
- データ接続 を閉じ、ファイルをキャンバスに直接ドラッグします。
データソース
データソース には、サポートされているデータソースと頻繁に使用されるデータソースが表示されます。
- ツール: インストールしていないツールに対して クイック接続 を選択すると、そのツールをダウンロードしてインストールするためのブラウザーが Alteryx コミュニティに表示されます。ページの指示をよく読んでください。ツールをインストールすると、キャンバス上のデータ入力ツールがデータソースタブで選択したツールに変わります。
- データソース:
- ODBC は、その特定のドライバーを使用するシステム上の DSN のフィルター処理された一覧を表示する ODBC 接続ウィンドウを起動します。
- OleDB は、 ネイティブ Windows OleDB マネージャーを起動します。
- OCI は、ネイティブ Oracle OCI 接続マネージャーを起動します。ここから、この接続に使用する tnsnames.ora ファイルに定義されているネットサービス名、ユーザー名、パスワードの資格情報を選択します。
- バルクは、選択した接続タイプのバルク接続を設定できるようにする特別なダイアログを開きます。
- クイック接続: SQL または Oracle クイック接続の場合、既存の保存済み接続を使用するか、または新規の保存済み接続を作成できます。詳細については、以下のページを参照してください。
- 他のすべてのクイック接続は、別のツールを使用します。
Server
Server には、ローカルコンピュータに追加されている各 Server UI とその URL が表示されます。各サーバー名の下のリストには、利用可能なサーバーに存在する保存済みの接続が含まれています。
[+ Server] を選択して、別の Server を追加します。
ファイル参照ウィンドウで、ファイルパスの一部としてワイルドカードを入力します。
次のようなデータファイルが複数ある場合を考慮してください。
- フィールドの数が同じで、各フィールドのデータ型が同じ
- 同じディレクトリ内の類似名
注
すべてのファイルのフィールド数が同じで、各フィールドのデータ型が同じであれば、単一のデータ入力ツールで *.csv や 2019*.csv などのワイルドカード形式を使用して、複数のファイルを読み取ることができます。Designer では、最初に読み取ったファイルに基づいて、フィールド数とファイルタイプを設定します。一致しないファイルはスキップされ、警告が表示されます。*.csv などのワイルドカード構文を使用する場合、どのファイルを最初に読み込むかは指定することはできません。どのファイルを 1 番目として指定するかは、システムにに委ねられています。
複数のファイルに共通するファイル名を入力し、後続のすべての文字の代わりであれば 「* (アスタリスク)」 を、1 文字の代わりであれば 「?」を追加します。ファイル名を指定するときに、すべてのファイルに共通のファイル拡張子を含めます。
例 1
このパスは、data\datafiles ディレクトリ内のファイル名が ABCD
で始まるすべての .csv ファイルを取り込みます。
data\datafiles\ABCD*.csv
ABCD_4.csv
および ABCD_012.csv
が取り込まれます。
例 2
このパスは、data\datafiles ディレクトリ内の ABCD_
で始まり 1 文字の追加があるすべての .csv ファイルを取り込みます。
data\datafiles\ABCD_?.csv
[Excel 入力を選択] で、Excel 入力のいずれかを選択します。
- Excel ファイルで使用可能なシートから選択する シートを選択 します。
- 範囲 (セル、行、列) を選択: 必要に応じて、シート内のセル、行、列の範囲を選択します。
- Excel ファイルで使用可能な名前付き範囲から選択する 名前付き範囲 を選択します。
- シート名のリストのみをインポート して、シート名を値として含む単一の列で出力を作成します。このオプションを選択すると、関連データは出力されません。
選択した Excel シートが開いている場合は、エラーメッセージが表示され、続行できません。シートを閉じ、Excel 入力を選択 ダイアログで 更新 ボタンを選択し、入力プロセスを終了します。
データ入力ツールは、定義されていない列をスキップします。定義された列とは、データを含んでいるか、ユーザーによってクリアされたデータを以前に含んでいた列です。定義されていない列を含めるには、[Excel入力を選択] ダイアログの [範囲 (セル、行、列) を選択] オプションで範囲を指定します。
詳細については、Gzip ファイルサポート と Zip ファイルサポート を参照してください。
.gz、.tgz、 .zip ファイルを選択すると、抽出するファイルタイプを選択 ウインドウが表示されます。ドロップダウンを使用して、使用するファイルタイプを選択します。
ファイルの選択: 抽出するファイルの横にあるチェックボックスをオンにします。
Alteryx でサポートされていないファイルを含め、Gzip ファイルまたは Zip ファイル内のすべてのファイルを表示するには、抽出するファイルタイプを選択 の下にある その他のファイル を選択します。その他のファイルを以下のファイルタイプとして解析する ファイルタイプ を選択します。
Alteryx は Gallery で Gzip と Zip ファイルをサポートしていません。
Alteryx カルガリー | .cydb |
Alteryx データベース | .yxdb |
Alteryx Spatial Zip | .sz |
Avro | .avro |
コンマ区切り値 (CSV) | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
Extensible Markup Language | .xml |
Flat ASCII | .flat |
GIS | .grc、.grd |
Google Earth/Google Maps | .kml |
Gzip | .gz、.tgz |
IBM SPSS | .sav |
JSON | .json |
MapInfo Professional Interchange Format | .mif |
MapInfo Professional Table | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007、2010、2013、2016 | .accdb |
Microsoft Excel バイナリ | .xlsb |
Microsoft Excel 1997-2003 | .xls |
Microsoft Excel | .xlsx |
Microsoft Excel Macro-Enabled | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
テキスト | .txt、.asc |
Zip | .zip |
不明なファイルタイプには、Alteryx がネイティブで読み取れないその他のファイルタイプを含みます。データ入力ツール を使用して不明なファイルタイプを読み取ると、[ファイルタイプを解決] ウィンドウには、次のオプションが表示されます。
- 対応しているファイルタイプとして読み込む: ファイルの構造が類似しているファイルタイプを選択します。
- 固定幅のテキストファイルとして読み込む: このオプションを選択すると、スライド式ルーラーを使用して列を割り当てることができます。このオプションの詳細については、フラットファイルレイアウト を参照してください。
- 区切りテキストファイルとして読み込む: データの列区切りを示す単一の区切り記号がある場合は、このオプションを選択します。適切な区切り記号の種類を選択し、必要に応じて、データの先頭行にフィールド名を含めるどうか選択します。
オプション
ファイル形式オプションを選択します。オプションは、接続先のファイルまたはデータベースによって異なります。詳細については、ファイル形式オプション を参照してください。
データレイアウトのプレビュー
プレビュー ウインドウでデータレイアウトをプレビューします。データレイアウトのプレビューは、ワイドファイルでは 100 レコード以下に制限されています。データに 1500 列が含まれている場合、少なくとも 1 レコード、最大 2 行が表示されます。すべてのデータを表示するには、閲覧ツール を使用します。
重複した列名
入力ファイルに同じ名前の列が複数含まれている場合、Designer は次のルールに従って重複した列の名前を自動的に変更します。
重複する名前の末尾が 1 または 9 の場合
重複する列名の最後の文字が 1 または 9 の場合、Designer は重複する列名にアンダースコア「_」と 2 で始まる数字を追加します。
元の列名 | 重複列 (Designer によって変更された名前) |
---|---|
A1 | A1_2 |
A9 | A9_2 |
重複する名前の末尾が 2~8 (両端含む) の数字の場合
重複する列名の最後の文字が 2 と 8 の間 (両端を含む) の数字の場合、Designer はその数字をインクリメントして重複する列名を変更します。
ただし、最後から 2 番目の文字も数字である場合、Designer は重複する列名にアンダースコア「_」と 2 で始まる数字を追加します。
元の列名 | 重複列 (Designer によって変更された名前) |
---|---|
A2 | A3 |
A5 | A6 |
A22 | A22_2 |
重複した名前の末尾が英文字または特殊文字の場合
重複する列の最後の文字が英文字または特殊文字の場合、Designer は 2 で始まる数字を追加して、重複する列名を変更します。
元の列名 | 重複列 (Designer によって変更された名前) |
---|---|
age | age2 |
registered? | registered?2 |
Visual Query Builder ではマルチバイト文字を正しく表示できません。テーブルタブを代わりに使用してください。
クラシックモードの使用
クラシックモードを使用するには、以下の手順に従います。
- オプション > ユーザー設定 > ユーザー設定の編集 を選択します。
- 既定値タブで、入力/出力ツールメニューオプションに クラシックモードを使用する のチェック ボックスをオンにします。
- 保存 を選択します。
- キャンバスを選択するか、F5 キーボードショートカットを使用して更新します。
これでデータ入力ツールのクラシック モードを使用して、ファイルとデータソースを選択できるようになりました。
データ出力ツールをデータ入力ツールに変換
データ出力ツール をデータ入力ツールに変換できます。
- データ入力ツール に変換する データ出力ツール を右クリックします。
- データ入力に変換 を選択します。
データ出力ツールがデータ入力ツールになります。