データ入力ツール
データ入力ツールを使用して、ファイルまたはデータベースに接続することによって、ワークフローにデータを取り込みます。
- ツールパレット内で、データ入力ツールをクリックし、ワークフローのキャンバスエリアにドラッグします。
- 設定ウィンドウで、[ファイルまたはデータベースを接続] ドロップダウン矢印をクリックします。
Alteryxは、[データ接続]ウィンドウを表示します。 最近、保存済み、ファイル、データソース、Gallery のいずれかを使用してデータ接続を設定します。
[最近の接続] を選択します。 [最近の接続] には、最近設定したファイルとデータ接続が含まれます。
[リストの消去] をクリックして最近の接続を削除します。
ローカルまたはネットワークディレクトリ内のファイルに接続するには、次のいずれかの操作を行います。
- ファイル接続で、[ファイルの選択]をクリックしてファイルを参照します。
- ファイルをファイル接続上にドラッグアンドドロップします。
- サポートされている全てのファイルの種類で、ファイルタイプ拡張子をクリックし、その種類のファイルを参照する、もしくは
- データ接続を閉じて、ファイルをキャンバス上に直接ドラッグします。
ファイル参照ウィンドウで、ファイルパスの一部としてワイルドカードを入力します。
両方にデータファイルが複数ある場合を考えてください:
- すべてのファイルに同じ数のフィールドが含まれていて、各フィールドのデータ型が同じであれば、単一の入力ツールで *.csv や 2019*.csv などのワイルドカード形式を使用して、複数のファイルを読み取ることができます。 Designer では、最初に読み取られたファイルに基づいて、フィールドの数とファイルの種類が設定されます。 一致しない後続のファイルはスキップされ、警告が表示されます。 *.csv のようなワイルドカード構文を使用する場合、どのファイルが最初に読み取られるかを制御することはできません。どのファイルが最初に指定されるかはシステム次第です。
- 同じディレクトリ内の類似した名前
共通のファイル名を入力し、「*」を追加して、後続のすべての文字を置き換えるか、「?」を 1 文字に置き換えます。 ファイル名を指定するときは、すべてのファイルに共通のファイル拡張子を含めることを忘れないでください。
このパスは、data\datafiles ディレクトリ内に含まれるすべての .csv ファイルを、ABCD で始まるファイル名で表示します。
data\datafiles\ABCD*.csv
これは ABCD_4.csv と ABCD_012.csv になります。
このパスは data\datafiles ディレクトリ内に含まれるすべての .csv ファイルを、 ABCD_ + 1 文字で始まるファイル名で表示します。
data\datafiles\ABCD_?.csv
Excel 入力の選択 で、Excel 入力のいずれかを選択:
- [シートを選択] を選択して Excel ファイルで使用可能なシートを選択します。
- [名前付き範囲を選択] を選択して、Excel ファイルで使用可能な名前付き範囲を選択します。
- [シート名のリストのみをインポート] は、シート名を値として含む単一の列で出力を作成するのに使用します。
このオプションを選択すると、関連データは出力されません。
既知の問題
アクセスドライバーは 「!!!」 を「###」、「,,,」、 「...」は 「___」 として読み取ります。 これは Designer に持ち込まれた Excel ファイル内のシート名と名前付き範囲に影響を与える可能性があります
参照: Gzip ファイルサポート と Zipファイルサポート より詳しい情報を参照してください。
gz、tgz、.zip ファイルを選択すると、[抽出するファイルの種類を選択] ウィンドウが表示されます。 ドロップダウンを使用して、使用するファイルの種類を選択します。
ファイルの選択: 抽出するファイルの横にあるチェックボックスをクリックします。
Alteryx でサポートされていないファイルを含む、Gzip または Zip ファイル内のすべてのファイルを表示するには、[抽出するファイルの種類を選択] の下にある [その他のファイル] を選択します。 [その他のファイルを以下として解析する] からファイルの種類を選択します。
重要
Gzip および Zip ファイルは Alteryx Gallery ではサポートされていません。
Alteryx Calgary | .cydb |
Alteryx Database | .yxdb |
Alteryx Spatial Zip | .sz |
Avro | .avro |
Comma Separated Values | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
Extensible Markup Language (XML) | .xml |
Flat ASCII | .flat |
GIS | .grc、.grd |
Google Earth/Google Maps | .kml |
Gzip | .gz、.tgz |
IBM SPSS | .sav |
JSON | .json |
MapInfo Professional Interchange Format | .mif |
MapInfo Professional Table | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007、2010、2013、2016 | .accdb |
Microsoft Excel Binary | .xlsb |
Microsoft Excel 1997-2003 | .xls |
Microsoft Excel | .xlsx |
Microsoft Excel Macro-Enabled | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
SRC Geography | .geo |
Text | .txt、.asc |
Zip | .zip |
データソースには、サポートされ頻繁に使用されるデータソースが表示されます。
- ツール: インストールしていないツールのクイック接続を選択した場合、そのツールをダウンロードし、インストールするためのブラウザーが Alteryx Gallery に表示されます。 ページの指示をよく読んでください。 ツールがインストールされると、データ入力ツールはキャンバス上で [データソース] タブから選択したツールに変わります。
- データソース
- ODBC は、特定のドライバーを使用して、システム上の Dsn のフィルターされたリストを表示する ODBC 接続ウィンドウを起動します。
- OleDB は、ネイティブの Windows OleDB マネージャーを起動します。
- OCI は、ネイティブ Oracle OCI 接続マネージャーを起動します。 ここから、この接続に使用する tnsnames.ora ファイル、ユーザー名とパスワードの資格情報で定義されているネットサービス名を選択します。
- バルクは、選択した接続タイプのバルク接続を設定できるようにする特別なダイアログを開きます。
- クイック接続: SQL または Oracle クイック接続の場合、既存の保存済みの接続を使用するか、保存されている新しい接続を作成することができます。 詳細については、以下を参照してください:
- 他のすべてのクイック接続は、別のツールを使用した接続です。
HDFS の下にある [クイック接続] をクリックして、新しいHadoop データベース接続を作成します。
Alteryx は Hadoop 分散ファイルシステム に接続し、.csvファイルと .avro ファイルを読み取ります。 HDFS 標準を実装するすべての Hadoop distributions がサポートされています。
HDFSは、httpfs(ポート14000)、webhdfs(ポート50070)、Knox Gateway(8443)を使用して読み込むことができます。 どれを使用するかは Hadoop 管理者に相談してください。 Hadoop High Availability(HA)クラスタールを使用している場合、Hadoop 管理者は httpfs を明示的にに有効にする必要があります。
MapR は webhdfs をサポートしていない場合があります。
HDFS 接続ウィンドウ:
- サーバー構成を選択してください: HTTPFS、WebHDFS、Knox Gateway から選びます。
- [ホスト]: Hadoop サーバーのインストール済みインスタンスを指定します。 エントリーは URL または IP アドレスでなければなりません。
- [ポート]: httpfs (14000)、webhdfs (50070)、Knox Gateway (8443) の既定のポート番号を表示する、または特定のポート番号を入力します。
- [URL]: ホストに基づく URL の既定値です。 URL は修正できます。
- [ユーザー名]: クラスターのセットアップに応じて、アクセスするユーザー名とパスワードを指定します。
- httpfs: ユーザー名が必要ですが、どんなものでも構いません。
- webhdfs: ユーザー名は必要ありません。
- Knox Gateway: ユーザー名とパスワードが必要です。
- Kerberos: HDFS への読み書きのための kerberos 認証オプションを選択します。 選択するオプションは、IT 管理者が HDFS サーバーをどのように構成したかによって異なります。
- [None]: 認証が使用されていません。
- [Kerberos MIT]: Alteryx はデフォルトの MIT チケットを使用してサーバーの認証を行います。 まず、MIT Kerberos Ticket Manager を使用して有効なチケットを取得する必要があります。
- [Kerberos SSPI]: Alteryxは Windows 資格認証で Windows にログインしたときに取得する Windows kerberos キーを認証に使用します。 従って、ユーザー名とパスワードのフィールドは使用できません。
- (推奨) 接続をテストするには、[テスト] をクリックします。
- [OK] をクリックします。
- ファイルパス (例:
path/to/file.csv
) を指定するか、ファイルを参照して選択します。 - Avro または CSVファイル形式を選択し、[OK] をクリックします。
自己署名証明書は Alteryx ではサポートされていません。 Knox 認証を構成するときは、信頼できる証明書を使用してください。
インデータベース処理のために HDFS に接続するには、 接続 In-DB ツールを使用してください。
データベースへの一般接続または 32 ビット接続が可能です。
データベースに接続する前に、次の点を考慮してください:
- ODBC 接続タイプと OleDB 接続タイプの両方が空間接続をサポートしています。 Alteryx は、データベースが空間機能をサポートしているかどうかを自動的に検出し、必要な設定を表示します。
- インデータベース処理のためにデータベースに接続するには、以下を参照してください。 インデータベースの概要。
オプションを指定し、保存または共有されているデータ接続をクリックして接続するか、管理をクリックして接続を表示および編集します。
すべての接続: コンピュータに保存されている接続と、Gallery から共有している接続の一覧が表示されます。
マイコンピュータ: コンピュータに保存されている接続の一覧が表示されます。
Gallery: Gallery から共有されている接続の一覧が表示されます。
[Gallery を追加]: Gallery のログイン画面を開きます。 ユーザー名とパスワードを使用してログインします。 ログイン後、保存されたデータ接続に戻り、一覧で Gallery を指定して、Gallery から共有されている接続を表示します。
「保存および共有データ接続の管理」、「トラブルシューティング」の詳細については、「データ接続の管理」を参照してください。
Adobe | Adobe Analytics |
Amazon | Amazon Athena |
Amazon Aurora | |
Amazon Redshift | |
Amazon S3 | |
Apache | Cassandra |
Hadoop Distributed File System (HDFS) | |
Hive | |
Spark | |
Cloudera | Impala |
Hadoop Distributed File System (HDFS) | |
Hive | |
Databricks | Databricks |
ESRI | ESRI GeoDatabase |
Exasolution | EXASOL |
Google Analytics | |
Google BigQuery | |
Google Sheets | |
Hortonworks | Hadoop Distributed File System (HDFS) |
Hive | |
IBM | IBM DB2 |
IBM Netezza | |
Marketo | Marketo |
MapR | Hadoop Distributed File System (HDFS) |
Hive | |
Microsoft | Microsoft Analytics Platform System |
Microsoft Azure Data Lake Store | |
Microsoft Azure SQL Data Warehouse | |
Microsoft Azure SQL Database | |
Microsoft Cognitive Services | |
Microsoft Dynamics CRM | |
Microsoft OneDrive | |
Microsoft SharePoint | |
Microsoft SQL Server | |
MongoDB | MongoDB |
MySQL | MySQL |
NetSuite | NetSuite |
Oracle | Oracle |
Pivotal | Pivotal Greenplum |
PostgreSQL | PostgreSQL |
Salesforce | Salesforce |
SAP | SAP Hana |
Snowflake |
|
Teradata | Teradata |
Teradata Aster | |
Vertica | Vertica |
Gallery には、ローカルコンピュータに追加されている各Gallery とその URL が表示されます。 各 Gallery 名の下の一覧には、アクセス可能なサーバーに保存されている保存済みの接続が含まれています。
[+ Gallery] をクリックして、別の Gallery を追加します。
ファイル形式オプションを選択します。 オプションは、接続先のファイルまたはデータベースによって異なります。 ファイル形式オプションを参照してください。
プレビューウィンドウでデータレイアウトをプレビューします。 データレイアウトのプレビューは、ワイドファイルでは 100 レコード以下に制限されています。 データに 1500 列が含まれている場合、少なくとも 1 レコードと最大 2 行が表示されます。 すべてのデータを表示するには、 閲覧ツールを使用してください。
クラシックモードを使用するには:
- [オプション] > [ユーザー設定] > [ユーザー設定の編集] をクリックします。
- [既定] タブで、[入力/出力ツールメニューオプションにクラシックモードを使用] のチェックボックスをオンにします。
- [OK] をクリックします。
- キャンバスをクリックするか、F5キーを押して更新します。
これで、 データ入力ツールのクラシックモードを使用して、ファイルとデータソースを選択できるようになりました。