データ入力ツール

データ入力ツールを使用して、ファイルまたはデータベースに接続することによって、ワークフローにデータを取り込みます。

ツールパレット内で、データ入力ツールをクリックし、ワークフローのキャンバスエリアにドラッグします。
設定ウィンドウで、[ファイルまたはデータベースを接続] ドロップダウン矢印をクリックします。

Alteryxは、[データ接続]ウィンドウを表示します。最近、保存済み、ファイル、データソース、Gallery のいずれかを使用してデータ接続を設定します。

最近

[最近の接続] を選択します。 [最近の接続] には、最近設定したファイルとデータ接続が含まれます。

[リストの消去] をクリックして最近の接続を削除します。

保存済み

[保存済み接続] を選択します。接続の名前変更と編集を行うには、データ接続の管理に進んでください。

ファイル

ローカルまたはネットワークディレクトリ内のファイルに接続するには、次のいずれかの操作を行います。

ファイル接続で、[ファイルの選択]をクリックしてファイルを参照します。
ファイルをファイル接続上にドラッグアンドドロップします。
サポートされている全てのファイルの種類で、ファイルタイプ拡張子をクリックし、その種類のファイルを参照する、もしくは
データ接続を閉じて、ファイルをキャンバス上に直接ドラッグします。

複数のファイルを選択

ファイル参照ウィンドウで、ファイルパスの一部としてワイルドカードを入力します。

両方にデータファイルが複数ある場合を考えてください:

すべてのファイルに同じ数のフィールドが含まれていて、各フィールドのデータ型が同じであれば、単一の入力ツールで *.csv や 2019*.csv などのワイルドカード形式を使用して、複数のファイルを読み取ることができます。 Designer では、最初に読み取られたファイルに基づいて、フィールドの数とファイルの種類が設定されます。一致しない後続のファイルはスキップされ、警告が表示されます。 *.csv のようなワイルドカード構文を使用する場合、どのファイルが最初に読み取られるかを制御することはできません。どのファイルが最初に指定されるかはシステム次第です。
同じディレクトリ内の類似した名前

共通のファイル名を入力し、「*」を追加して、後続のすべての文字を置き換えるか、「?」を 1 文字に置き換えます。ファイル名を指定するときは、すべてのファイルに共通のファイル拡張子を含めることを忘れないでください。

このパスは、data\datafiles ディレクトリ内に含まれるすべての .csv ファイルを、ABCD で始まるファイル名で表示します。

data\datafiles\ABCD*.csv

これは ABCD_4.csv と ABCD_012.csv になります。

このパスは data\datafiles ディレクトリ内に含まれるすべての .csv ファイルを、 ABCD_ + 1 文字で始まるファイル名で表示します。

data\datafiles\ABCD_?.csv

Excel

Excel 入力の選択で、Excel 入力のいずれかを選択:

[シートを選択] を選択して Excel ファイルで使用可能なシートを選択します。
[名前付き範囲を選択] を選択して、Excel ファイルで使用可能な名前付き範囲を選択します。
[シート名のリストのみをインポート] は、シート名を値として含む単一の列で出力を作成するのに使用します。
このオプションを選択すると、関連データは出力されません。

既知の問題

アクセスドライバーは　「!!!」　を「###」、「,,,」、「...」は「___」として読み取ります。これは Designer に持ち込まれた Excel ファイル内のシート名と名前付き範囲に影響を与える可能性があります

Gzip と Zip ファイル

参照： Gzip ファイルサポートと Zipファイルサポートより詳しい情報を参照してください。

gz、tgz、.zip ファイルを選択すると、[抽出するファイルの種類を選択] ウィンドウが表示されます。ドロップダウンを使用して、使用するファイルの種類を選択します。

ファイルの選択: 抽出するファイルの横にあるチェックボックスをクリックします。

Alteryx でサポートされていないファイルを含む、Gzip または Zip ファイル内のすべてのファイルを表示するには、[抽出するファイルの種類を選択] の下にある [その他のファイル] を選択します。 [その他のファイルを以下として解析する] からファイルの種類を選択します。

重要

Gzip および Zip ファイルは Alteryx Gallery ではサポートされていません。

サポートされているファイルの種類

Alteryx Calgary	.cydb
Alteryx Database	.yxdb
Alteryx Spatial Zip	.sz
Avro	.avro
Comma Separated Values	.csv
dBase	.dbf
ESRI Personal GeoDatabase	.mdb
ESRI Shapefile	.shp
Extensible Markup Language (XML)	.xml
Flat ASCII	.flat
GIS	.grc、.grd
Google Earth/Google Maps	.kml
Gzip	.gz、.tgz
IBM SPSS	.sav
JSON	.json
MapInfo Professional Interchange Format	.mif
MapInfo Professional Table	.tab
Microsoft Access 2000-2003	.mdb
Microsoft Access 2007、2010、2013、2016	.accdb
Microsoft Excel Binary	.xlsb
Microsoft Excel 1997-2003	.xls
Microsoft Excel	.xlsx
Microsoft Excel Macro-Enabled	.xlsm
QlikView	.qvx
SAS	.sas7bdat
SQLite	.sqlite
SRC Geography	.geo
Text	.txt、.asc
Zip	.zip

データソース

データソースには、サポートされ頻繁に使用されるデータソースが表示されます。

ツール: インストールしていないツールのクイック接続を選択した場合、そのツールをダウンロードし、インストールするためのブラウザーが Alteryx Gallery に表示されます。ページの指示をよく読んでください。ツールがインストールされると、データ入力ツールはキャンバス上で [データソース] タブから選択したツールに変わります。
データソース
- ODBC は、特定のドライバーを使用して、システム上の Dsn のフィルターされたリストを表示する ODBC 接続ウィンドウを起動します。
- OleDB は、ネイティブの Windows OleDB マネージャーを起動します。
- OCI は、ネイティブ Oracle OCI 接続マネージャーを起動します。ここから、この接続に使用する tnsnames.ora ファイル、ユーザー名とパスワードの資格情報で定義されているネットサービス名を選択します。
- バルクは、選択した接続タイプのバルク接続を設定できるようにする特別なダイアログを開きます。
- クイック接続: SQL または Oracle クイック接続の場合、既存の保存済みの接続を使用するか、保存されている新しい接続を作成することができます。詳細については、以下を参照してください:
  - SQL
  - Oracle
- 他のすべてのクイック接続は、別のツールを使用した接続です。

Hadoop

HDFS の下にある [クイック接続] をクリックして、新しいHadoop データベース接続を作成します。

Alteryx は Hadoop 分散ファイルシステムに接続し、.csvファイルと .avro ファイルを読み取ります。 HDFS 標準を実装するすべての Hadoop distributions がサポートされています。

HDFS 接続を設定する

HDFSは、httpfs（ポート14000）、webhdfs（ポート50070）、Knox Gateway（8443）を使用して読み込むことができます。どれを使用するかは Hadoop 管理者に相談してください。 Hadoop High Availability（HA）クラスタールを使用している場合、Hadoop 管理者は httpfs を明示的にに有効にする必要があります。

MapR は webhdfs をサポートしていない場合があります。

HDFS 接続ウィンドウ：

サーバー構成を選択してください: HTTPFS、WebHDFS、Knox Gateway から選びます。
[ホスト]: Hadoop サーバーのインストール済みインスタンスを指定します。エントリーは URL または IP アドレスでなければなりません。
[ポート]: httpfs (14000)、webhdfs (50070)、Knox Gateway (8443) の既定のポート番号を表示する、または特定のポート番号を入力します。
[URL]: ホストに基づく URL の既定値です。 URL は修正できます。
[ユーザー名]: クラスターのセットアップに応じて、アクセスするユーザー名とパスワードを指定します。

httpfs: ユーザー名が必要ですが、どんなものでも構いません。
webhdfs: ユーザー名は必要ありません。
Knox Gateway: ユーザー名とパスワードが必要です。

自己署名証明書は Alteryx ではサポートされていません。 Knox 認証を構成するときは、信頼できる証明書を使用してください。

Kerberos: HDFS への読み書きのための kerberos 認証オプションを選択します。選択するオプションは、IT 管理者が HDFS サーバーをどのように構成したかによって異なります。
- [None]: 認証が使用されていません。
- [Kerberos MIT]: Alteryx はデフォルトの MIT チケットを使用してサーバーの認証を行います。まず、MIT Kerberos Ticket Manager を使用して有効なチケットを取得する必要があります。
- [Kerberos SSPI]: AlteryxはＷindows 資格認証で Windows にログインしたときに取得するＷindows kerberos キーを認証に使用します。従って、ユーザー名とパスワードのフィールドは使用できません。
(推奨) 接続をテストするには、[テスト] をクリックします。
[OK] をクリックします。
ファイルパス (例: path/to/file.csv) を指定するか、ファイルを参照して選択します。
Avro または CSVファイル形式を選択し、[OK] をクリックします。

インデータベース処理のために HDFS に接続するには、接続 In-DB ツールを使用してください。

その他のデータベース

データベースへの一般接続または 32 ビット接続が可能です。

データベースに接続する前に、次の点を考慮してください：

ODBC 接続タイプと OleDB 接続タイプの両方が空間接続をサポートしています。 Alteryx は、データベースが空間機能をサポートしているかどうかを自動的に検出し、必要な設定を表示します。
インデータベース処理のためにデータベースに接続するには、以下を参照してください。インデータベースの概要。

保存済みデータ接続

オプションを指定し、保存または共有されているデータ接続をクリックして接続するか、管理をクリックして接続を表示および編集します。

すべての接続: コンピュータに保存されている接続と、Gallery から共有している接続の一覧が表示されます。

マイコンピュータ: コンピュータに保存されている接続の一覧が表示されます。

Gallery: Gallery から共有されている接続の一覧が表示されます。

[Gallery を追加]: Gallery のログイン画面を開きます。ユーザー名とパスワードを使用してログインします。ログイン後、保存されたデータ接続に戻り、一覧で Gallery を指定して、Gallery から共有されている接続を表示します。

「保存および共有データ接続の管理」、「トラブルシューティング」の詳細については、「データ接続の管理」を参照してください。

サポートされているデータソース

Adobe	Adobe Analytics
Amazon	Amazon Athena
	Amazon Aurora
	Amazon Redshift
	Amazon S3
Apache	Cassandra
	Hadoop Distributed File System (HDFS)
	Hive
	Spark
Cloudera	Impala
	Hadoop Distributed File System (HDFS)
	Hive
Databricks	Databricks
ESRI	ESRI GeoDatabase
Exasolution	EXASOL
Google	Google Analytics
	Google BigQuery
	Google Sheets
Hortonworks	Hadoop Distributed File System (HDFS)
	Hive
IBM	IBM DB2
	IBM Netezza
Marketo	Marketo
MapR	Hadoop Distributed File System (HDFS)
	Hive
Microsoft	Microsoft Analytics Platform System
	Microsoft Azure Data Lake Store
	Microsoft Azure SQL Data Warehouse
	Microsoft Azure SQL Database
	Microsoft Cognitive Services
	Microsoft Dynamics CRM
	Microsoft OneDrive
	Microsoft SharePoint
	Microsoft SQL Server
MongoDB	MongoDB
MySQL	MySQL
NetSuite	NetSuite
Oracle	Oracle
Pivotal	Pivotal Greenplum
PostgreSQL	PostgreSQL
Salesforce	Salesforce
SAP	SAP Hana
Snowflake	Snowflake
Teradata	Teradata
	Teradata Aster
Vertica	Vertica

Gallery

Gallery には、ローカルコンピュータに追加されている各Gallery とその URL が表示されます。各 Gallery 名の下の一覧には、アクセス可能なサーバーに保存されている保存済みの接続が含まれています。

[+ Gallery] をクリックして、別の Gallery を追加します。

入力オプション

ファイル形式オプションを選択します。オプションは、接続先のファイルまたはデータベースによって異なります。ファイル形式オプションを参照してください。

データレイアウトをプレビューします

プレビューウィンドウでデータレイアウトをプレビューします。データレイアウトのプレビューは、ワイドファイルでは 100 レコード以下に制限されています。データに 1500 列が含まれている場合、少なくとも 1 レコードと最大 2 行が表示されます。すべてのデータを表示するには、閲覧ツールを使用してください。

クラシックモードを使用する

クラシックモードを使用するには:

[オプション] > [ユーザー設定] > [ユーザー設定の編集]　をクリックします。
[既定] タブで、[入力/出力ツールメニューオプションにクラシックモードを使用] のチェックボックスをオンにします。
[OK] をクリックします。
キャンバスをクリックするか、F5キーを押して更新します。

これで、データ入力ツールのクラシックモードを使用して、ファイルとデータソースを選択できるようになりました。