データのインポートページ
注記
ファイルベースのソースの場合、Alteryx One Platformでは、インポートファイルのデータの各行は、一貫した改行文字(ファイルの最後の改行文字を含む)で終了することが想定されます。
単一のファイルでこの最後の改行文字がない場合、最後のレコードは削除される可能性があります。
複数ファイルのインポートでファイルの最後のレコードに改行がない場合、この最後のレコードは次のファイルの最初のレコードと結合し、その後Trifacta Photon実行環境で削除される場合があります。
一般的な制限事項
注記
インポートされたデータセットには、列のデータ型(非リレーショナルソースの場合)を正しく推測するために約15行が必要であり、また、列ヘッダーに使用するための行(ある場合)が必要になります。
ファイルとパスの制限事項:
コロン文字(
:)は、ファイル名またはファイルパスには使用できません。ファイル名の先頭にドット(
.)やアンダースコア(_)などの特殊文字を使用することはできません。入力ファイルまたはテーブルパスの長さは最大1024文字です。
基本タスク
1.ソースに接続する
インポート時に、 Alteryx One はファイル名の拡張子に基づいてファイル形式を識別します。
圧縮ファイルは認識されます。また、ファイル拡張子に基づいてインポートできます。
拡張子を持たないファイル名は、TXTファイルとして扱われます。
アップロード: Alteryx Oneは、ローカルファイルシステムからファイルを読み込むこともできます。
ヒント
デスクトップからファイルをドラッグアンドドロップしてアップロードできます。
注記
最大1 GBのサイズのファイルをアップロードできます。
注記
以前にアップロードしたファイルの更新バージョンをアップロードすると、新しいファイルは完全に別のアップロードとして保存されます。以前のバージョンに基づいてインポートされたデータセットが使用されている場合は、古いデータセットを新しいデータセットに入れ替える必要があります。
Trifacta: ワークスペースでAlteryx Data Storage (ADS)を有効にしている場合は、ADSにアップロードしたファイルにアクセスできます。これらのファイルは、インポートされたデータセットを作成するためのソースとすることができます。
注記
ADSが有効になっていない場合は有効にできます。詳細については、「 ストレージ環境の設定」を参照してください。
詳細はADSブラウザを確認してください。
S3: S3インスタンスに接続されている場合は、S3バケットを参照してソースファイルを選択できます。
ヒント
S3では、フォルダーを選択して、ディレクトリ内の各ファイルを個別のデータセットとして選択できます。
詳細は、External S3 Connections (外部S3接続)を参照してください。
Redshift: S3データウェアハウスに接続されている場合は、接続されているデータベースからソースをインポートできます。詳細は、Amazon Redshift Connections (Amazon Redshift接続)を参照してください。
データベース: リレーショナルデータストアに接続されている場合は、データベースからテーブルまたはビューを読み込むことができます。詳細は、Database Browser (データベースブラウザ)を参照してください。
注記
読み込みに長時間かかるリレーショナルソースの場合は、取り込みの各段階で進行状況を監視できます。これらのソースが取り込まれた後、その後のデータのインポートとラングリングのステップは、より高速になる場合があります。
詳細については、ジョブ監視の概要を参照してください。
サポートされている入力形式の詳細については、サポートされているファイル形式を参照してください。
新規/編集: クリックして接続を作成または編集します。既定では、表示されている接続はインポートをサポートしています。
検索: 検索語を入力して、特定の接続を検索します。
接続を作成ウィンドウを参照してください。
2.データセットの追加
ソースディレクトリまたはファイルが見つかったら、次の手順を実行します。
ファイル名の上にカーソルを合わせると、その内容をプレビューできます。
注記
Parquetなど、一部のソースではプレビューが使用できない場合があります。
ディレクトリまたはファイル名の横にあるプラスアイコンをクリックして、データセットとして追加します。
ヒント
複数のデータセットを同時にインポートできます。下記を参照してください。
Excelファイル: 親ワークブックの横にあるプラスアイコンをクリックして、すべてのワークシートを単一のデータセットとして追加するか、個々のシートを個別のデータセットとして追加できます。
カスタムSQLクエリが有効になっている場合は、[SQLを使用したデータセットの作成]を選択して、カスタマイズしたSQLステートメントを入力し、対象の行と列のみを含むようにデータベース内のテーブルを事前にフィルタリングします。
詳細については、「SQLによるデータセットの作成」を参照してください。
パラメーター化が有効になっている場合は、データセットのソースパスにパラメーターを適用して、より広範なソースを取得できます。[パラメーターを持つデータセットの作成]を選択します。パラメーターを使用したデータセットの作成を参照してください。非表示のファイルまたはフォルダーを表示するには、[非表示を表示する]を選択します。
注記
非表示のフォルダー名はドット(.)またはアンダースコア(_)で始まります。一般的に、これらのフォルダーは何らかの理由で非表示になっています。ファイル構造が予告なく変更される場合があります。
3.選択の設定
データセットを選択すると、画面の右側に次のフィールドが表示されます。必要に応じて変更してください。
データセット名: インターフェースに表示される名前です。
データセットの説明: データセットに関する詳細情報を提供する説明を任意で追加できます。この情報は、インターフェースの一部で表示されます。
ヒント
「目」のアイコンをクリックすると、データセットをインポートする前に内容を確認できます。
ヒント
インポートするデータセットは、1つまたは複数選択できます。
4.インポートする項目の選択
複数のファイルからパラメーターを含むデータセットをインポートすると、最初に一致するファイルのみが右側のパネルに表示されます。
パネルでは、各データセットのプレビューを確認し、必要に応じて変更を加えることができます。