Skip to main content

サポートされているファイル形式

ここでは、 Alteryx Analytics Cloud (AAC) への入力および出力でサポートされているファイル形式および圧縮方式について説明します。

注記

Microsoft Excelなどのデスクトップアプリケーション専用の形式で作業を行うのに、対応するアプリケーションをデスクトップにインストールする必要はありません。

ファイル名

注記

インポート時に、 AAC はファイル名の拡張子に基づいてファイル形式を識別します。拡張子が指定されていない場合、 AAC では送信されたファイルが何らかのテキストファイルであるものとして扱います。AvroやParquetなどの非テキストファイル形式には、ファイル名の拡張子が必要です。

注記

ファイル名に特殊文字が含まれていると、インポート時やファイルベースのデータストアへの公開時に問題が発生することがあります。

ファイルパスの長さ制限

ファイルパスの最大文字数:

  • インポートされたデータセットのソースへのファイルパス: 1024

    ヒント

    この制限( storagelocations )は、ファイルとテーブルの両方に適用されます。

  • 出力ファイルへのファイルパス: 2048

    ヒント

    この制限( writesettings )は、ファイルベースの保存場所に保存されているファイルに適用されます。

インポートファイル名の禁止文字

以下の文字のリストは、製品のリストに記載されている領域で問題が発生している文字です。問題が発生した場合は、以下のリストが問題が発生した場所についてのガイダンスとなる場合があります。

ヒント

インポートファイル名には、これらの文字を使用しないでください。このリストは、使用可能な実行環境によっては完全ではない場合があります。

  • 一般:

    "/"
  • SEBブラウザ:

    "\"
  • Excelファイル名:

    "#","{","}"
  • Sparkベースの実行環境:

    "{", "*", "\"

ネイティブ入力ファイル形式

AAC では、次のファイル形式を直接読み取り、インポートできます。

  • CSV

  • JSON

    注記

    AACでは、JSONファイルをネイティブに読み込むことができますが、表形式に適切に構造化するため、追加の作業が必要になる場合があります。 AACの設定方法(v1またはv2)によっては、JSONファイルをアプリケーションで使用できるようにするため、変換が必要になる場合があります。

    注記

    AACでは、1行につき1つの有効なJSONオブジェクトでJSONファイルを送信する必要があります。一貫して不正な形式のJSONオブジェクトや、改行が重複するオブジェクトにより、インポートが失敗する場合があります。

    • ソースファイルサイズの推奨制限は1GBです。変換はTrifactaノード内で行われるため、推奨制限はTrifactaノードのメモリによって異なる場合があります。

    • 各JSONレコードのサイズは20MB未満である必要があります。

    • ファイル名の拡張子は .json または .JSON である必要があります。

    • 最良の結果を得るには、すべてのキーと値を引用符で囲み、文字列としてインポートする必要があります。

    • 引用符の値をエスケープすると、バックスラッシュ文字( \ )を使用して文字列内のリテラルとして処理できます。

    • 値を変換ページにインポートすると、 AACは各列のデータ型を再度推測します。

  • プレーンテキスト

  • LOG

  • TSV

  • Parquet

    注記

    Parquetファイルから取り込んだデータセットを使用する場合、リネージ情報と $sourcerownumber 参照はサポートされません。

  • Avro

    注記

    Avroファイルから取り込んだデータセットを使用する場合、系列情報と $sourcerownumber 参照はサポートされません。

  • Google スプレッドシート

    注記

    個々のユーザーはGoogle Driveへのアクセスを有効にする必要があります。Google Driveからは、Google Sheets以外のデータは読み込まれません。

変換後のファイル形式

次の種類のファイルは、ネイティブ形式で製品に読み込まれません。代わりに、これらのファイルをネイティブでサポートされているファイル形式に変換サービスを利用して変換し、ベースストレージレイヤーに保存してから、製品で使用できるよう取り込まれます。

注記

基礎となるファイル形式の変換が必要な圧縮ファイルは、製品で使用できません。

変換後のファイル形式

  • Excel (XLS/XLSX)

    注記

    XLSM形式など、その他のExcel関連の形式はサポートされていません。問題が発生した場合は、Microsoft Excelアプリケーションから、XLSまたはXLSXで [名前を付けて保存] をお試しください。

    ヒント

    1つのワークブックから複数のワークシートを一度にインポートできます。

  • Google スプレッドシート

    ヒント

    1つのGoogle Sheet から複数のシートを一度にインポートできます。

  • PDF

  • JSON

ネイティブ出力ファイル形式

Designer Cloud では、次のファイル形式に書き込むことができます。

注記

一部の出力形式は、管理者が有効にする必要があります。

  • CSV

  • JSON

  • Hyper

    注記

    Hyper形式で結果を公開するには、追加の設定が必要になる場合があります。下記を参照してください。

  • Avro

    注記

    Trifacta Photon およびSparkの実行環境では、Snappy圧縮がこの形式に適用されます。

  • Parquet

    注記

    Trifacta Photon およびSparkの実行環境では、Snappy圧縮がこの形式に適用されます。

圧縮アルゴリズム

ファイルがインポートされると、 AAC ではファイル名の拡張子に基づいて、使用している圧縮アルゴリズムが推測されます。たとえば、 .gz ファイルはGZIPで圧縮されていると想定されます。

注記

変換サービスによる変換が必要な圧縮ファイルのインポートはサポートされていません。

ネイティブファイル形式の読み取り

GZIP

BZIP

Snappy

メモ

CSV

サポートされている

サポートされている

サポートされている

JSON v2

サポートされていません

サポートされていません

サポートされていません

変換後のファイル形式です。上記を参照してください。

JSON v1

サポートされている

サポートされている

サポートされている

変換後のファイル形式ではありません。上記を参照してください。

Avro

サポートされている

ネイティブファイル形式の書き込み

GZIP

BZIP

Snappy

CSV

サポートされている

サポートされている

サポートされている

JSON

サポートされている

サポートされている

サポートされている

Avro

サポートされている、常時オン

Snappy圧縮形式

Designer Cloud では、次のSnappy圧縮形式がサポートされています。

ファイル拡張子

形式名

メモ

.sz

Framing2形式

https://github.com/google/snappy/blob/master/framing_format.txt を参照してください。

.snappy

Hadoop-snappy形式

https://code.google.com/p/hadoop-snappy/ を参照してください。

注記

Xerialのsnappy-java形式(既定で .snappy のファイル拡張子でも表記される)は、サポートされていません。

アプリケーションごとにサポートされるファイル形式

個々のアプリケーションでは、このページでリストされているファイル形式と圧縮アルゴリズムのサブセットがサポートされている場合があります。

アプリケーション

説明

Designer Experience

Designer Experience で使用する、多数のフラットファイル形式をインポートできます。「 Designer Cloudファイル形式オプション 」を参照してください。

Trifacta Classic

すべてのプラットフォームファイル形式と圧縮アルゴリズムがサポートされています。

Reporting

Reporting ではワークフローのデータが入力として使用されます。「 Designer Experience」を参照してください。

レポートはXLSXおよびPDF形式でエクスポートできます。「 レポーティングのユーザーインターフェース 」を参照してください。

Machine Learning

モデルトレーニングまたは予測のためにアップロードされたデータはCSVファイルである必要があります。詳細については、「 問題の設定 」および「 エクスポートと予測 」を参照してください。