Skip to main content

Formatos de arquivo compatíveis

Esta seção contém informações sobre os formatos e esquemas de compactação de arquivos com suporte para entrada e saída do Alteryx Analytics Cloud (AAC).

Nota

Para trabalhar com formatos que são proprietários de um aplicativo de desktop, como o Microsoft Excel, você não precisa do aplicativo de suporte instalado em seu desktop.

Nomes de arquivos

Nota

Durante a importação, o AAC identifica formatos de arquivo com base na extensão do nome do arquivo. Se nenhuma extensão for fornecida, o AAC presumirá que o arquivo enviado é um arquivo de texto de algum tipo. Formatos de arquivo que não são texto, como Avro e Parquet, requerem extensões de nome de arquivo.

Nota

Os nomes de arquivos que incluem caracteres especiais podem causar problemas durante a importação ou ao publicar em um armazenamento de dados baseado em arquivos.

Limites de comprimento do caminho do arquivo

Limites máximos de caracteres para caminhos de arquivo:

  • Caminhos de arquivo para fontes de conjuntos de dados importados: 1024

    Dica

    Esse limite ( storagelocations ) aplica-se a arquivos e tabelas.

  • Caminhos de arquivo para arquivos de saída: 2048

    Dica

    Esse limite ( writesettings ) aplica-se a arquivos armazenados em qualquer local de armazenamento baseado em arquivos.

Caracteres proibidos em nomes de arquivos de importação

A lista de caracteres a seguir apresenta problemas na área listada do produto. Se encontrar problemas, as listas a seguir podem fornecer orientações sobre onde o problema ocorreu.

Dica

Você deve evitar usar qualquer um desses caracteres em seus nomes de arquivo de importação. Esta lista pode não estar completa para todos os ambientes de execução disponíveis.

  • Geral:

    "/"
  • Navegador SEB:

    "\"
  • Nomes de arquivos do Excel:

    "#","{","}"
  • Ambiente de execução baseado no Spark:

    "{", "*", "\"

Formatos de arquivos de entrada nativos

O AAC pode ler e importar diretamente estes formatos de arquivo:

  • CSV

  • JSON

    Nota

    O AAC pode ler arquivos JSON nativamente, mas muitas vezes exige trabalho adicional para estruturar adequadamente em formato tabular. Dependendo de como você configurou o AAC (v1 ou v2), os arquivos JSON podem exigir conversão antes de estarem disponíveis para uso no aplicativo.

    Nota

    O AAC requer que você envie arquivos JSON com um objeto JSON válido por linha. Objetos JSON consistentemente malformados ou objetos que se sobrepõem a quebras de linha podem fazer com que a importação falhe.

    • Limite recomendado de 1 GB no tamanho do arquivo de origem. Como a conversão acontece dentro do nó do Trifacta, esse limite pode variar dependendo da memória desse nó.

    • Cada registro JSON deve ter um tamanho inferior a 20 MB.

    • As extensões de nome de arquivo devem ser .json ou .JSON .

    • Para melhores resultados, você deve inserir aspas em todas as chaves e valores e importá-los como cadeias de caracteres.

    • Você pode fazer o escape de valores entre aspas para tratá-los como literais em suas cadeias de caracteres usando o caractere de barra invertida ( \ ).

    • Ao importar valores para a página "Transformer", o AAC inferir novamente o tipo de dados para cada coluna.

  • Texto sem formatação

  • LOG

  • TSV

  • Parquet

    Nota

    Ao trabalhar com conjuntos de dados provenientes de arquivos Parquet, as informações de linhagem e a referência $sourcerownumber não são compatíveis.

  • Avro

    Nota

    Ao trabalhar com conjuntos de dados provenientes de arquivos Avro, as informações de linhagem e a referência $sourcerownumber não são compatíveis.

  • Google Planilhas

    Nota

    Os usuários individuais devem habilitar o acesso ao Google Drive. Nenhum dado além do Google Planilhas é lido a partir do Google Drive.

Formatos de arquivos convertidos

Os arquivos do tipo a seguir não são lidos no produto em seu formato nativo. Em vez disso, esses tipos de arquivo são convertidos usando o Serviço de Conversão em um formato de arquivo com suporte nativo, armazenado na camada de armazenamento base e, em seguida, ingerido para uso no produto.

Nota

Os arquivos compactados que exigem a conversão do formato de arquivo subjacente não têm suporte para uso no produto.

Formatos de arquivos convertidos:

  • Excel (XLS/XLSX)

    Nota

    Outros formatos relacionados ao Excel, como o formato XLSM, não são compatíveis. Se encontrar problemas, tente "Salvar como" XLS ou XLSX a partir do aplicativo Microsoft Excel.

    Dica

    Você pode importar múltiplas planilhas de trabalho de uma única pasta de trabalho ao mesmo tempo.

  • Google Planilhas

    Dica

    Você pode importar múltiplas planilhas de uma única planilha do Google de uma só vez.

  • PDF

  • JSON

Formatos de arquivos de saída nativos

O Designer Cloud pode gravar nestes formatos de arquivo:

Nota

Alguns formatos de saída podem precisar ser habilitados por um administrador.

  • CSV

  • JSON

  • Hyper

    Nota

    A publicação de resultados no formato Hyper pode exigir configuração adicional. Veja abaixo.

  • Avro

    Nota

    Os ambientes de execução do Trifacta Photon e Spark aplicam a compactação do Snappy a esse formato.

  • Parquet

    Nota

    Os ambientes de execução do Trifacta Photon e Spark aplicam a compactação do Snappy a esse formato.

Algoritmos de compactação

Quando um arquivo é importado, o AAC tenta inferir o algoritmo de compactação em uso com base na extensão de nome de arquivo. Por exemplo, presume-se que arquivos .gz sejam compactados com GZIP.

Nota

A importação de um arquivo compactado cujo formato subjacente requer conversão através do Serviço de Conversão não é compatível.

Leitura de formatos de arquivos nativos

GZIP

BZIP

Snappy

Observações

CSV

Compatível

Compatível

Compatível

JSON v2

Sem suporte

Sem suporte

Sem suporte

Um formato de arquivo convertido. Veja acima.

JSON v1

Compatível

Compatível

Compatível

Não é um formato de arquivo convertido. Veja acima.

Avro

Compatível

Gravação de formatos de arquivos nativos

GZIP

BZIP

Snappy

CSV

Compatível

Compatível

Compatível

JSON

Compatível

Compatível

Compatível

Avro

Com suporte; sempre habilitado

Formatos de compactação do Snappy

O Designer Cloud oferece suporte às seguintes variantes de formato de compactação do Snappy:

Extensão de arquivo

Nome do formato

Observações

.sz

Formato Framing2

Consulte: https://github.com/google/snappy/blob/master/framing_format.txt

.snappy

Formato Hadoop-snappy

Consulte: https://code.google.com/p/hadoop-snappy/

Nota

O formato snappy-java do Xerial, que também é gravado com uma extensão de arquivo .snappy por padrão, não é compatível.

Formatos de arquivo com suporte por aplicativo

Aplicativos individuais podem oferecer suporte a um subconjunto dos formatos de arquivo e algoritmos de compactação listados nesta página.

Aplicativo

Descrição

Designer Experience

Você pode importar vários formatos de arquivo simples para uso no Designer Experience. Acesse Opções de formato de arquivo do Designer Cloud .

Trifacta Classic

Todos os formatos de arquivo de plataforma e algoritmos de compactação são compatíveis.

Reporting

O Reporting usa dados de seus fluxos de trabalho como entradas. Vá para Designer Experience.

Os relatórios podem ser exportados nos formatos XLSX e PDF. Acesse Interface de usuário do Reporting .

Machine Learning

Os dados carregados para treinamento ou previsão de modelo devem estar em um arquivo CSV. Para obter mais informações, acesse Configuração do problema e Exportar e prever .