Input Data Tool Icon

Ferramenta De Dados De Entrada (modo Clássico)

Versão:
2023.1
Last modified: April 12, 2022

A ferramenta Dados de entrada traz dados para o seu fluxo de trabalho por meio da conexão a um arquivo ou base de dados.

Use a ferramenta Dados de entrada para se conectar às seguintes fontes de dados com suporte:

Tipos de arquivo

-ERR:REF-NOT-FOUND-Alteryx Calgary     .cybd
Base de dados do Alteryx .yxdb
Alteryx Spatial Zip .sv
Avro .avro
Valores separados por vírgula .csv
dBase .dbf
Base de dados geográficos pessoal ESRI     .mdb
ESRI Shapefile .shp
Linguagem de marcação extensível .xml
Flat ASCII .flat
GIS     .grc, .grd
Google Earth/Google Maps .kml
Gzip .gz, .tgz
IBM SPSS .sav
JSON .json
Formato MapInfo Professional Interchange .mif
Tabela MapInfo Professional .tab
Microsoft Access 2000-2003 .bdb
Microsoft Access 2007, 2010, 2013, 2016 .accdb
Microsoft Excel Binary .xlsb
Microsoft Excel 1997-2003 .xls
Microsoft Excel .xlsx
Microsoft Excel habilitado para macros     .xlsm
QlikView .qvx
SAS .sas7dbat
SQLite     .sqlite
SRC Geography     .geo
Texto     . txt,. ASC,. dat,. log
-ERR:REF-NOT-FOUND-Zip .zip

Fontes de dados

Adobe Adobe Analytics
Amazon Amazon Athena
  Amazon Aurora
  Amazon Redshift
  Amazon S3
Apache Cassandra
  -ERR:REF-NOT-FOUND-Hadoop -ERR:REF-NOT-FOUND-Distribuídos -ERR:REF-NOT-FOUND-Sistema de arquivos (HDFS)
  Hive
  Spark
Cloudera Impala
  Sistema de arquivos distribuídos Hadoop (HDFS)
  Hive
Databricks Databricks
ESRI     Base de dados geográficos ESRI
Exasolution     EXASOL
Google Google Analytics
  Google BigQuery
  Google Planilhas
Hortonworks Hadoop Distribuídos Sistema de arquivos (HDFS)
  Hive
IBM IBM DB2
  IBM Netezza
Marketo Marketo
MapR     -ERR:REF-NOT-FOUND-Hadoop -ERR:REF-NOT-FOUND-Distribuídos -ERR:REF-NOT-FOUND-Sistema de arquivos (HDFS)
  Hive
Microsoft Microsoft Analytics Platform System
  Microsoft Azure Data Lake Store
  SQL Data Warehouse do Microsoft Azure
  Banco de Dados SQL do Microsoft Azure
  Serviços cognitivos da Microsoft
  Microsoft Dynamics CRM
  Microsoft OneDrive
  Microsoft SharePoint
  Microsoft SQL Server
Mongo DB Mongo DB
MySQL MySQL
NetSuite NetSuite
Oracle Oracle
Pivotal Pivotal Greenplum
PostgreSQL PostgreSQL
Salesforce Salesforce
SAP SAP Hana
Snowflake Snowflake
Teradata Teradata
  Teradata Aster
Vertica Vertica

Use outras ferramentas para se conectar a outras fontes de dados com suporte. Para obter uma lista completa de fontes de dados suportadas no Alteryx, consulte fontes de dados e formatos de arquivo suportados.

Configuração de ferramentas

Antes de configurar a ferramenta, na janela configuração, digite um caminho de arquivo em conectar um arquivo ou banco de dados ou selecione uma das seguintes opções:

Arquivo
  1. Clique em Arquivo para procurar o arquivo, para se conectar a um arquivo em um diretório local ou de rede.
  2. Clique duas vezes em um arquivo para selecioná-lo.

Você também pode se conectar a um arquivo clicando e arrastando um arquivo do computador para a tela do Alteryx, o que adiciona uma ferramenta Dados de entrada conectada ao arquivo selecionado.

(Continue a rolar para saber como selecionar vários arquivos e arquivos do Excel)

Arquivos Gzip e Zip

Consulte suporte a arquivos gzip e suporte a arquivos zip para obter mais informações.

Selecionar o tipo de arquivo a ser extraído: use a lista suspensa para selecionar o tipo de arquivo a ser exibido.

Selecionar arquivos: clique na caixa de seleção ao lado do arquivo que você deseja extrair.

Para ver todos os arquivos no arquivo gzip ou zip, incluindo arquivos que não são suportados pelo Alteryx, selecione outros arquivos em Selecionar tipo de arquivo para extrair. Selecione um tipo de arquivo para Analisar outros arquivos como.

Não há suporte para arquivos Gzip e Zip no Alteryx Gallery.

Microsoft SQL Server

Clique em Microsoft SQL Server para criar uma nova conexão ao banco de dados do Microsoft SQL Server.

Consulte conectar-se a um banco de dados do SQL Server.

Oracle

Clique em Oracle para criar uma nova conexão à base de dados do Oracle.

Consulte conectar-se a um banco de dados Oracle.

Hadoop

Clique em Hadoop para criar uma nova conexão ao banco de dados do Hadoop.

O alteryx se conecta a um Hadoop Distributed File System e lê arquivos. csv e. Avro. Há suporte para todas as distribuições Hadoop que implementam o padrão HDFS.

(Continuar a rolagem para configurar conexões HDFC)

Outras bases de dados

Aponte para outros bancos de dados para criar uma nova conexão de banco de dados com um banco de dados diferente da Microsoft, Oracle ou Hadoop.

Selecione a base de dados à qual deseja se conectar:

  • -ERR:REF-NOT-FOUND-Odbc
  • -ERR:REF-NOT-FOUND-Oledb
  • -ERR:REF-NOT-FOUND-Oracle OCI
  • -ERR:REF-NOT-FOUND-Teradata Bulk
  • ESRI
  • Conexões de bases de dados de 32 bits
  • Conexões prévias

Antes de se conectar a uma base de dados, considere o seguinte:

  • Ambos os tipos de conexão ODBC e OleDB oferecem suporte para conexões geográficas. O Alteryx detecta automaticamente se uma base de dados oferece suporte à funcionalidade geográfica e exibe as configurações necessárias.
  • Ao se conectar a qualquer base de dados OleDB ou ODBC, certifique-se de usar o driver nativo disponibilizado pelo fornecedor da base de dados.
  • A janela Escolher tabela ou especificar janela de consulta será aberta se o banco de dados tiver várias tabelas. Você pode então selecionar tabelas e construir consultas.
  • Para se conectar a um banco de dados para processamento no banco de dados, consulte visão geral do banco de dados.
Conexões de dados salvas

Aponte para uma opção e selecione uma conexão de dados salva ou compartilhada para conectá-la ou clique em Gerenciar para exibir e editar conexões.

  • Todas as conexões: exibe uma lista de conexões salvas no seu computador e conexões compartilhadas com você a partir de uma galeria.
  • Meu computador: exibe uma lista de conexões salvas no seu computador.
  • Gallery: exibe uma lista de conexões compartilhadas com você de uma galeria.
  • Adicionar uma Galeria: abre a tela de login da galeria. Use seu nome de usuário e senha para efetuar login. Depois de efetuar login, retorne às Conexões de dados salvas e aponte para o Gallery na lista para visualizar conexões compartilhadas do Gallery.

Consulte gerenciar conexões de dados para saber mais sobre como gerenciar conexões de dados salvas e compartilhadas e solução de problemas.

Configurar a ferramenta

Depois de ter seleccionado uma opção acima: 

 2. Selecione opções de formato de arquivo. As opções variam com base no arquivo ou na base de dados à qual você se conecta. Consulte Opções de formato de arquivo.
 3. Faça uma pré-visualização do layout dos dados.

Selecionar múltiplos arquivos

Na janela de procura do arquivo, digite um curinga como parte do caminho do arquivo.

Considere um caso em que você tenha múltiplas tabelas de dados com ambos:

  • estruturas de tabela idênticas, o que significa que a tabela contém as mesmas colunas, tipos de dados e nomes de planilhas
  • nomes semelhantes no mesmo diretório

Digite a parte do nome de arquivo que elas têm em comum e adicione * para substituir todos os caracteres subsequentes ou ? para substituir um caractere. Lembre-se de incluir a extensão de arquivo que é comum a todos os arquivos ao especificar o nome.

Este caminho traz todos os arquivos .csv contidos no diretório data\datafiles que tenham um nome de arquivo começando com ABCD:

data\datafiles\ABCD*.csv

Ele traria em ABCD_4. csv e ABCD_012. csv.

Esse caminho traz todos os arquivos. csv contidos no diretório data\datafiles com um nome de arquivo que começa com ABCD_ + 1 caractere.

data\datafiles\ABCD_?.csv

Excel

Em Selecionar entrada do Excel, selecione uma das entradas do Excel:

  • Use Selecionar uma planilha para escolher entre as planilhas disponíveis no arquivo do Excel.
  • Use Selecionar um intervalo nomeado para escolher entre os intervalos nomeados disponíveis no arquivo do Excel.
  • Use Importar somente a lista de nomes das planilhas para gerar uma saída com uma única coluna contendo nomes de planilhas como valores.

Nenhum dos dados relacionados vai para a saída quando essa opção é selecionada.

Problemas conhecidos

O driver do Access lê !!! como # # # e ambos,,, e.. . como __. Isso pode afetar os nomes das folhas e os intervalos nomeados em um arquivo do Excel puxado para o designer.

 

Configurar conexões HDFS

HDFS pode ser lido usando httpfs (porta 14000), webhdfs (porta 50070) ou Knox Gateway (8443). Consulte seu administrador Hadoop para saber qual usar. Se você tiver um cluster de alta disponibilidade (HA) Hadoop, seu administrador Hadoop deve habilitar httpfs.

MapR pode não suportar webhdfs.

Na janela de conexão HDFS:

  1. Selecione uma configuração de servidor: Httpfs, Webhdfsou Knox gateway.
  2. Host: Especifique a instância instalada do servidor Hadoop. A entrada deve ser um URL ou endereço IP.
  3. Porta: exibe o número da porta padrão para httpfs (14000), webhdfs (50070) ou Knox Gateway (8443), ou insira um número de porta específico.
  4. URL: os padrões de URL com base no host. O URL pode ser modificado.
  5. Usuário Nome: dependendo da configuração do cluster, especifique o nome de usuário e a senha para acesso.
    • httpfs: um nome de usuário é necessário, mas pode ser qualquer coisa.
    • webhdfs: o nome de usuário não é necessário.
    • Knox Gateway: é necessário um nome de usuário e uma senha.
      Não há suporte para certificados autoassinados no Alteryx. Use um certificado confiável ao configurar a autenticação Knox.
  6. Kerberos: selecione uma opção de autenticação Kerberos para leitura e gravação em HDFS. A opção escolhida depende de como o administrador de TI configurou o servidor HDFS:
    • Nenhuma: nenhuma autenticação é usada.
    • Kerberos MIT: alteryx usa o tíquete padrão do MIT para autenticar com o servidor. Você deve primeiro adquirir um tíquete válido usando o gerenciador de tíquetes Kerberos MIT.
    • Kerberos SSPI: o alteryx usa as chaves Kerberos do Windows para autenticação, que são obtidas ao fazer logon no Windows com suas credenciais do Windows. Portanto, os campos Nome de usuário e Senha não estão disponíveis.
  7. (Recomendado) Clique em Testar para testar a conexão.
  8. Clique em OK.
  9. Especifique o caminho do arquivo (por exemplo, path/to/file.csv) ou navegue até o arquivo e selecione-o.
  10. Selecione o formato de arquivo Avro ou CSV e clique em OK.

Para conectar-se ao HDFS para processamento no banco de dados,use a ferramenta Conecte-se in-DB.

Detalhes da visualização

A pré-visualização do layout dos dados é limitada a 100 registros, ou menos em arquivos grandes. Se os dados contiverem 1500 colunas, serão exibidos pelo menos um registro e até duas linhas. Use uma ferramenta de procura para exibir todos os dados.

Para melhor desempenho e integridade de dados, feche as entradas antes de criar e executar um fluxo de trabalho.

Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.