
Ferramenta De Dados De Entrada (modo Clássico)
A ferramenta Dados de entrada traz dados para o seu fluxo de trabalho por meio da conexão a um arquivo ou base de dados.
Use a ferramenta Dados de entrada para se conectar às seguintes fontes de dados com suporte:
Tipos de arquivo
-ERR:REF-NOT-FOUND-Alteryx Calgary | .cybd |
Base de dados do Alteryx | .yxdb |
Alteryx Spatial Zip | .sv |
Avro | .avro |
Valores separados por vírgula | .csv |
dBase | .dbf |
Base de dados geográficos pessoal ESRI | .mdb |
ESRI Shapefile | .shp |
Linguagem de marcação extensível | .xml |
Flat ASCII | .flat |
GIS | .grc, .grd |
Google Earth/Google Maps | .kml |
Gzip | .gz, .tgz |
IBM SPSS | .sav |
JSON | .json |
Formato MapInfo Professional Interchange | .mif |
Tabela MapInfo Professional | .tab |
Microsoft Access 2000-2003 | .bdb |
Microsoft Access 2007, 2010, 2013, 2016 | .accdb |
Microsoft Excel Binary | .xlsb |
Microsoft Excel 1997-2003 | .xls |
Microsoft Excel | .xlsx |
Microsoft Excel habilitado para macros | .xlsm |
QlikView | .qvx |
SAS | .sas7dbat |
SQLite | .sqlite |
SRC Geography | .geo |
Texto | . txt,. ASC,. dat,. log |
-ERR:REF-NOT-FOUND-Zip | .zip |
Fontes de dados
Use outras ferramentas para se conectar a outras fontes de dados com suporte. Para obter uma lista completa de fontes de dados suportadas no Alteryx, consulte fontes de dados e formatos de arquivo suportados.
Configuração de ferramentas
Antes de configurar a ferramenta, na janela configuração, digite um caminho de arquivo em conectar um arquivo ou banco de dados ou selecione uma das seguintes opções:
- Clique em Arquivo para procurar o arquivo, para se conectar a um arquivo em um diretório local ou de rede.
- Clique duas vezes em um arquivo para selecioná-lo.
Você também pode se conectar a um arquivo clicando e arrastando um arquivo do computador para a tela do Alteryx, o que adiciona uma ferramenta Dados de entrada conectada ao arquivo selecionado.
(Continue a rolar para saber como selecionar vários arquivos e arquivos do Excel)
Consulte suporte a arquivos gzip e suporte a arquivos zip para obter mais informações.
Selecionar o tipo de arquivo a ser extraído: use a lista suspensa para selecionar o tipo de arquivo a ser exibido.
Selecionar arquivos: clique na caixa de seleção ao lado do arquivo que você deseja extrair.
Para ver todos os arquivos no arquivo gzip ou zip, incluindo arquivos que não são suportados pelo Alteryx, selecione outros arquivos em Selecionar tipo de arquivo para extrair. Selecione um tipo de arquivo para Analisar outros arquivos como.
Não há suporte para arquivos Gzip e Zip no Alteryx Gallery.
Clique em Microsoft SQL Server para criar uma nova conexão ao banco de dados do Microsoft SQL Server.
Clique em Oracle para criar uma nova conexão à base de dados do Oracle.
Consulte conectar-se a um banco de dados Oracle.
Clique em Hadoop para criar uma nova conexão ao banco de dados do Hadoop.
O alteryx se conecta a um Hadoop Distributed File System e lê arquivos. csv e. Avro. Há suporte para todas as distribuições Hadoop que implementam o padrão HDFS.
(Continuar a rolagem para configurar conexões HDFC)
Aponte para outros bancos de dados para criar uma nova conexão de banco de dados com um banco de dados diferente da Microsoft, Oracle ou Hadoop.
Selecione a base de dados à qual deseja se conectar:
- -ERR:REF-NOT-FOUND-Odbc
- -ERR:REF-NOT-FOUND-Oledb
- -ERR:REF-NOT-FOUND-Oracle OCI
- -ERR:REF-NOT-FOUND-Teradata Bulk
- ESRI
- Conexões de bases de dados de 32 bits
- Conexões prévias
Antes de se conectar a uma base de dados, considere o seguinte:
- Ambos os tipos de conexão ODBC e OleDB oferecem suporte para conexões geográficas. O Alteryx detecta automaticamente se uma base de dados oferece suporte à funcionalidade geográfica e exibe as configurações necessárias.
- Ao se conectar a qualquer base de dados OleDB ou ODBC, certifique-se de usar o driver nativo disponibilizado pelo fornecedor da base de dados.
- A janela Escolher tabela ou especificar janela de consulta será aberta se o banco de dados tiver várias tabelas. Você pode então selecionar tabelas e construir consultas.
- Para se conectar a um banco de dados para processamento no banco de dados, consulte visão geral do banco de dados.
Aponte para uma opção e selecione uma conexão de dados salva ou compartilhada para conectá-la ou clique em Gerenciar para exibir e editar conexões.
- Todas as conexões: exibe uma lista de conexões salvas no seu computador e conexões compartilhadas com você a partir de uma galeria.
- Meu computador: exibe uma lista de conexões salvas no seu computador.
- Gallery: exibe uma lista de conexões compartilhadas com você de uma galeria.
- Adicionar uma Galeria: abre a tela de login da galeria. Use seu nome de usuário e senha para efetuar login. Depois de efetuar login, retorne às Conexões de dados salvas e aponte para o Gallery na lista para visualizar conexões compartilhadas do Gallery.
Consulte gerenciar conexões de dados para saber mais sobre como gerenciar conexões de dados salvas e compartilhadas e solução de problemas.
Configurar a ferramenta
Depois de ter seleccionado uma opção acima:
2. Selecione opções de formato de arquivo. As opções variam com base no arquivo ou na base de dados à qual você se conecta. Consulte Opções de formato de arquivo.
3. Faça uma pré-visualização do layout dos dados.
Selecionar múltiplos arquivos
Na janela de procura do arquivo, digite um curinga como parte do caminho do arquivo.
Considere um caso em que você tenha múltiplas tabelas de dados com ambos:
- estruturas de tabela idênticas, o que significa que a tabela contém as mesmas colunas, tipos de dados e nomes de planilhas
- nomes semelhantes no mesmo diretório
Digite a parte do nome de arquivo que elas têm em comum e adicione * para substituir todos os caracteres subsequentes ou ? para substituir um caractere. Lembre-se de incluir a extensão de arquivo que é comum a todos os arquivos ao especificar o nome.
Este caminho traz todos os arquivos .csv contidos no diretório data\datafiles que tenham um nome de arquivo começando com ABCD:
data\datafiles\ABCD*.csv
Ele traria em ABCD_4. csv e ABCD_012. csv.
Esse caminho traz todos os arquivos. csv contidos no diretório data\datafiles com um nome de arquivo que começa com ABCD_ + 1 caractere.
data\datafiles\ABCD_?.csv
Excel
Em Selecionar entrada do Excel, selecione uma das entradas do Excel:
- Use Selecionar uma planilha para escolher entre as planilhas disponíveis no arquivo do Excel.
- Use Selecionar um intervalo nomeado para escolher entre os intervalos nomeados disponíveis no arquivo do Excel.
- Use Importar somente a lista de nomes das planilhas para gerar uma saída com uma única coluna contendo nomes de planilhas como valores.
Nenhum dos dados relacionados vai para a saída quando essa opção é selecionada.
Problemas conhecidos
O driver do Access lê !!! como # # # e ambos,,, e.. . como __. Isso pode afetar os nomes das folhas e os intervalos nomeados em um arquivo do Excel puxado para o designer.
Configurar conexões HDFS
HDFS pode ser lido usando httpfs (porta 14000), webhdfs (porta 50070) ou Knox Gateway (8443). Consulte seu administrador Hadoop para saber qual usar. Se você tiver um cluster de alta disponibilidade (HA) Hadoop, seu administrador Hadoop deve habilitar httpfs.
MapR pode não suportar webhdfs.
Na janela de conexão HDFS:
- Selecione uma configuração de servidor: Httpfs, Webhdfsou Knox gateway.
- Host: Especifique a instância instalada do servidor Hadoop. A entrada deve ser um URL ou endereço IP.
- Porta: exibe o número da porta padrão para httpfs (14000), webhdfs (50070) ou Knox Gateway (8443), ou insira um número de porta específico.
- URL: os padrões de URL com base no host. O URL pode ser modificado.
- Usuário Nome: dependendo da configuração do cluster, especifique o nome de usuário e a senha para acesso.
- httpfs: um nome de usuário é necessário, mas pode ser qualquer coisa.
- webhdfs: o nome de usuário não é necessário.
- Knox Gateway: é necessário um nome de usuário e uma senha.
Não há suporte para certificados autoassinados no Alteryx. Use um certificado confiável ao configurar a autenticação Knox.
- Kerberos: selecione uma opção de autenticação Kerberos para leitura e gravação em HDFS. A opção escolhida depende de como o administrador de TI configurou o servidor HDFS:
- Nenhuma: nenhuma autenticação é usada.
- Kerberos MIT: alteryx usa o tíquete padrão do MIT para autenticar com o servidor. Você deve primeiro adquirir um tíquete válido usando o gerenciador de tíquetes Kerberos MIT.
- Kerberos SSPI: o alteryx usa as chaves Kerberos do Windows para autenticação, que são obtidas ao fazer logon no Windows com suas credenciais do Windows. Portanto, os campos Nome de usuário e Senha não estão disponíveis.
- (Recomendado) Clique em Testar para testar a conexão.
- Clique em OK.
- Especifique o caminho do arquivo (por exemplo, path/to/file.csv) ou navegue até o arquivo e selecione-o.
- Selecione o formato de arquivo Avro ou CSV e clique em OK.
Para conectar-se ao HDFS para processamento no banco de dados,use a ferramenta Conecte-se in-DB.
Detalhes da visualização
A pré-visualização do layout dos dados é limitada a 100 registros, ou menos em arquivos grandes. Se os dados contiverem 1500 colunas, serão exibidos pelo menos um registro e até duas linhas. Use uma ferramenta de procura para exibir todos os dados.
Para melhor desempenho e integridade de dados, feche as entradas antes de criar e executar um fluxo de trabalho.