Ferramenta de download
Use a ferramenta de download como uma alternativa às limitações de formatos de arquivo e fontes de dados. Como a maioria das fontes de dados tem uma API, você pode usar a ferramenta de download para transferir dados por meio da API da fonte de dados. Aqui estão algumas coisas que você pode fazer com a ferramenta de download:
- Conecte-se a qualquer serviço baseado em HTTP, incluindo FTP e SFTP
- Conectar-se a recursos baseados em HTTP, como APIs REST
- Web Scrape usando um ou mais URLs
Visite a série Domínio da ferramenta do Alteryx Community para aprender ainda mais sobre esta e outras ferramentas.
Compatibilidade da Galeria pública do alteryx
Planejando publicar seu fluxo de trabalho para Gallery.alteryx.com? Você deve primeiro solicitar uma isenção. Essa restrição não se aplica a instâncias privadas do Alteryx Server e da galeria do Alteryx.
Configure a ferramenta
Use a guia básica para definir os controles obrigatórios para a ferramenta de download.
- Campo URL: especifique o campo do fluxo de dados de entrada que contém a URL (recurso de localizador de recursos uniforme-Internet) para extrair dados de (ou enviar dados para). Isto pode ser simplesmente um Ferramenta Entrada de texto onde a URL é especificada como um valor de campo.
- Codificar texto da URL: quando verificado, a URL especificada será codificada conforme necessário, onde os caracteres ASCII não seguros são convertidos em um formato que pode ser transmitido pela Internet. Um exemplo disso seria a substituição de% 20 por um espaço.
- Output: especifique como os dados retornados devem ser formatados. Os dados podem ser retornados em um campo de dados ou saída para um arquivo.
- Para um campo: o conteúdo baixado é retornado no fluxo de dados como um campo de dados. O conteúdo baixado será em um único campo chamado "DownloadData". Você provavelmente terá que analisar esses dados usando ferramentas downstream, como o Ferramenta Texto em colunas, Ferramenta RegExOu Ferramenta Fórmula.
- String: os dados são retornados como um novo campo de tipo de cadeia de caracteres. Uma grande cadeia de caracteres suporta caracteres Unicode ®.
- Blob: os dados são retornados como um novo campo tipo blob. Blob também é conhecido como objetos grandes binários. Arquivos de imagem geralmente são armazenados neste formato. Para usar a imagem, configure am Ferramenta Imagem downstream e especifique o campo imagem ou BLOB.
- Para um arquivo
- Arquivo temporário: os dados são saída para um arquivo temporário e serão localizados no diretório temporário do usuário. Para mais informações sobre a manipulação de arquivos temp em Alteryx, consulte Alteryx e arquivos temporários.
- Filename de um campo: dados são saída para um arquivo específico onde a especificação de arquivo está em um campo de entrada. Use o DropDown para selecionar o campo que contém o nome do arquivo para a saída.
Selecione um dos Páginas de código para usar para codificação. O padrão é UTF-8. Para obter os resultados mais consistentes, os aplicativos devem usar Unicode, como UTF-8 (página de código 65001) ou UTF-16, em vez de uma página de código específica.
Use a guia cabeçalhos para modificar os cabeçalhos HTTP enviados com a solicitação da Web.
- Adicione a partir dos seguintes valores constantes: permite adicionar valores de cabeçalho fixo.
- E valores desses campos: utiliza valores dos dados de registro e cria valores de cabeçalho.
Use a guia Payload para definir a ação http que você gostaria de executar e, opcionalmente, criar a seqüência de caracteres de consulta ou o corpo para a solicitação da Web.
- Ação http: Selecione a ação http para a solicitação da Web. As opções incluem:
- Get (ou FTP): executar uma solicitação GET ou baixar um arquivo de um site FTP ou SFTP. Esta opção pode ser usada sem introduzir quaisquer outras opções nesta aba e fará o download da URL selecionada.
- Post: executa uma solicitação post para a URL selecionada. Tipicamente ao usar esta opção você especific um corpo do borne usando as opções abaixo.
- Colocar: executa um pedido de colocar. Esta opção permite que você tome o corpo da consulta de um campo de blob através do Ferramenta Entrada do Blob. Normalmente usado para carregar um arquivo para o servidor remoto.
- Delete: executa uma solicitação de exclusão. Normalmente usado para pedir ao servidor remoto para excluir um recurso especificado.
- Head: executa uma solicitação de cabeça. Isso pede que o Sever para retornar os dados de cabeçalho, mas não os dados do corpo.
- Custom: permite que você insira um verbo personalizado em uma caixa de texto. Tudo o mais sobre este pedido se comparam o mesmo que um post. O verbo post é substituído pelo verbo personalizado pouco antes da solicitação é feita.
- Escolha entre as seguintes opções de seqüência/corpo de consulta:
- Compor corpo/sequência de caracteres de consulta:
- Dos seguintes valores constantes: adiciona pares de valor de nome constante à cadeia de caracteres de consulta/corpo
- E valores desses campos: leva pares de valor de nome do registro de dados de entrada. O nome do campo é o nome usado na cadeia de caracteres de consulta/corpo
- Tipo de conteúdo: controla como os pares de valor de nome são codificados.
- Aplicativo/x-www-form-urlencoded: por exemplo , Nome1 = value1 & nome2 = value2 & Name3 = Value3. Caracteres ASCII inseguros são codificados automaticamente, portanto, verifique se os dados já não estão codificados.
- Multipart/formulário-dados: somente disponível quando usando ações http post e Custom.
- Pegue a seqüência de caracteres de consulta/corpo de campo: Selecione o campo nos dados de entrada que contém os dados da seqüência de caracteres de consulta/corpo. Os campos blob podem ser selecionados ao usar ações http post, colocar e personalizar.
- Use seguinte para seqüência de caracteres de consulta/corpo: caixa de texto que permite digitar manualmente a seqüência de caracteres de consulta ou conteúdo do corpo.
Suporte verbal
Essas opções só funcionam se o servidor remoto que você está enviando as solicitações para oferecer suporte a um determinado verbo. Verifique a documentação da API da URL que você está usando para ver quais solicitações são suportadas.
Todos os dados de texto são UTF-8 codificado antes de serem enviados para o servidor Web remoto.
Use a guia conexão para configurar as credenciais de conexão.
- Username: Introduza o nome de usuário se exigido pela especificação da URL acima. Este é um campo opcional.
- Senha: digite a senha se exigido pela especificação URL acima. Este é um campo opcional.
- Conexões máximas: especifique o número máximo de transferências simultâneas para a ferramenta de download para executar. As transferências são feitas somente em paralelo quando há vários registros de entrada enviados para a ferramenta de download. Várias ferramentas de download operam de forma independente, mas normalmente não funcionam ao mesmo tempo. Para novas ferramentas de download adicionadas a um fluxo de trabalho, o número padrão de conexões é 2 e o número máximo de conexões é 32.
- Timeout (segundos): especifique o número de segundos a aguardar antes de relatar um tempo limite devido a uma conexão sem resposta. Selecione um número de 0 (nunca Timeout) para 10.000.
Aumentar o número de conexões pode reduzir o tempo total tomado para completar todas as transferências, mas por favor, use cautela para não definir o número muito alto como ele poderia sobrecarregar o servidor que está sendo usado. É possível que o servidor pode parar de responder, relatar erros, ou até mesmo recusar conexões se ele acredita que você está usando o erro. Isso é particularmente importante ao acessar um site público que não está seu controle. A maioria dos navegadores da Web fará o máximo de 6 transferências simultâneas, mas elas normalmente seriam transferências relativamente pequenas como parte de uma página da Web. Para um servidor dentro de seu próprio negócio onde você tem mais controle sobre como ele está configurado, usando um número maior de conexões pode ser OK.
Além disso, como a ferramenta de download enviará registros downstream como transferências completas, provavelmente resultará em uma alteração na ordem de registros à medida que passarem pela ferramenta. Se a ordem importa para o seu fluxo de trabalho, certifique-se de classificar os resultados ou limitar o número de conexões para 1. Por fim, observe que URLs vazias serão processadas antes dos que requerem uma transferência real.
Outras considerações
Para evitar atrasos de conexão ao usar a ferramenta de download, verifique se a opção "detectar automaticamente configurações" é desmarcada nas propriedades da sua conta na Internet (painel de controle > opções da Internet > conexões > configurações de LAN).