Microsoft Azure Data Lake Store

Versão:
2023.1
Last modified: August 26, 2022
Driver Details

Dependendo do método de login escolhido, um administrador talvez precise configurar o acesso ao Azure Data Lake e ao Azure Active Directory antes que uma conexão possa ser feita usando as ferramentas do Alteryx Azure Data Lake.

Type of Support

Leitura e gravação

Notas de versão
Versão Descrição
v2.2.0
  • Permite que o usuário especifique um delimitador CSV personalizado na Saída.

  • Corrigida possível vulnerabilidade de XXE.
v2.1.0
  • Interface de usuário nova e aprimorada.
  • Erros secundários corrigidos.
  • Compatível com o Alteryx Designer versão 2021.2 e posteriores.
v2.0
  • Atualização da IU e tratamento de erros aprimorado
  • Suporte adicional para armazenamentos Gen2
  • Suporte adicional para Azure Government, China Cloud e pontos de extremidade personalizados
  • Compatibilidade com autenticação de chave compartilhada
  • Compatibilidade com aplicativos públicos (próprios e Alteryx)
  • Compatibilidade com vários locatários
  • Compatibilidade com entrada e saída do Excel
  • Adicionada a capacidade de usar delimitadores personalizados para ler e gravar arquivos .CSV
  • Compatível com o Alteryx Designer versão 2019.3 e posteriores.
v1.1.0
  • Corrigidos os erros de autenticação de usuário final
  • Permitido que usuários especifiquem o URI de redirecionamento para autenticação de usuário final
v1.0.2
  • Atualizar opções das Páginas de código.

  • Feita a distinção entre codificações com o mesmo idioma (por exemplo, 'Language' -> 'Language (specific code)') e codificações ordenadas alfabeticamente.

  • Permitido que o usuário especifique a codificação para arquivos CSV na ferramenta de saída.

  • Mensagem de erro aprimorada para indicar quando um nome de loja inválido é fornecido.

  • Tratamento de conversão de dados aprimorado para não emitir um aviso em vez de um erro quando está faltando um valor em algum campo.

  • Corrigido o erro em que os arquivos/pastas exibidos não eram atualizados depois que o usuário mudava o nome da loja.

  • Corrigido o problema em que as configurações de valor padrão ocasionalmente não foram respeitadas.

  • Registro em log de produção desativado para impedir problemas de permissões para diferentes instalações/configurações do Designer e oferecer suporte à funcionalidade de fluxo de trabalho agendado

v1.0.1
  • Corrigido o problema que impedia que os pacotes fossem instalados com sucesso
v1.0.0
  • Versão inicial da Entrada de Arquivo do Azure Data Lake e da Saída de Arquivo do Azure Data Lake

 

Ferramentas do Alteryx usadas para conexão

Link
Gray icon with file folder

Ferramenta Entrada de Arquivo do Microsoft Azure Data Lake

Link
Gray icon with file graphic inside

Ferramenta Saída de Arquivo do Microsoft Azure Data Lake

As Ferramentas Azure Data Lake permitem que você se conecte a um recurso da Azure Data Lake Store e leia/grave dados.
Use a ferramenta Entrada de Arquivo do Azure Data Lake (ADL) para ler dados de arquivos localizados em uma Azure Data Lake Store (ADLS) para o fluxo de trabalho do Alteryx.
Para gravar dados do fluxo de trabalho do Alteryx em um arquivo localizado em uma ADLS, use a Ferramenta Saída de arquivo do Azure Data Lake
Os formatos de arquivo compatíveis são CSV, XLSX, JSON ou Avro (para a ferramenta Saída, a ação Acrescentar é compatível apenas para o formato CSV).
Todas essas ferramentas, exceto a Chave compartilhada, autenticam em um ponto de extremidade do Azure Active Directory.

Autenticação e autorização

Os pontos de extremidade do Azure Data Lake para armazenamentos Gen1 e Gen2 são diferentes. Durante a autenticação, você precisa especificar a qual tipo de armazenamento deseja se conectar. Se não tiver certeza do tipo de armazenamento que está usando, pergunte ao administrador do Azure ou verifique a informação no Portal do Microsoft Azure.

DICAS

  • Para publicar fluxos de trabalho no Servidor ou AAH, use os tipos de autenticação Serviço a Serviço ou Chave compartilhada para que não seja preciso fazer upload novamente do fluxo de trabalho depois que o token de atualização expirar.
  • Pode ser preciso muito tempo para carregar os metadados. Devido a isso, você pode desativar o carregamento de metadados selecionando "Desativar configuração automática nas configurações de usuário avançadas" (Opções > Configurações de usuário > Editar configurações de usuário > Avançado).

Você precisa ter recebido permissões para ler e gravar dados em uma conta da Azure Data Lake Store. Para mais informações sobre como essas permissões são atribuídas e aplicadas, consulte a documentação oficial da Microsoft.

Único Vs. Multilocatário

Os aplicativos de locatário único estão disponíveis somente no locatário em que foram registrados, também conhecido como locatário local. Você ou seu administrador do Azure podem criar aplicativos e armazenamento Azure de locatário único na conta que será usada durante a autenticação no Designer. Aplicativos multilocatários estão disponíveis para usuários nos locatários locais e em outros locatários.

    Usuário final (básico)

    A autenticação básica do usuário final é a maneira mais conveniente de se acessar os dados da ADLS no Designer. Entre em contato com o administrador do Azure para permitir aplicativos públicos do Alteryx no locatário do Azure da sua organização. Consulte a documentação da Microsoft que inclui a descrição das etapas

    Tenant: common
    ADLS Client ID for the Gen1 Alteryx application: 7fa1a397-27aa-40ad-b47c-a47fa9e600bd
    ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75


    Após essa configuração, você e seus colegas podem usar suas credenciais normais da Microsoft para acessar os dados da ADLS.

    Usuário final (avançado)

    A autenticação avançada do usuário final é compatível com a autenticação de um ou vários locatários e pode ser usada com aplicativos públicos e privados.
    Para mais informações sobre a configuração de credenciais, acesse a documentação da Microsoft.

    Configuração de autenticação

    • ID do locatário: você pode obter o ID do locatário no Azure Portal ou confiar no mecanismo de descoberta automática no Azure digitando "comum" no campo ID do locatário. Em caso de acesso a vários locatários, você pode especificar o ID do locatário. Para mais informações sobre multilocatários, consulte a seção Único Vs. Multilocatário.
    • ID do cliente: o ID exclusivo identificado de um aplicativo Azure. O campo ID do cliente é obrigatório. 
    • Segredo do cliente: se o seu aplicativo for privado, será obrigatório fornecer o segredo do cliente. Se você estiver usando um aplicativo público, deixe o campo em branco.

    Serviço a serviço

    A autenticação Serviço a Serviço é adequada para publicar fluxos de trabalho no Servidor e no Hub.
    Para mais informações sobre a configuração de credenciais, acesse a documentação da Microsoft.

    Chave compartilhada

    • A autenticação de chave compartilhada pode ser usada somente com armazenamentos Gen2.
    • A publicação no servidor só funcionará para o Designer e o servidor 2020.4 e versões mais recentes, pois esse método de autenticação foi introduzido a partir das versões 2020.4.

    Com uma conta de armazenamento Azure, a Microsoft gera duas chaves de acesso que podem ser usadas para autorizar o acesso ao seu Azure Data Lake usando a autorização da chave compartilhada. Para mais informações sobre como usar chaves compartilhadas, acesse a Documentação da Microsoft

    Azure National Clouds e pontos de extremidade personalizados

    A partir da versão v2.0, os conetores da ADLS são compatíveis com acesso a pontos de extremidade personalizados. As URLs para as nuvens nacionais dos EUA e da China podem ser selecionadas na tela de autenticação dos conectores no campo "Ponto de extremidade da Autoridade de Autenticação".

    Configuração do aplicativo

    Os armazenamentos de arquivos são acessados usando aplicativos registrados. O registro do aplicativo é necessário para todos os tipos de autenticação, com a exceção do usuário final (Básico) e da chave compartilhada. Para registrar o aplicativo no Portal do Azure, consulte as instruções no Portal de Documentação da Microsoft.

    Use aplicativos do Microsoft Azure no Alteryx Designer

    1. Adicione a Entrada do Data Lake Azure ou a Saída do Data Lake Azure na tela do Designer.
    2. Selecione a ferramenta para ver o painel "Configuração" à direita.
    3. Preencha os dados de autenticação com as informações disponíveis em http://portal.azure.com/. Para navegar no Portal do Azure, consulte a Documentação da Microsoft.
    4. Copie o ID do diretório (locatário) e o ID do aplicativo (cliente) para o Designer
    5. (Opcional) Selecione "Usar Gen1" para se conectar ao armazenamento Azure Data Lake Gen1.
    6. Cole o Segredo do cliente se estiver se conectando no modo "Serviço a Serviço".
    7. Clique em Conectar.

    Seleção de Dados e Opções de Configuração

    Na guia Dados, você pode especificar os dados que quer usar:

    1. Especifique o Nome da conta de armazenamento. Esse armazenamento precisa ser do mesmo tipo (Gen1, respectivamente Gen2), conforme selecionado na página Autenticação. 
    2. Para armazenamentos Gen2, especifique o Nome do sistema de arquivos.
    3. Depois que o armazenamento e o sistema de arquivos do Gen2 tiverem sido selecionados, você poderá configurar o caminho do arquivo que quer ler ou gravar. Você pode especificar o caminho pela entrada direta no campo "Caminho do arquivo" ou usando o explorador de arquivos. Para a ferramenta Saída de Arquivo do Azure Data Lake, você pode usar o mesmo mecanismo para criar um novo arquivo. 
    4. Para arquivos do Excel, o nome da planilha pode ser informado no campo Planilha localizado no explorador de arquivos. Caso vazia, a primeira planilha será selecionada automaticamente. No caso de arquivos novos, a planilha já vem com o nome "Planilha" predefinido.

    Formatos de arquivo e Configuração

    As ferramentas da ADLS são compatíveis com os seguintes formatos de dados: .CSV, .avro, .json e .xlsx.

    • Arquivos CSV
      • Ler
      • Gravação: você pode substituir ou acrescentar a um arquivo CSV existente. 

    Dica

    Para compatibilidade com as ferramentas de Dados de Entrada e Saída, a codificação deve ser UTF-8 SIG.

    • Arquivos JSON
      • Leitura: para ler arquivos JSON corretamente, eles devem estar usando a codificação UTF-8 sem BOM. 
      • Gravação: a conversão de tipo de dados ao gravar em arquivos JSON tem as seguintes limitações: Decimal, Datetime e Células de tempo são geradas como strings.
    • Arquivos Avro
      • Ler
      • Gravar
    • Arquivo Excel
      • Leitura: todos os dados são lidos como V_Wstrings. 
      • Gravar

    Detalhes adicionais

    • Se estiver em um estado sem acesso (leitura/gravação) a uma determinada pasta criada por outra conta, isso se deve a permissões.
    • Se você encontrar um erro dizendo que o token pode ter sido revogado, será necessário fazer logout e, em seguida, voltar ao painel de configuração para autenticar novamente.

    O administrador do sistema pode configurar as propriedades de duração do token.

    O Azure Data Lake Explorer deve conceder permissões para ler e gravar dados em uma conta da Azure Data Lake Store. Para mais informações sobre como essas permissões são atribuídas e aplicadas, leia a documentação oficial da Microsoft.

    Limitações

    JSON e Avro: somente UTF-8

    JSON e Avro são somente UTF-8.
     

    JSON: Erro de conversão silenciosa

    Para JSON, há um erro de conversão silenciosa se você tentar armazenar números que são muito grandes para seu tipo de dados.

    Gravação limitada em arquivos do Excel

    A gravação em arquivos do Excel atualmente está limitada a uma substituição completa de arquivo.

    Tipo de campo Byte Avro

    Arquivos Avro com campos de bytes não são compatíveis, e ocorrerá uma falha na importação.

    Saída: Campo float Alteryx para conversão de Tipo Avro

    Os valores do campo float do fluxo de trabalho do Alteryx são convertidos em duplo no arquivo Avro de destino.

    Vários conectores com diferentes contas de usuário do Azure Active Directory

    Os conectores do Microsoft Azure Data Lake, OneDrive e Dynamics CRM são compatíveis com autenticação por meio de credenciais de usuário da Microsoft, como e-mail e senha. Nos fluxos de trabalho interativos, não é possível fazer a autenticação com diferentes contas de usuário da Microsoft nesses conectores. Essa limitação não afeta os fluxos de trabalho programados. Caso você tenha feito a autenticação com uma conta de usuário da Microsoft em um desses conectores e tente fazer isso com outro conector em outra conta de usuário da Microsoft, você verá uma mensagem de erro. Para resolver esse problema, siga uma destas recomendações:

    • O Administrador do Azure Active Directory pode conceder as permissões necessárias a uma conta de usuário e garantir que o usuário que está criando o fluxo de trabalho tenha uma conta de usuário com acesso aos serviços necessários nesse fluxo de trabalho.
    • Faça logout de todos os conetores autenticados em uma conta de usuário diferente da Microsoft antes de tentar fazer login.
    • Evite usar a autenticação do usuário final quando possível. Use a autenticação serviço a serviço nos conectores do Azure Data Lake e a autenticação de login do aplicativo nos conectores do Dynamics CRM.
    Esta página foi útil?

    Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.