Databricks
Tipo de conexão | ODBC (64 bits) |
Requisitos de configuração do driver | O host deve ser um hostname do Server JDBC/ODBC do cluster do Databricks. Para um desempenho ideal, você deve habilitar a opção "Fast SQLPrepare" dentro das "Opções avançadas" do driver para permitir que o Alteryx recupere metadados sem executar uma consulta. A caixa de seleção Tradução habilitada para CTAS deve estar desmarcada no DSN. Ela vem marcada por padrão. Para usar o Construtor de consulta visual, selecione a opção "Obter tabelas com consulta" nas "Opções avançadas" do driver. Compatível com AWS e Azure. |
Tipo de suporte | Leitura e gravação; no banco de dados |
Validado em | Cluster do ponto de extremidade do SQL e interativo do Databricks, Driver do Simba Apache Spark 2.06.23. |
Ferramentas do Alteryx usadas para conexão
Processamento de fluxos de trabalho padrão
Processamento de fluxos de trabalho no banco de dados
Se você tiver problemas com a leitura ou gravação de caracteres Unicode®, acesse o driver ODBC do Simba Impala. Em Opções avançadas , selecione Usar tipos Unicode SQL .
O comprimento da cadeia de caracteres é controlado pelo driver. É possível alterá-lo em "Opções avançadas para o DSN ODBC" ou em "Opções avançadas para a configuração do driver", que você pode encontrar na pasta de instalação do driver.
Suporte à leitura
Instale e configure o driver ODBC do Apache Spark:
Tipo de servidor do Spark : selecione o tipo de servidor apropriado para a versão do Apache Spark que você está executando. Se estiver executando o Apache Spark 1.1 e posterior, selecione "Apache SparkThreptServer".
Mecanismo de autenticação : consulte o guia de instalação baixado com o driver do Simba Apache Spark para ajustar essa definição com base na configuração.
Para configurar as Opções avançadas do driver, consulte o guia de instalação baixado com o driver do Simba Apache Spark.
Suporte à gravação
Para fluxos de trabalho padrão e no banco de dados, use a ferramenta Entrada do Fluxo de Dados para gravar no Databricks. O suporte à gravação é oferecido por meio do carregador em massa do Databricks. Vá para Gerenciar conexões in-DB – Gravar .
Configurar a guia "Gravar"
Selecione o Carregador em massa do Databricks (Avro) ou Carregador em massa do Databricks (CSV) . Para gravar uma tabela com nomes de campo que totalizam mais de 4.000 caracteres, use CSV em vez de Avro. O delimitador usado para CSV é o caractere de início do cabeçalho (SOH).
Selecione o menu suspenso Cadeia de conexão e, em seguida, selecione Nova conexão do Databricks .
Selecione uma fonte de dados ODBC existente ou selecione Admin ODBC para criar uma.
Insira um nome de usuário e senha. Estes campos não podem estar em branco.
Insira o URL do Databricks
https://abc-abc123-123a.cloud.databricks.com
Atenção
Incluir um "/" à direita no URL (por exemplo: https://abc-abc123-123a.cloud.databricks.com /) resultará em erro.
Conexão em massa do Databricks Delta Lake
Com o Designer 2024.1, a conexão em massa do Redshift dá suporte à autenticação IAM (Gerenciamento de identidade e acesso) da AWS .
Siga os passos abaixo para configurar a conexão em massa do Databricks Delta Lake.
Importante
A conexão em massa do Databricks Delta Lake só está disponível no Designer versão 2022.1 e superior.
Selecione o Carregador em massa do Databricks Delta Lake (Avro) ou Carregador em massa do Databricks Delta Lake (CSV) . Para gravar uma tabela com nomes de campo que totalizam mais de 4.000 caracteres.
Selecione o menu suspenso Cadeia de conexão e, em seguida, selecione Nova conexão do banco de dados .
Selecione uma fonte de dados ODBC existente ou selecione Admin ODBC para criar uma.
Insira um nome de usuário e senha. Estes campos não podem estar em branco. O Alteryx é compatível com tokens de acesso pessoais. O nome de usuário é "token". A senha é o token de acesso pessoal.
Selecione um Método de preparo (compatível com AWS e Azure):
Para o Amazon S3
Insira a Chave de acesso da AWS e a Chave secreta para autenticar;
Selecione um ponto de extremidade ou deixe como Padrão ;
Selecione Usar Signature V4 para autenticação ;
Selecione o nível de Criptografia do lado do servidor necessário; "Nenhum" é o padrão;
Selecione um Nome do bucket a ser usado como local de preparo.
Com o Designer 2024.1, o carregador em massa do Databricks dá suporte à autenticação IAM (Gerenciamento de identidade e acesso) da AWS .
Para o Azure ADLS
Importante
O carregamento em massa para o Azure é compatível apenas com ADLS Gen 2 .
Selecione o Contêiner ADLS ;
Insira a Chave compartilhada ;
Insira a Conta de armazenamento ;
Insira um Diretório temporário opcional. Ao inserir o diretório temporário, não repita o Nome do contêiner .
exemplo
Se a estrutura da pasta for Container/MyTempFolder/TempTables, insira apenas "MyTempFolder/TempTables".
Se o diretório inserido aqui ainda não existir, o Alteryx criará um.
O Alteryx criará uma subpasta com o nome da tabela para cada tabela que for preparada.
Clique em OK para aplicar.
Com o Designer 2023.2, o carregador em massa do Databricks dá suporte à autenticação do Azure AD para a preparação do ADLS . Esse recurso melhora a segurança do carregador em massa do Databricks, permitindo que as organizações gerenciem de forma granular o acesso a contêineres individuais dentro de uma conta de armazenamento.
Para saber mais sobre como usar a autenticação do Azure AD para a preparação do ADLS com o carregador em massa do Databricks, consulte esta página da Comunidade.