Skip to main content

Amazon Redshift

Tipo de conexão

ODBC (64 bits)

Tipo de suporte

Leitura e gravação; no banco de dados

Validado em

Banco de dados versão: 1.0.35649

Versão de cliente ODBC: 1.4.52.1000

Para obter mais informações sobre o driver ODBC do Simba Athena, consulte a documentação do ODBC do Simba .

Nota

Para evitar erros ao salvar seu fluxo de trabalho no Server, marque a caixa de seleção Criptografar senha para: todos os usuários desta máquina na Configuração do DSN do driver ODBC do Simba Amazon Redshift .

Ferramentas do Alteryx usadas para conexão

Processamento de fluxos de trabalho padrão

Input Data Tool Icon
Output Data Tool Icon

Processamento de fluxos de trabalho no banco de dados

Blue icon with database being plugged in.
Blue icon with a stream-like object flowing into a database.

Autenticação do Azure AD

O Alteryx permite a autenticação de nível empresarial para o Redshift, possibilitando que você aproveite as identidades do Azure Active Directory ao acessar seus dados no Redshift.

Pré-requisitos:

  1. Integração de segurança entre o Azure Active Directory e o Amazon Redshift.

  2. O usuário do Azure AD provisionou acesso à instância do AWS Redshift.

Para saber mais sobre como integrar o Azure AD com o Redshift, consulte os artigos da Comunidade.

Configurar uma conexão ODBC

No administrador de fonte de dados ODBC...

  1. Selecione o driver do Redshift e clique em Configurar .

  2. Digite suas configurações de conexão e credenciais.

  3. Na área Opções adicionais , selecione a opção Recuperar resultados inteiros na memória .

    Nota

    Essa configuração busca todo o conjunto de dados na memória física. Se a memória física estiver baixa, essa configuração estará sujeita a alterações com base no volume de dados e na memória física disponível, e talvez você precise envolver seu DBA para uma configuração recomendada.

  4. Selecione OK para salvar a conexão.

Configurar uma conexão em massa do Amazon Redshift

Para utilizar a conexão em massa por meio da ferramenta Dados de Saída...

  1. Clique no menu suspenso Gravar em arquivo ou banco de dados e selecione Outros bancos de dados > Amazon Redshift em massa .

  2. Selecione um Nome da fonte de dados (ou clique em Admin ODBC para criar um). Consulte Conexões de banco de dados ODBC e OLEDB .

  3. (Opcional) Insira um Nome de usuário e uma Senha .

  4. Na seção Amazon S3 , digite ou cole sua Chave de acesso da AWS e Chave secreta da AWS para acessar os dados para upload.

  5. No menu suspenso Criptografia de chave secreta , selecione uma opção de criptografia:

    • Ocultar : ocultar a senha usando criptografia mínima.

    • Criptografar para máquina : qualquer usuário no computador pode utilizar a conexão.

    • Criptografar para usuário : o usuário conectado pode utilizar a conexão em qualquer computador.

  6. No menu suspenso Ponto de extremidade , selecione Padrão para permitir que a Amazon determine automaticamente o ponto de extremidade com base no bucket selecionado. Para especificar um ponto de extremidade para implantações privadas do S3, ou se você conhece uma região de bucket específica, você pode selecionar alternadamente um ponto de extremidade (região S3), inserir um ponto de extremidade personalizado ou selecionar um dos dez pontos personalizados previamente inseridos.

    Se o bucket selecionado não estiver na região do ponto de extremidade especificado, ocorre o seguinte erro: "O bucket que você está tentando acessar deve ser abordado usando o ponto de extremidade especificado. Envie todas as solicitações futuras para este terminal". Selecione Padrão para limpar o erro.

  7. (Opcional) Selecione Usar Signature V4 para autenticação para usar o Signature versão 4 em vez do Signature versão 2 padrão. Isso aumenta a segurança, mas a velocidade de conexão pode ser mais lenta. Essa opção é habilitada automaticamente para regiões que exigem o Signature versão 4.

    Regiões que requerem o Signature versão 4 : regiões criadas após 30 de janeiro de 2014 são compatíveis apenas com o Signature versão 4. Estas regiões exigem autenticação do Signature versão 4:

    • Região do leste dos EUA (Ohio)

    • Região do Canadá (central)

    • Região da Ásia-Pacífico (Mumbai)

    • Região da Ásia-Pacífico (Seul)

    • Região da UE (Frankfurt)

    • Região da UE (Londres)

    • Região da China (Pequim)

  8. Selecione um método de Criptografia do lado do servidor para carregar para um bucket criptografado do Amazon S3. Para obter mais informações sobre os métodos de criptografia da Amazon S3, consulte o Guia do desenvolvedor do serviço de armazenamento simples da Amazon .

    • Nenhum (padrão) : nenhum método de criptografia é usado.

    • SSE-KMS : usa criptografia do lado do servidor com as chaves gerenciadas pelo AWS KMS. Opcionalmente, forneça um ID de chave KMS . Quando você seleciona esse método, a opção Usar Signature V4 para autenticação é habilitada por padrão.

  9. Em Nome do bucket , insira o nome do bucket da AWS no qual seus objetos de dados estão armazenados.

Opcionalmente, selecione Usar Redshift Spectrum para se conectar às tabelas Spectrum.

Mapeamento de campo

Ao carregar dados em massa para o Amazon Redshift, os dados são gravados em campos incorretos quando a ordem dos campos na saída do fluxo de trabalho é diferente da do banco de dados do Redshift. Solução para contornar o problema:

  1. Selecione a opção Agregar mapa de campos na ferramenta Dados de Saída para configurá-la, mesmo que você não altere a configuração padrão. No XML do fluxo de trabalho da ferramenta Dados de Saída, isso preencherá a tag <AppendMapping mode="ByName" /> .

  2. Altere a Opção de saída para Substituir tabela (Descartar) .

Configurar opções de saída

Você também pode especificar ou ajustar as seguintes opções do Redshift. Para obter mais informações, consulte o Guia do desenvolvedor do banco de dados do Amazon Redshift .

Nota

Para criar tabelas Spectrum com a ferramenta Dados de Saída, especifique o esquema e o nome da tabela.

spectrum_schema.tablename

A chave de distribuição será ignorada se "Chave" não estiver selecionada como o "Estilo de distribuição". A chave de classificação será ignorada se "Nenhum" estiver selecionado como o "Estilo de classificação".

  • Chave primária : selecione as colunas para a chave primária e ajuste a ordem das colunas.

  • Estilo de distribuição : selecione EVEN , KEY ou ALL .

  • Chave de distribuição : selecione uma coluna para a chave de distribuição.

  • Estilo de ordenação : selecione Nenhum , Composto ou Intercalado .

  • Chave de classificação : selecione as colunas para a chave de classificação e ajuste a ordem das colunas.

  • Habilitar operações VACUUM e ANALYZE : habilitado por padrão (somente conexões em massa). Quando habilitados, os comandos de manutenção VACUUM e ANALYZE são executados depois de um carregamento em massa do tipo APPEND ao banco de dados do Redshift.

  • Tamanho das partes do carregamento em massa (1 MB a 102400 MB) : para aumentar o desempenho de upload, arquivos grandes são divididos em arquivos menores com um tamanho especificado (número inteiro, em megabytes). O valor padrão é 128.

  • Habilitar barra invertida (\) como caractere de escape : habilitado por padrão (somente conexões em massa). Quando habilitado, um caractere imediatamente após uma barra invertida é carregado como dados de coluna, mesmo que esse caractere seja normalmente usado para uma finalidade especial (por exemplo, caractere delimitador, aspas, caractere de nova linha incorporada ou caractere de escape).

Importante

Os identificadores são dobrados em minúsculas no banco de dados. Nos resultados da consulta, nomes de tabelas e colunas são retornados em minúsculas por padrão. Para obter mais informações, consulte a documentação de Nomes e identificadores da Amazon .

Problemas conhecidos

  • Ao inserir um registro em uma tabela do Amazon Redshift com uma coluna contendo um atributo IDENTITY(seed, step), o valor da primeira coluna a ser inserido é nulo em vez de o valor ser passado para a ferramenta Dados de Saída.