Skip to main content

Amazon Redshift

Tipo di connessione

ODBC (64 bit)

Tipo di supporto

Lettura e scrittura, In-Database

Convalidato su

Database versione 1.0.35649

Client ODBC versione 1.4.52.1000

Per ulteriori informazioni sul driver ODBC Simba per Athena, consulta la documentazione sugli ODBC Simba .

Nota

Per evitare errori durante il salvataggio del flusso di lavoro su Server, seleziona la casella di spunta Crittografa password per: tutti gli utenti di questo computer in Configurazione DNS driver ODBC Simba Amazon Redshift .

Strumenti Alteryx utilizzati per Connect

Elaborazione del flusso di lavoro standard

Input Data Tool Icon
Output Data Tool Icon

Elaborazione del flusso di lavoro In-Database

Blue icon with database being plugged in.
Blue icon with a stream-like object flowing into a database.

Autenticazione di Azure AD

Alteryx consente l'autenticazione di livello aziendale per Redshift, permettendoti di utilizzare le identità di Azure Active Directory quando accedi ai tuoi dati in Redshift.

Prerequisiti:

  1. Integrazione della sicurezza tra Azure Active Directory e Amazon Redshift.

  2. Utente Azure AD con accesso all'istanza AWS Redshift.

Per ulteriori informazioni su come integrare Azure ad con Redshift, consulta gli articoli della community.

Configurazione di una connessione ODBC

In Amministrazione origine dati ODBC...

  1. Seleziona il driver Redshift e scegli Configura .

  2. Immetti le credenziali e le impostazioni di connessione .

  3. Nell'area Opzioni aggiuntive , seleziona l'opzione Recupera risultati interi in memoria .

    Nota

    Questa impostazione consente di recuperare l'intero set di dati nella memoria fisica. Se la memoria fisica è insufficiente, questa impostazione è soggetta a modifiche in base al volume di dati e allo spazio fisico disponibile e potrebbe essere necessario chiedere un'impostazione consigliata al DBA.

  4. Seleziona OK per salvare la connessione.

Configurazione di una connessione Amazon Redshift Bulk

Per utilizzare la connessione in blocco tramite lo strumento Dati di output...

  1. Seleziona l'elenco a discesa Scrivi nel file o nel database e scegli Altri database > Amazon Redshift Bulk .

  2. Seleziona un Nome origine dati o scegli Amministratore ODBC per crearne uno. Vedi Connessioni al database ODBC e OLEDB .

  3. (Facoltativo) Immetti un Nome utente e una Password .

  4. Nella sezione Amazon S3 , digita o incolla la chiave di accesso AWS e la chiave segreta AWS per accedere ai dati da caricare.

  5. Nell'elenco a discesa Crittografia chiave segreta , seleziona un'opzione di crittografia:

    • Nascondi : nasconde la password utilizzando la crittografia minima.

    • Crittografa per computer : qualsiasi utente del computer è in grado di utilizzare la connessione senza limitazioni.

    • Crittografa per l'utente : l'utente connesso può utilizzare la connessione su qualsiasi computer.

  6. Nel menu a discesa Endpoint , seleziona Predefinito per consentire ad Amazon di determinare automaticamente l'endpoint in base al contenitore selezionato. Per specificare un endpoint per distribuzioni S3 private oppure, se si conosce un'area contenitore specifica, è possibile selezionare alternativamente un endpoint (area S3), immettere un endpoint personalizzato o selezionare uno dei dieci endpoint personalizzati immessi in precedenza.

    Se il contenitore in questione non si trova nell'area dell'endpoint da te specificato, appare l'errore: "Per il contenitore a cui stai tentando di accedere devi utilizzare l'endpoint specificato. Invia tutte le richieste future a questo endpoint". Seleziona Predefinito per cancellare l'errore.

  7. (Facoltativo) Seleziona Usa Signature V4 per l'autenticazione per utilizzare Signature Version 4 anziché la versione predefinita 2. Ciò aumenterà la sicurezza, ma potrebbe rallentare la velocità di connessione. Questa opzione è abilitata automaticamente per le aree che richiedono Signature Version 4.

    Aree che richiedono Signature Version 4 : le aree create dopo il 30 gennaio 2014 supportano solo Signature Version 4. Le aree seguenti richiedono l'autenticazione Signature Version 4:

    • Regione degli Stati Uniti orientali (Ohio)

    • Regione Canada (centrale)

    • Regione Asia-Pacifico (Mumbai)

    • Regione Asia-Pacifico (Seul)

    • Regione UE (Francoforte)

    • Regione UE (Londra)

    • Regione Cina (Pechino)

  8. Seleziona un metodo di crittografia lato server per il caricamento in un contenitore Amazon S3 crittografato. Per ulteriori informazioni sui metodi di crittografia Amazon S3, consulta la Guida per gli sviluppatori di Amazon Simple Storage Service .

    • Nessuno (predefinito) :non viene utilizzato alcun metodo di crittografia.

    • SSE-KMS : utilizza la crittografia lato server con le chiavi gestite da AWS KMS. Facoltativamente, specifica un ID chiave KMS . Quando selezioni questo metodo, l'opzione Usa Signature V4 per l'autenticazione è abilitata per impostazione predefinita.

  9. In Nome contenitore , immetti il nome del contenitore AWS in cui sono archiviati gli oggetti dati.

Facoltativamente, seleziona Usa Redshift Spectrum per connetterti alle tabelle Spectrum.

Mappatura dei campi

Quando si caricano dati in blocco su Amazon Redshift, i dati vengono scritti in campi errati se l'ordine dei campi nell'output del flusso di lavoro è diverso da quello nel database Redshift. Per risolvere il problema:

  1. Seleziona l'opzione Aggiungi mappa campi nello strumento Dati di output per configurarla, anche se non modifichi l'impostazione predefinita. In questo modo, nell'XML del flusso di lavoro dello strumento Dati di output, il tag <AppendMapping="ByName" /> verrà popolato.

  2. Modifica Opzione di output in Sovrascrivi tabella (rimuovi) .

Configurazione delle opzioni di output

Facoltativamente, è possibile specificare o regolare le seguenti opzioni di Redshift. Per ulteriori informazioni, consulta la Guida per gli sviluppatori di database Amazon Redshift .

Nota

Per creare tabelle Spectrum con lo strumento Dati di output, specifica sia lo schema che il nome della tabella.

spectrum_schema.tablename

La chiave di distribuzione viene ignorata se il termine "Chiave" non è selezionato per Stile di distribuzione. La chiave di ordinamento viene ignorata se per Stile di ordinamento è selezionato "Nessuno".

  • Chiave primaria : consente di selezionare le colonne per la chiave primaria e di modificarne l'ordine.

  • Stile di distribuzione : consente di selezionare Pari , Chiave o Tutto .

  • Chiave  di distribuzione : consente di selezionare una colonna per la chiave di distribuzione.

  • Stile di ordinamento : consente di selezionare Nessuno , Composto o Interfogliato .

  • Chiave di ordinamento : consente di selezionare le colonne per la chiave di ordinamento e di modificarne l'ordine.

  • Abilita le operazioni Svuota e Analizza : (solo connessioni in blocco) Abilitato per impostazione predefinita. Quando questa opzione è abilitata, i comandi di manutenzione SVUOTA e ANALIZZA vengono eseguiti dopo un caricamento in blocco ACCODARE nel database Redshift.

  • Dimensione delle sezioni di caricamento in blocco (da 1 MB a 102400 MB) : per aumentare le prestazioni di caricamento, i file di grandi dimensioni vengono suddivisi in file più piccoli con una dimensione intera specificata, in megabyte. Il valore predefinito è 128.

  • Abilita barra rovesciata () come carattere di escape: (solo connessioni in blocco) Abilitato per impostazione predefinita. Quando questa opzione è abilitata, un carattere che segue immediatamente un carattere barra rovesciata viene caricato come dati di colonna, anche se tale carattere viene normalmente utilizzato per uno scopo speciale (ad esempio, carattere delimitatore, virgolette, caratteri di nuova riga incorporati o carattere di escape).

Importante

Gli identificatori vengono scritti in minuscolo nel database. Nei risultati delle query, le tabelle e i nomi delle colonne vengono restituiti in minuscolo per impostazione predefinita. Per ulteriori informazioni, consulta la documentazione Nomi e identificatori di Amazon .

Problemi noti

  • Quando si inserisce un record in una tabella Amazon Redshift con una colonna contenente un attributo IDENTITY(seed, step), il valore della prima colonna da inserire è null anziché essere il valore passato nello strumento Dati di output.