Amazon Redshift Spectrum
Driver Details
For more information about the Simba Amazon Redshift ODBC driver, see the Installation and Configuration Guide on Simba portal.
Strumenti Alteryx utilizzati per la connessione
Elaborazione del flusso di lavoro standard
Elaborazione del flusso di lavoro nel database
Strumento Connetti In-DB
Configurare una connessione ODBC
In Amministrazione origine dati ODBC:
- Selezionare il driver Redshift e fare clic su Configura.
- Digitare le impostazionidi connessionee le credenziali.
- Nell'area Opzioniaggiuntive,selezionare l'opzione Recupera risultati interi in memoria.
- Salvare la connessione facendo clic su OK.
Configurare una connessione Amazon Redshift Bulk
Per utilizzare la connessione in blocco tramite lo strumento Dati di output:
- Fare clic sull'elenco a discesa Scrivi su file o Database e selezionare Altri database > Amazon Redshift Bulk.
- Selezionare un Nome origine dati (o fare clic su Amministratore ODBCper crearne uno). Vedere Connessioni al database ODBC e OLEDB.
- (Facoltativo) Digitare un Nome utentee una Password.
- Nella sezione AmazonS3,digita o incolla la chiave di accesso AWSe la chiave segreta AWSper accedere ai dati da caricare.
- Nell'elenco a discesa Crittografia chiave segreta selezionare un'opzione di crittografia:
- Nascondi: nasconde la password utilizzando la crittografia minima.
- Crittografa per la macchina: qualsiasi utente del computer sarà in grado di utilizzare completamente la connessione.
- Crittografa per l'utente: l'utente connesso può utilizzare la connessione su qualsiasi computer.
- Nel menu a discesa Endpoint,selezionare Predefinitoper consentire ad Amazon di determinare automaticamente l'endpoint in base al bucket selezionato. Per specificare un endpoint per distribuzioni S3 private oppure, se si conosce un'area bucket specifica, è possibile selezionare alternativamente un endpoint (area S3), immettere un endpoint personalizzato o selezionare uno dei dieci endpoint personalizzati immessi in precedenza.
Se il bucket selezionato non si trova nell'area dell'endpoint specificata, si verifica il seguente errore: "Il bucket a cui si sta tentando di accedere deve essere risolto utilizzando l'endpoint specificato. Inviare tutte le richieste future a questo endpoint." Selezionare Predefinito per cancellare l'errore. - (Facoltativo) Selezionare Usa firma V4 per autenticazione per utilizzare Signature Version 4 anziché la versione predefinita 2. Ciò aumenterà la sicurezza, ma la velocità di connessione potrebbe essere più lenta. Questa opzione è abilitata automaticamente per le aree che richiedono Signature Version 4.
- Aree che richiedono Signature Version 4:
Le aree create dopo il 30 gennaio 2014 supportano solo Signature Version 4. Le aree seguenti richiedono l'autenticazione Signature Version 4:- Regione degli Stati Uniti orientali (Ohio)
- Regione Canada (centrale)
- Regione Asia-Pacifico (Mumbai)
- Regione Asia-Pacifico (Seul)
- Regione UE (Francoforte)
- Regione UE (Londra)
- Regione Cina (Pechino)
- Aree che richiedono Signature Version 4:
- Seleziona un metodo di crittografialato serverper il caricamento in un bucket Amazon S3 crittografato. Per ulteriori informazioni sui metodi di crittografia Amazon S3, consulta la Guida per gli sviluppatori di Amazon Simple Storage Service.
- Nessuno (predefinito):non viene utilizzato alcun metodo di crittografia.
- SSE-KMS: utilizzare la crittografia lato server con le chiavi gestite da AWS KMS. Facoltativamente, specificare un IDchiavedel Servizio di gestione delle chiavi. Quando si seleziona questo metodo, usa Signature V4 per l'autenticazione è abilitato per impostazione predefinita.
- In Nome bucket digitare il nome del bucket AWS in cui sono archiviati gli oggetti dati.
Facoltativamente, selezionare Usa spettro Redshiftper connettersi alle tabelle Spectrum.
Configurare le opzioni di output
Facoltativamente, è possibile specificare o regolare le seguenti opzioni di Redshift. Per ulteriori informazioni, consulta la Guida per gli sviluppatori di database Amazon Redshift.
Per creare tabelle Spectrum con lo strumento Dati di output, specificare sia lo schema che il nome della tabella.
spectrum_schema.tablename
Chiave di distribuzione viene ignorata se 'Chiave' non è selezionato per Stile di distribuzione. La chiave di ordinamento viene ignorata se per Stile ordinamento è selezionato 'Nessuno'.
- Chiave Primaria: selezionare le colonne per la chiave primaria e regolare l'ordine delle colonne.
- Stile Distribuzione: selezionare Pari, Chiave o Tutto.
- Chiave Distribuzione: selezionare una colonna per la chiave di distribuzione.
- Ordina Stile: selezionare Nessuno, Composto o Interfoliato.
- Chiave Ordina: selezionare le colonne per la chiave di ordinamento e regolare l'ordine delle colonne.
- Abilita le operazioni Vacuum e Analyze : (solo connessioni in blocco) Abilitato per impostazione predefinita. Quando questa opzione è abilitata, i comandi di manutenzione VACUUM e ANALYZE vengono eseguiti dopo un caricamento bulk APPEND nel database Redshift.
- Dimensione dei blocchi di caricamento bulk (da 1 MB a 102400 MB):per aumentare le prestazioni di caricamento, i file di grandi dimensioni vengono suddivisi in file più piccoli con una dimensione intera specificata, in megabyte. Il valore predefinito è 128.
- Abilita barra rovesciata () come caratteredi escape: (Solo connessioni in blocco) Abilitato per impostazione predefinita. Quando questa opzione è abilitata, un carattere che segue immediatamente un carattere barra rovesciata viene caricato come dati di colonna, anche se tale carattere viene normalmente utilizzato per uno scopo speciale (ad esempio, carattere delimitatore, virgolette, caratteri di nuova riga incorporati o carattere di escape).