Skip to main content

Formato file di database Alteryx

Il formato file di database Alteryx YXDB è un tipo di file che può contenere campi dati, valori e oggetti spaziali. Il formato YXDB è il tipo di file più efficiente per la lettura e la scrittura in Alteryx perché non ha limiti di dimensione, viene compresso per la massima velocità e include metadati aggiuntivi che fanno riferimento all'origine dei dati e alla modalità di creazione dei dati. Sebbene non vi sia alcun limite al numero di righe o alle dimensioni del file, esiste un limite di dimensione per una singola cella di 2 GB in un ambiente a 64 bit. Tutti i prodotti Alteryx supportano la lettura e la scrittura dei file YXDB.

Perché un file YXDB è il tipo di file di input/output più efficiente?

Un file YXDB utilizza gli stessi tipi di colonne, strutture e formati utilizzati internamente da Alteryx, quindi funziona meglio con il programma. Non esiste un limite di righe, pertanto è possibile averne più di 2 miliardi. Non esiste alcun altro formato di file, diverso dai file di testo, che supporti altrettante righe.

Un file YXDB è compresso?

Sì, sono compressi minimamente per la massima velocità, non per la massima compressione. Se è presente un indice spaziale, la compressione non è molto evidente. Senza un indice spaziale, a volte la compressione può essere abbastanza buona.

Se si desidera trasformare i dati in un file che contiene un oggetto spaziale, ma non vi interagisce, un file YXDB risulta comunque più efficiente?

Sì, ma in questo caso è necessario disattivare l'indice spaziale nelle opzioni avanzate in modo da non perdere tempo e spazio per crearlo.

Quali altre informazioni sono memorizzate in un file YXDB?

Quando Alteryx scrive in un file YXDB, i dati nelle colonne Origine e Descrizione vengono salvati nel file in modo da sapere sempre come è stato creato un campo o quali sono i valori dei dati sottostanti. Per un esempio di questi metadati, accedi allo strumento Informazioni campo .

  • Origine : contiene lo strumento, il file o il processo da cui proviene il campo. Potrebbe anche contenere meta informazioni aggiuntive, come un set di dati specifico di un plugin. Gli strumenti che restituiscono meta informazioni includono Input Allocate , Aggiungi Allocate , CASS , Formula , Geocodificatore stradale , nonché quelli che utilizzano Guzzler come Area di commercio , Distanza e Trova il più vicino .

  • Descrizione : potrebbe contenere o meno informazioni. Se i dati vengono aggiunti da uno strumento Allocate, il nome del campo più lungo e descrittivo è contenuto qui. L'utente, inoltre, può aggiungere la propria descrizione del campo tramite lo strumento Seleziona e queste informazioni rimangono associate al campo.

Caso d'uso di esempio

Problema

Ho due query SQL e alcuni flussi di lavoro in cui il secondo set di dati rimane invariato e contiene tre milioni di record. Esiste un modo per riutilizzare il secondo set di dati nello stesso flusso di lavoro o in altri flussi di lavoro in modo che non debba eseguire l'istruzione SELECT più volte?

Soluzione

Se è necessaria una memorizzazione intermedia dei dati nel flusso di lavoro, utilizza uno strumento Dati di output e scrivi in formato YXDB. Puoi fare in modo che il primo flusso di lavoro scriva nel file YXDB che memorizza tutti i dati ottenuti dalla tua query. Quindi utilizza tale file YXDB come dati di input per gli altri flussi di lavoro. In questo modo puoi utilizzare il set di dati statico per lo sviluppo. Se desideri passare il flusso di lavoro a una connessione dati in tempo reale, è sufficiente copiare lo strumento Dati di input dall'altro flusso di lavoro.

In alternativa, se devi solo riutilizzare i dati all'interno di un singolo flusso di lavoro, considera l'utilizzo della funzionalità Memorizza in una cache ed esegui il flusso di lavoro .

Cache and Run Workflow UI