Tabelle di codici

Una tabella codici (detta anche set di caratteri o codifica) è una tabella di valori in cui a ogni carattere è stata assegnata una rappresentazione numerica. Una tabella codici consente a un computer di identificare i caratteri e di visualizzare correttamente il testo.

Alteryx supporta molte tabelle codici che puoi selezionare quando inserisci e invii i dati tramite lo strumento Dati di input e lo strumento Dati di output o quando converti i tipi di dati con lo strumento Conversione Blob . Inoltre, le funzioni ConvertFromCodepage e ConvertToCodepage (disponibili negli strumenti che dispongono di un editor delle espressioni) possono utilizzare gli identificatori delle tabelle codici per convertire le stringhe tra tabelle codici e Unicode®, lo standard universale di codifica per tutti i caratteri scritti creati dal Consorzio Unicode .

Alteryx presuppone che una stringa wide sia una stringa Unicode® e che una stringa narrow sia una stringa Latin 1. Una stringa convertita in una tabella codici non verrà visualizzata correttamente. Pertanto, le tabelle codici devono essere utilizzate solo per ignorare i problemi di codifica del testo all'interno di un file. Le tabelle codici possono apparire diverse su computer differenti o possono essere modificate per un singolo computer, con conseguente danneggiamento dei dati. Per ottenere risultati più coerenti, invece di una tabella codici specifica, utilizza la codifica Unicode®, ad esempio UTF-8 o UTF-16, che consente di codificare lingue diverse nello stesso flusso di dati.

UTF-8 è il modo più portatile e compatto per memorizzare qualsiasi carattere ed è utilizzato più spesso. UTF-8 e UTF-16 sono codifiche a larghezza variabile, ma UTF-8 è compatibile con ASCII e i file tendono ad avere dimensioni inferiori rispetto a quelli con codifica UTF-16.

Per ulteriori informazioni sulle tabelle codici, consulta MSDN Library .

Per supportare la stessa funzionalità su Linux, Alteryx utilizza la libreria ICU. Utilizziamo gli stessi ID presenti su Windows, convertendoli in convertitori di stringa ICU. ICU non supporta l'intero elenco di codifiche Windows o possono esserci differenze durante la conversione dei dati da una tabella codici a un'altra.

Identificatori di tabelle codici

Questi identificatori di tabelle codici sono supportati con le funzioni ConvertFromCodepage e ConvertToCodepage. Per ulteriori informazioni, consulta la sezione Funzioni .

ID	Descrizione	Supporto
37	IBM EBCDIC - Stati Uniti/Canada	Engine originale e AMP.
500	IBM EBCDIC - Internazionale	Engine originale e AMP.
932	ANSI/OEM - Giapponese Shift-JIS	Engine originale e AMP.
949	ANSI/OEM - EUC-KR coreano	Engine originale e AMP. Non supportato per Download e Conversione Blob.
1250	ANSI - Europa centrale	Engine originale e AMP.
1251	ANSI - Cirillico	Engine originale e AMP.
1252	ANSI - Latino I	Engine originale e AMP.
1253	ANSI - Greco	Engine originale e AMP.
1254	ANSI - Turco	Engine originale e AMP.
1255	ANSI - Ebraico	Engine originale e AMP.
1256	ANSI - Arabo	Engine originale e AMP.
1257	ANSI - Baltico	Engine originale e AMP.
1258	ANSI/OEM - Vietnamita	Engine originale e AMP.
10000	MAC - Romano	Engine originale e AMP.
28591	ISO 8859-1 Latino I	Engine originale e AMP.
28592	ISO 8859-2 Europa centrale	Engine originale e AMP.
28593	ISO 8859-3 Latino 3	Engine originale e AMP.
28594	ISO 8859-4 Baltico	Engine originale e AMP.
28595	ISO 8859-5 Cirillico	Engine originale e AMP.
28596	ISO 8859-6 Arabo	Engine originale e AMP.
28597	ISO 8859-7 Greco	Engine originale e AMP.
28598	ISO 8859-8 Ebraico: ordinamento visivo	Engine originale.
28599	ISO 8859-9 Latino 5	Engine originale e AMP.
28605	ISO 8859-15 Latino 9	Engine originale e AMP.
54936	Cinese semplificato GB18030	Engine originale e AMP. Non supportato per gli strumenti Download e Conversione Blob.
65001	Unicode UTF-8	Engine originale e AMP.
1200	Unicode UTF-16	Engine originale e AMP.

Tabelle di codici

Identificatori di tabelle codici

Risultati della ricerca