Tabelle di codici
Una tabella codici (detta anche set di caratteri o codifica) è una tabella di valori in cui a ogni carattere è stata assegnata una rappresentazione numerica. Una tabella codici consente a un computer di identificare i caratteri e di visualizzare correttamente il testo.
Alteryx supporta molte tabelle codici che puoi selezionare quando inserisci e invii i dati tramite lo
strumento Dati di input
e lo
strumento Dati di output
o quando converti i tipi di dati con lo
strumento Conversione Blob
. Inoltre, le funzioni
ConvertFromCodepage
e
ConvertToCodepage
(disponibili negli strumenti che dispongono di un editor delle espressioni) possono utilizzare gli identificatori delle tabelle codici per convertire le stringhe tra tabelle codici e Unicode®, lo standard universale di codifica per tutti i caratteri scritti creati dal
Consorzio Unicode
.
Alteryx presuppone che una stringa wide sia una stringa Unicode® e che una stringa narrow sia una stringa Latin 1. Una stringa convertita in una tabella codici non verrà visualizzata correttamente. Pertanto, le tabelle codici devono essere utilizzate solo per ignorare i problemi di codifica del testo all'interno di un file. Le tabelle codici possono apparire diverse su computer differenti o possono essere modificate per un singolo computer, con conseguente danneggiamento dei dati. Per ottenere risultati più coerenti, invece di una tabella codici specifica, utilizza la codifica Unicode®, ad esempio UTF-8 o UTF-16, che consente di codificare lingue diverse nello stesso flusso di dati.
UTF-8 è il modo più portatile e compatto per memorizzare qualsiasi carattere ed è utilizzato più spesso. UTF-8 e UTF-16 sono codifiche a larghezza variabile, ma UTF-8 è compatibile con ASCII e i file tendono ad avere dimensioni inferiori rispetto a quelli con codifica UTF-16.
Per ulteriori informazioni sulle tabelle codici, consulta MSDN Library .
Per supportare la stessa funzionalità su Linux, Alteryx utilizza la libreria ICU. Utilizziamo gli stessi ID presenti su Windows, convertendoli in convertitori di stringa ICU. ICU non supporta l'intero elenco di codifiche Windows o possono esserci differenze durante la conversione dei dati da una tabella codici a un'altra.
Identificatori di tabelle codici
Questi identificatori di tabelle codici sono supportati con le funzioni
ConvertFromCodepage
e
ConvertToCodepage
. Per ulteriori informazioni, consulta la sezione
Funzioni
.
ID | Descrizione | Supporto |
37 | IBM EBCDIC - Stati Uniti/Canada | Engine originale e AMP. |
500 | IBM EBCDIC - Internazionale | Engine originale e AMP. |
932 | ANSI/OEM - Giapponese Shift-JIS | Engine originale e AMP. |
949 | ANSI/OEM - EUC-KR coreano | Engine originale e AMP. Non supportato per Download e Conversione Blob. |
1250 | ANSI - Europa centrale | Engine originale e AMP. |
1251 | ANSI - Cirillico | Engine originale e AMP. |
1252 | ANSI - Latino I | Engine originale e AMP. |
1253 | ANSI - Greco | Engine originale e AMP. |
1254 | ANSI - Turco | Engine originale e AMP. |
1255 | ANSI - Ebraico | Engine originale e AMP. |
1256 | ANSI - Arabo | Engine originale e AMP. |
1257 | ANSI - Baltico | Engine originale e AMP. |
1258 | ANSI/OEM - Vietnamita | Engine originale e AMP. |
10000 | MAC - Romano | Engine originale e AMP. |
28591 | ISO 8859-1 Latino I | Engine originale e AMP. |
28592 | ISO 8859-2 Europa centrale | Engine originale e AMP. |
28593 | ISO 8859-3 Latino 3 | Engine originale e AMP. |
28594 | ISO 8859-4 Baltico | Engine originale e AMP. |
28595 | ISO 8859-5 Cirillico | Engine originale e AMP. |
28596 | ISO 8859-6 Arabo | Engine originale e AMP. |
28597 | ISO 8859-7 Greco | Engine originale e AMP. |
28598 | ISO 8859-8 Ebraico: ordinamento visivo | Engine originale. |
28599 | ISO 8859-9 Latino 5 | Engine originale e AMP. |
28605 | ISO 8859-15 Latino 9 | Engine originale e AMP. |
54936 | Cinese semplificato GB18030 | Engine originale e AMP. Non supportato per gli strumenti Download e Conversione Blob. |
65001 | Unicode UTF-8 | Engine originale e AMP. |
1200 | Unicode UTF-16 | Engine originale e AMP. |