Codepages
Eine Codepage (auch Zeichensatztabelle oder Codierung genannt) ist eine Wertetabelle, in der jedem Zeichen ein Zahlenwert zugeordnet ist. Anhand der Codepage können Zeichen vom Computer erkannt und Text ordnungsgemäß dargestellt werden.
Alteryx unterstützt vielerlei Code-Seiten, die Sie auswählen können, wenn Sie Datendateien über das
Eingabedaten-Tool
und
Datenausgabe-Tool
eingeben und ausgeben oder wenn Sie Datentypen mit dem
Blob-Konvertierung-Tool
konvertieren. Darüber hinaus können die Funktionen
ConvertFromCodepage
und
ConvertToCodepage
(verfügbar in Tools mit Ausdruckseditor) Codepage-Kennungen verwenden, um Zeichenfolgen zwischen Codepages und Unicode®, dem vom
Unicode-Konsortium
entwickelten universellen Zeichencodierungsstandard für alle geschriebenen Zeichen, zu konvertieren.
Alteryx geht davon aus, dass eine breite Zeichenfolge eine Unicode®- und eine schmale Zeichenfolge eine Lateinisch-1-Zeichenfolge ist. Wenn Sie eine Zeichenfolge in eine Codepage konvertieren, wird sie nicht korrekt angezeigt. Daher sollten Codepages nur verwendet werden, um Textkodierungsprobleme innerhalb einer Datei zu umgehen. Auf verschiedenen Computern können unterschiedliche Codepages installiert sein, oder es kann zu einer Änderung der Codepages auf einem einzelnen Computer kommen, was zu einer Datenbeschädigung führt. Verwenden Sie für die konsistentesten Ergebnisse Unicode®, wie UTF-8- oder UTF-16-Codierung, anstelle einer bestimmten Codepage, die es ermöglicht, verschiedene Sprachen in demselben Datenstrom zu codieren.
UTF-8 ist die portabelste und kompakteste Methode zum Speichern von Zeichen und wird am häufigsten verwendet. Bei UTF-8 und UTF-16 handelt es sich jeweils um eine Codierung mit variabler Breite. UTF-8 ist jedoch mit ASCII kompatibel und die Dateien sind im Vergleich zu UTF-16 meist kleiner.
Weitere Informationen zu Codepages finden Sie in der MSDN Library .
Um dieselben Funktionen unter Linux zu unterstützen, setzt Alteryx die ICU-Bibliothek ein. Wir verwenden die gleichen IDs wie unter Windows und konvertieren sie in ICU-Konverter für Zeichenfolgen. ICU unterstützt nicht die gesamte Liste der Windows-Codierungen. Auch kann es Unterschiede geben, wenn die Daten von einer Codepage in eine andere konvertiert werden.
Codepage-Kennungen
Diese Codepage-Kennungen werden von den Funktionen
ConvertFromCodepage
und
ConvertToCodepage
unterstützt. Weitere Informationen finden Sie unter
Funktionen
.
ID | Beschreibung | Support |
37 | IBM EBCDIC – USA/Kanada | Original-Engine und AMP. |
500 | IBM EBCDIC - International | Original-Engine und AMP. |
932 | ANSI/OEM – Japanisch (Shift-JIS) | Original-Engine und AMP. |
949 | ANSI/OEM – Koreanisch EUC-KR | Original-Engine und AMP. Nicht unterstützt bei Download und Blob-Konvertierung |
1250 | ANSI – Mitteleuropa | Original-Engine und AMP. |
1251 | ANSI – Kyrillisch | Original-Engine und AMP. |
1252 | ANSI – Lateinisch I | Original-Engine und AMP. |
1253 | ANSI – Griechisch | Original-Engine und AMP. |
1254 | ANSI – Türkisch | Original-Engine und AMP. |
1255 | ANSI – Hebräisch | Original-Engine und AMP. |
1256 | ANSI – Arabisch | Original-Engine und AMP. |
1257 | ANSI – Baltisch | Original-Engine und AMP. |
1258 | ANSI/OEM - Vietnamesisch | Original-Engine und AMP. |
10000 | MAC – Römisch | Original-Engine und AMP. |
28591 | ISO 8859-1 Lateinisch I | Original-Engine und AMP. |
28592 | ISO 8859-2 Mitteleuropa | Original-Engine und AMP. |
28593 | ISO 8859-3 Lateinisch 3 | Original-Engine und AMP. |
28594 | ISO 8859-4 Baltisch | Original-Engine und AMP. |
28595 | ISO 8859-5 Kyrillisch | Original-Engine und AMP. |
28596 | ISO 8859-6 Arabisch | Original-Engine und AMP. |
28597 | ISO 8859-7 Griechisch | Original-Engine und AMP. |
28598 | ISO 8859-8 Hebräisch: Visuelle Bestellung | Original-Engine. |
28599 | ISO 8859-9 Lateinisch 5 | Original-Engine und AMP. |
28605 | ISO 8859-15 Lateinisch 9 | Original-Engine und AMP. |
54936 | Vereinfachtes Chinesisch GB18030 | Original-Engine und AMP. Wird bei Download- und Blob-Konvertierung-Tool nicht unterstützt |
65001 | Unicode UTF-8 | Original-Engine und AMP. |
1200 | Unicode UTF-16 | Original-Engine und AMP. |