Pages de code
Une page de code (également appelée « jeu de caractères » ou « encodage ») est une table de valeurs dans laquelle chaque caractère se voit attribuer un numéro. La page de code permet à l’ordinateur d’identifier les caractères et d’afficher le texte correctement.
Alteryx prend en charge de nombreuses pages de code sélectionnables pour les fichiers de données en entrée et en sortie à l'aide de l'
outil Entrée de données
et de l'
outil Sortie de données
ou lors de la conversion de types de données à l'aide de l'
outil Conversion de Blob
. En outre, les fonctions
ConvertFromCodepage
et
ConvertToCodepage
, disponibles dans les outils incluant un éditeur d'expressions, peuvent utiliser des identifiants de page de code pour convertir des chaînes entre les différentes pages de code et le format Unicode®, la norme universelle d'encodage de tous les caractères écrits créée par le
Consortium Unicode
.
Alteryx suppose qu'une chaîne large est une chaîne au format Unicode® et qu'une chaîne étroite est une chaîne au format Latin 1. Si vous convertissez une chaîne en page de codes, elle ne s'affiche pas correctement. Vous devez donc utiliser les pages de code uniquement pour corriger les problèmes d’encodage de texte dans un fichier. Les pages de code peuvent se présenter différemment selon l'ordinateur. Elles peuvent aussi être modifiées pour un seul ordinateur, ce qui entraîne une corruption des données. Pour obtenir les résultats les plus cohérents, utilisez le format Unicode®, comme le codage UTF-8 ou UTF-16, au lieu d'une page de code spécifique, ce qui vous permettra de coder différentes langues dans le même flux de données.
UTF-8 est le moyen le plus portable et compact de stocker tout caractère et est le codage plus fréquemment utilisé. UTF-8 et UTF-16 sont des encodages à largeur variable, mais UTF-8 est compatible avec ASCII et les fichiers ont tendance à être plus petits qu’avec UTF-16.
Pour plus d'informations sur les pages de code, consultez la bibliothèque MSDN .
Pour prendre en charge la même fonctionnalité sous Linux, Alteryx utilise la bibliothèque ICU. Nous utilisons les mêmes ID que Windows, en les transformant en convertisseurs ICU de chaîne. ICU ne prend pas en charge toute la liste de codages Windows. Il peut aussi y avoir des différences lors de la conversion des données d'une page de codes à une autre.
Identifiants de la page de code
Les identifiants de page de code suivants peuvent être utilisés avec les fonctions
ConvertFromCodepage
et
ConvertToCodepage
. Accédez à la page
Fonctions
pour plus d'informations.
ID | Description | Support |
37 | IBM EBCDIC - États-Unis/Canada | Moteur d'origine et AMP. |
500 | IBM EBCDIC - International | Moteur d'origine et AMP. |
932 | ANSI/OEM - Japonais Shift-JIS | Moteur d'origine et AMP. |
949 | ANSI/OEM - Coréen EUC-KR | Moteur d'origine et AMP. Non pris en charge pour les outils Télécharger et Conversion de Blob. |
1250 | ANSI - Europe centrale | Moteur d'origine et AMP. |
1251 | ANSI - Cyrillique | Moteur d'origine et AMP. |
1252 | ANSI - Latin I | Moteur d'origine et AMP. |
1253 | ANSI - Grec | Moteur d'origine et AMP. |
1254 | ANSI - Turc | Moteur d'origine et AMP. |
1255 | ANSI - Hébreu | Moteur d'origine et AMP. |
1256 | ANSI - Arabe | Moteur d'origine et AMP. |
1257 | ANSI - Balte | Moteur d'origine et AMP. |
1258 | ANSI/OEM - Vietnamien | Moteur d'origine et AMP. |
10000 | MAC - Romain | Moteur d'origine et AMP. |
28591 | ISO 8859-1 Latin I | Moteur d'origine et AMP. |
28592 | ISO 8859-2 Europe centrale | Moteur d'origine et AMP. |
28593 | ISO 8859-3 Latin 3 | Moteur d'origine et AMP. |
28594 | ISO 8859-4 Balte | Moteur d'origine et AMP. |
28595 | ISO 8859-5 Cyrillique | Moteur d'origine et AMP. |
28596 | ISO 8859-6 Arabe | Moteur d'origine et AMP. |
28597 | ISO 8859-7 Grec | Moteur d'origine et AMP. |
28598 | ISO 8859-8 Hébreu : ordre visuel | Moteur d'origine. |
28599 | ISO 8859-9 Latin 5 | Moteur d'origine et AMP. |
28605 | ISO 8859-15 Latin 9 | Moteur d'origine et AMP. |
54936 | Chinois simplifié GB18030 | Moteur d'origine et AMP. Non pris en charge pour les outils Télécharger et Conversion de Blob. |
65001 | Unicode UTF-8 | Moteur d'origine et AMP. |
1200 | Unicode UTF-16 | Moteur d'origine et AMP. |