Pages de code
Une page de code (également appelée « jeu de caractères » ou « encodage ») est une table de valeurs dans laquelle chaque caractère se voit attribuer un numéro. La page de code permet à l’ordinateur d’identifier les caractères et d’afficher le texte correctement.
Alteryx prend en charge de nombreuses pages de codes qui peuvent être sélectionnées lors de la saisie et de la mise à la main des fichiers via le Outil Entrée de données et Outil Sortie de données, ou lors de la conversion de types de données à l'aide Outil Conversion de Blob. En outre, les fonctions ConvertFromCodepage et ConvertToCodepage , disponibles dans les outils dotés d'un éditeur d'expression, peuvent utiliser des identificateurs de page de code pour convertir des chaînes entre des pages de codes et un codage Unicode ®, l'Universal standard de codage de caractères pour tous les caractères écrits tels que créés par le consortium Unicode.
Alteryx suppose qu'une chaîne large est une chaîne Unicode ® et qu'une chaîne étroite est une chaîne latine 1. Si vous convertissez une chaîne en page de code, elle ne s'affichera pas correctement. Vous devez donc utiliser les pages de code uniquement pour corriger les problèmes d’encodage de texte dans un fichier. Les pages de code peuvent se présenter différemment selon l’ordinateur. Elles peuvent aussi être modifiées pour un seul ordinateur, ce qui entraîne une corruption des données. Pour les résultats les plus cohérents, utilisez le codage Unicode ®, tel que UTF-8 ou UTF-16, au lieu d'une page de codes spécifique, qui permet d'encoder différentes langues dans le même flux de données.
UTF-8 est le moyen le plus portable et compact pour stocker n'importe quel caractère et est utilisé le plus souvent. UTF-8 et UTF-16 sont des encodages à largeur variable, mais UTF-8 est compatible avec ASCII et les fichiers ont tendance à être plus petits qu’avec UTF-16.
Pour plus d'informations dans les pages de codes, consultez MSDN Library.
Ces identificateurs de page de code peuvent être utilisés avec les fonctions ConvertFromCodepage et ConvertToCodepage . Voir Fonctions
37 = IBM EBCDIC - États-Unis/Canada
437 = OEM - États-Unis
500 = IBM EBCDIC - International
708 = Arabe - ASMO
720 = Arabe - ASMO transparent
737 = OEM - Grec 437G
775 = OEM - Balte
850 = OEM - Latin I multilingue
852 = OEM - Latin II
855 = OEM - Cyrillique
857 = OEM - Turc
858 = OEM - Latin I multilingue + Euro
860 = OEM - Portugais
861 = OEM - Islande
862 = OEM - Hébreu
863 = OEM - Français canadien
864 = OEM - Arabe
865 = OEM - Nordique
866 = OEM - Russe
869 = OEM – Grec moderne
870 = IBM EBCDIC - Multilingue/ROECE (Latin 2)
874 = ANSI/OEM - Thaï
875 = IBM EBCDIC – Grec moderne
932 = ANSI/OEM - Japonais Shift-JIS
936 = ANSI/OEM – Chinois simplifié GBK
949 = ANSI/OEM - Coréen
950 = ANSI/OEM – Chinois traditionnel Big5
1026 = IBM EBCDIC - Turc (Latin 5)
1047 = IBM EBCDIC – Latin 1/Système ouvert
1140 = IBM EBCDIC - États-Unis/Canada (37 + Euro)
1141 = IBM EBCDIC - Allemagne (20273 + Euro)
1142 = IBM EBCDIC - Danemark/Norvège (20277 + Euro)
1143 = IBM EBCDIC - Finlande/Suède (20278 + Euro)
1144 = IBM EBCDIC - Italie (20280 + Euro)
1145 = IBM EBCDIC - Amérique latine/Espagne (20284 + Euro)
1146 = IBM EBCDIC - Royaume-Uni (20285 + Euro)
1148 = IBM EBCDIC - International (500 + Euro)
1149 = IBM EBCDIC - Islande (20871 + Euro)
1250 = ANSI - Europe centrale
1251 = ANSI - Cyrillique
1252 = ANSI - Latin I
1253 = ANSI - Grec
1254 = ANSI - Turc
1255 = ANSI - Hébreu
1256 = ANSI - Arabe
1257 = ANSI - Balte
1258 = ANSI/OEM - Vietnam
1361 = Coréen - Johab
10000 = MAC - Romain
10001 = MAC - Japonais
10002 = MAC – Chinois traditionnel Big5
10003 = MAC - Coréen
10004 = MAC - Arabe
10005 = MAC - Hébreu
10006 = MAC – Grec I
10007 = MAC - Cyrillique
10008 = MAC – Chinois simplifié GB 2312
10010 = MAC - Roumanie
10017 = MAC - Ukraine
10021 = MAC - Thaï
10029 = MAC - Latin II
10079 = MAC - Islande
10081 = MAC - Turc
10082 = MAC - Croatie
20000 = CNS - Taiwan
20001 = TCA - Taiwan
20002 = Eten - Taiwan
20003 = IBM5550 - Taiwan
20004 = TeleText - Taiwan
20005 = Wang - Taiwan
20105 = IA5 IRV Alphabet international n° 5
20106 = IA5 Allemand
20107 = IA5 Suédois
20108 = IA5 Norvégien
20127 = US ASCII
20261 = T.61
20269 = ISO 6937 Accent sans espace
20273 = IBM EBCDIC - Allemagne
20277 = IBM EBCDIC - Danemark/Norvège
20278 = IBM EBCDIC - Finlande/Suède
20280 = IBM EBCDIC - Italie
20284 = IBM EBCDIC - Amérique latine/Espagne
20285 = IBM EBCDIC - Royaume-Uni
20290 = IBM EBCDIC - Japonais Katakana étendu
20297 = IBM EBCDIC - France
20420 = IBM EBCDIC - Arabe
20423 = IBM EBCDIC - Grec
20424 = IBM EBCDIC - Hébreu
20833 = IBM EBCDIC – Coréen étendu
20838 = IBM EBCDIC - Thaï
20866 = Russe - KOI8
20871 = IBM EBCDIC - Islande
20880 = IBM EBCDIC - Cyrillique (Russe)
20905 = IBM EBCDIC - Turc
20924 = IBM EBCDIC – Latin 1/Système ouvert (1047 + Euro)
20932 EUC-JP Japonais (JIS 0208-1990 et 0212-1990)
20936 (Chinois simplifié GB2312)
21025 = IBM EBCDIC - Cyrillique (Serbe, Bulgare)
21027 (Minuscules alpha étendues)
21866 = Ukrainien - KOI8-U
28591 = ISO 8859-1 Latin I
28592 = ISO 8859-2 Europe centrale
28593 = ISO 8859-3 Latin 3
28594 = ISO 8859-4 Balte
28595 = ISO 8859-5 Cyrillique
28596 = ISO 8859-6 Arabe
28597 = ISO 8859-7 Grec
28598 (ISO 8859-8 hébreu: commande visuelle)
28599 (ISO 8859-9 latin 5)
28603 (ISO 8859-13 latin 7)
28605 = ISO 8859-15 Latin 9
38598 (ISO 8859-8 hébreu: ordre logique)
50220 = ISO-2022 Japonais sans Katakana demi-largeur
50221 = ISO-2022 Japonais avec Katakana demi-largeur
50222 = ISO-2022 Japonais JIS X 0201-1989
50225 = ISO-2022 Coréen
50227 = ISO-2022 Chinois simplifié
50229 = ISO-2022 Chinois traditionnel
51949 = EUC - Coréen
52936 = HZ-GB2312 Chinois simplifié
54936 = GB18030 Chinois simplifié
57002 = ISCII - Devanagari
57003 = ISCII - Bengali
57004 = ISCII - Tamil
57005 = ISCII - Telugu
57006 = ISCII - Assamais
57007 = ISCII - Oriya
57008 = ISCII - Kannada
57009 = ISCII - Malayalam
57010 = ISCII - Gujarati
57011 = ISCII - Punjabi (Gurmukhi)
65000 (UTF-7)
65001 = UTF-8