Pages de code

Une page de code (également appelée « jeu de caractères » ou « encodage ») est une table de valeurs dans laquelle chaque caractère se voit attribuer un numéro. La page de code permet à l’ordinateur d’identifier les caractères et d’afficher le texte correctement.

Alteryx prend en charge de nombreuses pages de codes qui peuvent être sélectionnées lors de la saisie et de la mise à la main des fichiers via le Outil Entrée de données et Outil Sortie de données, ou lors de la conversion de types de données à l'aide Outil Conversion de Blob. En outre, les fonctions ConvertFromCodepage et ConvertToCodepage , disponibles dans les outils dotés d'un éditeur d'expression, peuvent utiliser des identificateurs de page de code pour convertir des chaînes entre des pages de codes et un codage Unicode ®, l'Universal standard de codage de caractères pour tous les caractères écrits tels que créés par le consortium Unicode.

Alteryx suppose qu'une chaîne large est une chaîne Unicode ® et qu'une chaîne étroite est une chaîne latine 1. Si vous convertissez une chaîne en page de code, elle ne s'affichera pas correctement. Vous devez donc utiliser les pages de code uniquement pour corriger les problèmes d’encodage de texte dans un fichier. Les pages de code peuvent se présenter différemment selon l’ordinateur. Elles peuvent aussi être modifiées pour un seul ordinateur, ce qui entraîne une corruption des données. Pour les résultats les plus cohérents, utilisez le codage Unicode ®, tel que UTF-8 ou UTF-16, au lieu d'une page de codes spécifique, qui permet d'encoder différentes langues dans le même flux de données.

UTF-8 est le moyen le plus portable et compact pour stocker n'importe quel caractère et est utilisé le plus souvent. UTF-8 et UTF-16 sont des encodages à largeur variable, mais UTF-8 est compatible avec ASCII et les fichiers ont tendance à être plus petits qu’avec UTF-16.

Pour plus d'informations dans les pages de codes, consultez MSDN Library.

Identifiants de page de code