Páginas de códigos
Una página de códigos (también denominada conjunto de caracteres o codificación) es una tabla de valores donde cada carácter ha sido asignado una representación numérica. Una página de códigos permite a un equipo identificar caracteres y mostrar el texto correctamente.
Alteryx soporta muchas páginas de códigos que se pueden seleccionar al introducir y poner en el archivo de datos a través de la Herramienta Datos de entrada y Herramienta Datos de salida, o al convertir tipos de datos mediante el Herramienta Conversión de Blob. Además, las funciones ConvertFromCodepage y ConvertToCodepage , disponibles dentro de herramientas que tienen un editor de expresiones, pueden utilizar identificadores de páginas de códigos para convertir cadenas entre las páginas de códigos y la codificación Unicode ®, el universal estándar de codificación de caracteres para todos los caracteres escritos creados por el consorcio Unicode.
Alteryx supone que una cadena ancha es una cadena Unicode ® y una cadena estrecha es una cadena de 1 Latino. Si convierte una cadena en una página de códigos, no se mostrará correctamente. Por lo tanto, las páginas de código sólo deben utilizarse para anular problemas de codificación de texto dentro de un archivo. Las páginas de códigos pueden ser diferentes en diferentes equipos, o pueden cambiarse para un solo equipo, lo que provoca daños en los datos. Para obtener los resultados más consistentes, utilice la codificación Unicode ®, como UTF-8 o UTF-16, en lugar de una página de códigos específica, que permite codificar diferentes idiomas en la misma secuencia de datos.
UTF-8 es la manera más portable y compacta de almacenar cualquier carácter y se utiliza lo más a menudo posible. UTF-8 y UTF-16 son la codificación de la variable-anchura, pero UTF-8 es compatible con el ASCII y los archivos tienden para ser más pequeños que con UTF-16.
Para más información en las páginas de códigos, consulte MSDN Library.
Estos identificadores de página de código se pueden utilizar con las funciones ConvertFromCodepage y ConvertToCodepage . Consulta Funciones
37 (IBM EBCDIC-U.S./Canada)
437 (OEM-Estados Unidos)
500 (IBM EBCDIC-internacional)
708 (Árabe-asmo)
720 (asmo árabe-transparente)
737 (OEM-griego 437G)
775 (OEM-Báltico)
850 (OEM-latín multilingüe I)
852 (OEM-Latin II)
855 (OEM-cirílico)
857 (OEM-Turco)
858 (OEM-Latin multilingüe I + euro)
860 (OEM-Portugués)
861 (OEM-islandés)
862 (OEM-hebreo)
863 (Francés OEM-canadiense)
864 (OEM-árabe)
865 (OEM-nórdico)
866 (OEM-ruso)
869 (Griego OEM-moderno)
870 (IBM EBCDIC-multilingüe/ROECE (Latín-2))
874 (ANSI/OEM-tailandés)
875 (IBM EBCDIC-griego moderno)
932 (ANSI/OEM-Japanese Shift-JIS)
936 (ANSI/OEM-GBK Chino Simplificado)
949 (ANSI/OEM-Coreano)
950 (ANSI/OEM-Big5 chino tradicional)
1026 (IBM EBCDIC-Turco (Latín-5))
1047 (sistema de IBM EBCDIC-Latin-1/Open)
1140 (IBM EBCDIC-U.S./Canada (37 + euro))
1141 (IBM EBCDIC-Alemania (20273 + euro))
1142 (IBM EBCDIC-Dinamarca/Noruega (20277 + euro))
1143 (IBM EBCDIC-Finlandia/Suecia (20278 + euro))
1144 (IBM EBCDIC-Italia (20280 + euro))
1145 (IBM EBCDIC-América Latina/España (20284 + euro))
1146 (IBM EBCDIC-Reino Unido (20285 + euro))
1148 (IBM EBCDIC-International (500 + euro))
1149 (IBM EBCDIC-islandés (20871 + euro))
1250 (ANSI-Europa central)
1251 (ANSI-cirílico)
1252 (ANSI-latín I)
1253 (ANSI-griego)
1254 (ANSI-Turco)
1255 (ANSI-hebreo)
1256 (ANSI-Arabic)
1257 (ANSI-Baltic)
1258 (ANSI/OEM-Viet Nam)
1361 (Coreano-Johab)
10000 (Mac-romano)
10001 (Mac-japonés)
10002 (Mac-Big5 chino tradicional)
10003 (Mac-Coreano)
10004 (Mac-árabe)
10005 (Mac-hebreo)
10006 (Mac-griego I)
10007 (Mac-cirílico)
10008 (Mac-chino simplificado GB 2312)
10010 (Mac-Rumania)
10017 (Mac-Ucrania)
10021 (Mac-tailandés)
10029 (Mac-Latin II)
10079 (Mac-islandés)
10081 (Mac-Turco)
10082 (Mac-Croatia)
20000 (CNS-Taiwán)
20001 (TCA-Taiwán)
20002 (Eten-Taiwán)
20003 (IBM5550-Taiwán)
20004 (teletexto-Taiwán)
20005 (Wang-Taiwán)
20105 (alfabeto internacional no. 5 de IA5 IRV)
20106 (IA5 alemán)
20107 (IA5 sueco)
20108 (IA5 noruego)
20127 (US-ASCII)
20261 (T. 61)
20269 (acento de la ISO 6937 no-espaciamiento)
20273 (IBM EBCDIC-Alemania)
20277 (IBM EBCDIC-Dinamarca/Noruega)
20278 (IBM EBCDIC-Finlandia/Suecia)
20280 (IBM EBCDIC-Italia)
20284 (IBM EBCDIC-Latinoamérica/España)
20285 (IBM EBCDIC-Reino Unido)
20290 (IBM EBCDIC-japonés katakana extendido)
20297 (IBM EBCDIC-Francia)
20420 (IBM EBCDIC-Arabic)
20423 (IBM EBCDIC-griego)
20424 (IBM EBCDIC-hebreo)
20833 (IBM EBCDIC-Coreano extendido)
20838 (IBM EBCDIC-Thai)
20866 (Ruso-KOI8)
20871 (IBM EBCDIC-islandés)
20880 (IBM EBCDIC-cirílico (Ruso))
20905 (IBM EBCDIC-Turco)
20924 (IBM EBCDIC-Latin-1/sistema abierto (1047 + euro))
20932 EUC-JP japonés (JIS 0208-1990 y 0212-1990)
20936 (GB2312 Chino Simplificado)
21025 (IBM EBCDIC-cirílico (servio, búlgaro))
21027 (alfa de la extensión minúscula)
21866 (ucraniano-KOI8-U)
28591 (ISO 8859-1 Latin I)
28592 (ISO 8859-2 Europa central)
28593 (ISO 8859-3 Latin 3)
28594 (ISO 8859-4 Báltico)
28595 (ISO 8859-5 cirílico)
28596 (ISO 8859-6 árabe)
28597 (ISO 8859-7 griego)
28598 (ISO 8859-8 Hebreo: el ordenar visual)
28599 (ISO 8859-9 Latin 5)
28603 (ISO 8859-13 Latin 7)
28605 (ISO 8859-15 Latin 9)
38598 (ISO 8859-8 Hebreo: el ordenar lógico)
50220 (ISO-2022 japonés sin letra Katakana)
50221 (ISO-2022 japonés con letra Katakana)
50222 (ISO-2022 JIS japonés X 0201-1989)
50225 (ISO-2022 Coreano)
50227 (ISO-2022 Chino Simplificado)
50229 (chino tradicional ISO-2022)
51949 (EUC-Coreano)
52936 (Hz-GB2312 Chino Simplificado)
54936 (GB18030 Chino Simplificado)
57002 (ISCII-devanagari)
57003 (ISCII-bengalí)
57004 (ISCII-Tamil)
57005 (ISCII-Telugu)
57006 (ISCII)
57007 (ISCII-oriya)
57008 (ISCII-Kannada)
57009 (ISCII-Malayalam)
57010 (ISCII-Gujarati)
57011 (ISCII-Punjabi (Gurmukhi))
65000 (UTF-7)
65001 (UTF-8)