Skip to main content

Páginas de código

Una página de códigos (también denominada Conjunto de caracteres o Codificación) es una tabla de valores en la que se ha asignado una representación numérica a cada carácter. Una página de códigos le permite a una computadora identificar los caracteres y mostrar el texto correctamente.

Alteryx admite muchas páginas de códigos que se pueden seleccionar al momento de ingresar y generar archivos de datos a través de la herramienta Datos de entrada y la herramienta Datos de salida , o al momento de convertir tipos de datos con la herramienta Conversión de Blob . Además, las funciones ConvertFromCodepage y ConvertToCodepage (disponibles dentro de herramientas que tienen un editor de expresiones) pueden utilizar identificadores de páginas de códigos para convertir cadenas entre páginas de códigos y Unicode®, el estándar universal de codificación de caracteres para todos los caracteres escritos creado por Consorcio Unicode .

Alteryx supone que una cadena amplia es una cadena Unicode® y una cadena estrecha es una cadena Latin 1. Si conviertes una cadena en una página de códigos, no se mostrará correctamente. Por lo tanto, las páginas de código solo se deben utilizar para anular problemas de codificación de texto dentro de un archivo. Las páginas de código pueden ser diferentes en computadoras diferentes o pueden cambiarse para una sola computadora, lo que provoca daños en los datos. Para obtener los resultados más coherentes, utiliza Unicode®, como las codificaciones UTF-8 o UTF-16, en lugar de una página de códigos específica, lo que permite codificar diferentes idiomas en el mismo flujo de datos.

UTF-8 es la forma más portátil y compacta de almacenar cualquier carácter y se utiliza con más frecuencia. Tanto UTF-8 como UTF-16 son codificaciones de ancho variable, pero UTF-8 es compatible con ASCII y los archivos tienden a ser más pequeños que con UTF-16.

Para obtener más información acerca de las páginas de códigos, visita  MSDN Library .

Para admitir la misma funcionalidad en Linux, Alteryx utiliza la biblioteca de ICU. Utilizamos los mismos ID que en Windows, ya que los convertimos en convertidores a ICU de cadenas. ICU no admite toda la lista de codificaciones de Windows o puede haber diferencias cuando se convierten los datos de una página de código a otra.

Identificadores de página de códigos

Los siguientes identificadores de página de códigos son compatibles con las funciones ConvertFromCodepage y ConvertToCodepage . Visita Funciones  para obtener más información.

Id.

Descripción

Asistencia

37

IBM EBCDIC - EE. UU./Canadá

Motor original y AMP.

500

IBM EBCDIC - Internacional

Motor original y AMP.

932

ANSI/OEM - Shift-JIS en japonés

Motor original y AMP.

949

ANSI/OEM - Coreano EUC-KR

Motor original y AMP. No es compatible con Descargar y Conversión de Blob.

1250

ANSI: Europa Central

Motor original y AMP.

1251

ANSI - Cirílico

Motor original y AMP.

1252

ANSI - Latino I

Motor original y AMP.

1253

ANSI - Griego

Motor original y AMP.

1254

ANSI - Turco

Motor original y AMP.

1255

ANSI - Hebreo

Motor original y AMP.

1256

ANSI - Árabe

Motor original y AMP.

1257

ANSI - Báltico

Motor original y AMP.

1258

ANSI/OEM - Vietnamita

Motor original y AMP.

10000

MAC - Romano

Motor original y AMP.

28591

ISO 8859-1, latino I

Motor original y AMP.

28592

ISO 8859-2, Europa Central

Motor original y AMP.

28593

ISO 8859-3, latino 3

Motor original y AMP.

28594

ISO 8859-4 Báltico

Motor original y AMP.

28595

ISO 8859-5, cirílico

Motor original y AMP.

28596

ISO 8859-6 Árabe

Motor original y AMP.

28597

ISO 8859-7, griego

Motor original y AMP.

28598

ISO 8859-8, hebreo: orden visual

Motor original.

28599

ISO 8859-9, latino 5

Motor original y AMP.

28605

ISO 8859-15, latino 9

Motor original y AMP.

54936

Chino simplificado GB18030

Motor original y AMP. No es compatible con las herramientas Descargar y Conversión de Blob.

65001

Unicode UTF-8

Motor original y AMP.

1200

Unicode UTF-16

Motor original y AMP.