Páginas de código
Uma página de código (também conhecida como conjunto de caracteres ou codificação) é uma tabela de valores onde cada caractere foi atribuído uma representação numérica. Uma página de código permite que um computador identifique caracteres e exiba texto corretamente.
Alteryx suporta muitas páginas de código que podem ser selecionadas ao colocar e produzir arquivos de dados através do Ferramenta Dados de entrada e Ferramenta Dados de saídaou ao converter tipos de dados usando o Ferramenta Conversão de Blob. Além disso, o ConvertFromCodepage e ConvertToCodepage funções, disponível em ferramentas que têm um editor de expressão, pode usar identificadores de página de código para converter seqüências de caracteres entre páginas de código e codificação Unicode ®, o universal padrão de codificação de caracteres para todos os caracteres escritos, como criado pelo consórcio Unicode.
Alteryx pressupõe que uma cadeia de caracteres de largura é uma cadeia de caracteres Unicode ® e uma cadeia de caracteres estreita é uma cadeia de caracteres Latina 1. Se você converter uma seqüência de caracteres em uma página de código, ele não será exibido corretamente. Portanto, as páginas de código só devem ser usadas para substituir os problemas de codificação de texto dentro de um arquivo. As páginas de código podem ser diferentes em computadores diferentes, ou podem ser alteradas para um único computador, levando a corrupção de dados. Para obter os resultados mais consistentes, use a codificação Unicode ®, como UTF-8 ou UTF-16, em vez de uma página de código específica, que permite que diferentes linguagens sejam codificadas no mesmo fluxo de dados.
UTF-8 é a maneira mais portátil e compacta para armazenar qualquer personagem e é usado com mais freqüência. UTF-8 e UTF-16 são codificação de largura variável, mas UTF-8 é compatível com ASCII e os arquivos tendem a ser menores do que com UTF-16.
Para obter mais informações em páginas de código, consulte biblioteca MSDN.
Esses identificadores de página de código podem ser usados com o ConvertFromCodepage e ConvertToCodepage funções. Veja Funções
37 (IBM EBCDIC-EUA/Canadá)
437 (OEM-Estados Unidos)
500 (IBM EBCDIC-International)
708 (árabe-asmo)
720 (árabe-asmo transparente)
737 (OEM-grego 437G)
775 (OEM-Báltico)
850 (OEM-multilingue latim i)
852 (OEM-Latin II)
855 (OEM-cirílico)
857 (OEM-turco)
858 (OEM-Multilingual Latin I + Euro)
860 (OEM-Português)
861 (OEM-Islandês)
862 (OEM-Hebraico)
863 (OEM-francês canadense)
864 (OEM-árabe)
865 (OEM-Nordic)
866 (OEM-russo)
869 (OEM-grego moderno)
870 (IBM EBCDIC-Multilingual/ROECE (latim-2))
874 (ANSI/OEM-tailandês)
875 (IBM EBCDIC-grego moderno)
932 (ANSI/OEM-japonês Shift-JIS)
936 (ANSI/OEM-GBK chinês simplificado)
949 (ANSI/OEM-coreano)
950 (ANSI/OEM-Big5 chinês tradicional)
1026 (IBM EBCDIC-Turco (latim-5))
1047 (IBM EBCDIC-Latin-1/Open System)
1140 (IBM EBCDIC-e.u./Canadá (37 + euro))
1141 (IBM EBCDIC-Alemanha (20273 + euro))
1142 (IBM EBCDIC-Dinamarca/Noruega (20277 + euro))
1143 (IBM EBCDIC-Finlândia/Suécia (20278 + euro))
1144 (IBM EBCDIC-Itália (20280 + euro))
1145 (IBM EBCDIC-América Latina/Espanha (20284 + euro))
1146 (IBM EBCDIC-Reino Unido (20285 + euro))
1148 (IBM EBCDIC-International (500 + euro))
1149 (IBM EBCDIC-Islandês (20871 + euro))
1250 (ANSI-Europa Central)
1251 (ANSI-cirílico)
1252 (ANSI-latim i)
1253 (ANSI-grego)
1254 (ANSI-turco)
1255 (ANSI-Hebraico)
1256 (ANSI-árabe)
1257 (ANSI-Báltico)
1258 (ANSI/OEM-Viet Nam)
1361 (coreano-Johab)
10000 (Mac-Roman)
10001 (Mac-japonês)
10002 (Mac-Big5 chinês tradicional)
10003 (Mac-coreano)
10004 (Mac-árabe)
10005 (Mac-Hebraico)
10006 (Mac-grego i)
10007 (Mac-cirílico)
10008 (Mac-chinês simplificado GB 2312)
10010 (Mac-Roménia)
10017 (Mac-Ucrânia)
10021 (Mac-tailandês)
10029 (Mac-latim II)
10079 (Mac-Islandês)
10081 (Mac-turco)
10082 (Mac-Croácia)
20000 (CNS-Taiwan)
20001 (TCA-Taiwan)
20002 (eTEN-Taiwan)
20003 (IBM5550-Taiwan)
20004 (teletexto-Taiwan)
20005 (Wang-Taiwan)
20105 (IA5 Irv International alfabeto n º 5)
20106 (IA5 alemão)
20107 (IA5 Sueco)
20108 (IA5 norueguês)
20127 (US-ASCII)
20261 (T. 61)
20269 (acento non-espaçamento do ISO 6937)
20273 (IBM EBCDIC-Alemanha)
20277 (IBM EBCDIC-Dinamarca/Noruega)
20278 (IBM EBCDIC-Finlândia/Suécia)
20280 (IBM EBCDIC-Itália)
20284 (IBM EBCDIC-América Latina/Espanha)
20285 (IBM EBCDIC-Reino Unido)
20290 (IBM EBCDIC-japonês katakana estendido)
20297 (IBM EBCDIC-França)
20420 (IBM EBCDIC-árabe)
20423 (IBM EBCDIC-grego)
20424 (IBM EBCDIC-Hebraico)
20833 (IBM EBCDIC-coreano estendido)
20838 (IBM EBCDIC-tailandês)
20866 (russo-KOI8)
20871 (IBM EBCDIC-Islandês)
20880 (IBM EBCDIC-cirílico (russo))
20905 (IBM EBCDIC-turco)
20924 (IBM EBCDIC-Latin-1/Open System (1047 + euro))
20932 EUC-JP japonês (JIS 0208-1990 e 0212-1990)
20936 (GB2312 chinês simplificado)
21025 (IBM EBCDIC-cirílico (sérvio, Búlgaro))
21027 (minúsculas alfa ext)
21866 (ucraniano-KOI8-U)
28591 (ISO 8859-1 Latin i)
28592 (ISO 8859-2 Europa Central)
28593 (ISO 8859-3 Latin 3)
28594 (ISO 8859-4 Báltico)
28595 (ISO 8859-5 cirílico)
28596 (ISO 8859-6 árabe)
28597 (ISO 8859-7 grego)
28598 (ISO 8859-8 Hebraico: ordenação Visual)
28599 (ISO 8859-9 Latin 5)
28603 (ISO 8859-13 latim 7)
28605 (ISO 8859-15 Latin 9)
38598 (ISO 8859-8 Hebraico: ordenação lógica)
50220 (ISO-2022 japonês sem meia largura-Katakana)
50221 (ISO-2022 japonês com meia largura-Katakana)
50222 (ISO-2022 japonês JIS X 0201-1989)
50225 (ISO-2022 coreano)
50227 (ISO-2022 chinês simplificado)
50229 (chinês tradicional de ISO-2022)
51949 (EUC-coreano)
52936 (HZ-GB2312 chinês simplificado)
54936 (GB18030 chinês simplificado)
57002 (ISCII-Devanagari)
57003 (ISCII-Bengali)
57004 (ISCII-Tamil)
57005 (ISCII-Telugu)
57006 (ISCII-Assamese)
57007 (ISCII-Oriya)
57008 (ISCII-Kannada)
57009 (ISCII-Malayalam)
57010 (ISCII-Guzerate)
57011 (ISCII-Punjabi (Gurmukhi))
65000 (UTF-7)
65001 (UTF-8)