Páginas de código
Uma página de código (também chamada "codificação de caracteres") é uma tabela de valores na qual cada caractere está atribuído a uma representação numérica. Uma página de código permite que um computador identifique caracteres e exiba o texto corretamente.
A Alteryx oferece suporte a muitas páginas de código que você pode selecionar ao inserir e gravar arquivos por meio da
ferramenta Dados de Entrada
e da
ferramenta Dados de Saída
, ou quando você converte tipos de dados com a
ferramenta Conversão de Blob
. Além disso, as funções
ConvertFromCodepage
e
ConvertToCodepage
(disponíveis nas ferramentas que possuem um editor de expressões) podem usar os identificadores de página de código para converter cadeias de caracteres entre páginas de código e Unicode®, o padrão universal de codificação para todos os caracteres escritos, conforme criado pela
Unicode Consortium
.
A Alteryx assume que uma cadeia de caracteres ampla é uma cadeia Unicode®, e uma estreita é uma cadeia Latin-1. Se você converter uma cadeia de caracteres em uma página de código, ela não será exibida corretamente. Portanto, as páginas de código só devem ser usadas para substituir problemas de codificação de texto em um arquivo. As páginas de código podem variar em computadores diferentes ou podem ser alteradas para um único computador, levando à corrupção dos dados. Para obter resultados mais consistentes, use Unicode®, como codificação UTF-8 ou UTF-16, em vez de uma página de código específica, o que permite a codificação de diferentes idiomas no mesmo fluxo de dados.
UTF-8 é a forma mais portátil e compacta de armazenar qualquer caractere, e é a mais utilizada. Tanto UTF-8 quanto UTF-16 são codificações de largura variável, mas UTF-8 é compatível com ASCII e os arquivos tendem a ser menores do que com UTF-16.
Para obter mais informações sobre páginas de código, acesse a Biblioteca MSDN .
Para suportar a mesma funcionalidade no Linux, a Alteryx emprega a biblioteca ICU. Usamos os mesmos IDs que estão no Windows, convertendo-os com conversores ICU. O ICU não oferece suporte a toda a lista de codificações do Windows ou pode haver diferenças ao converter os dados de uma página de código para outra.
Identificadores de página de código
Estes identificadores de página de código são compatíveis com as funções
ConvertFromCodepage
e
ConvertToCodepage
. Acesse
Funções
para obter mais informações.
ID | Descrição | Suporte |
37 | IBM EBCDIC - EUA/Canadá | Motor original e AMP. |
500 | IBM EBCDIC - Internacional | Motor original e AMP. |
932 | ANSI/OEM - Shift-JIS japonês | Motor original e AMP. |
949 | ANSI/OEM - Coreano EUC-KR | Motor original e AMP. Sem suporte para as ferramentas Baixar e Conversão de Blob. |
1250 | ANSI - Europa Central | Motor original e AMP. |
1251 | ANSI - Cirílico | Motor original e AMP. |
1252 | ANSI - Latim I | Motor original e AMP. |
1253 | ANSI - Grego | Motor original e AMP. |
1254 | ANSI - Turco | Motor original e AMP. |
1255 | ANSI - Hebraico | Motor original e AMP. |
1256 | ANSI - Árabe | Motor original e AMP. |
1257 | ANSI - Báltico | Motor original e AMP. |
1258 | ANSI/OEM - Vietnamita | Motor original e AMP. |
10000 | Mac - Romano | Motor original e AMP. |
28591 | ISO 8859-1 Latim I | Motor original e AMP. |
28592 | ISO 8859-2 Europa Central | Motor original e AMP. |
28593 | ISO 8859-3 Latim 3 | Motor original e AMP. |
28594 | ISO 8859-4 Báltico | Motor original e AMP. |
28595 | ISO 8859-5 Cirílico | Motor original e AMP. |
28596 | ISO 8859-6 Árabe | Motor original e AMP. |
28597 | ISO 8859-7 Grego | Motor original e AMP. |
28598 | ISO 8859-8 Hebraico: Ordem visual | Motor original. |
28599 | ISO 8859-9 Latim 5 | Motor original e AMP. |
28605 | ISO 8859-15 Latim 9 | Motor original e AMP. |
54936 | Chinês simplificado GB18030 | Motor original e AMP. Sem suporte para as ferramentas Baixar e Conversão de Blob. |
65001 | Unicode UTF-8 | Motor original e AMP. |
1200 | Unicode UTF-16 | Motor original e AMP. |