Páginas de código

Versão:
2023.1
Last modified: March 21, 2023

Uma página de código (também chamada "codificação de caracteres") é uma tabela de valores na qual cada caractere está atribuído a uma representação numérica. Uma página de código permite que um computador identifique caracteres e exiba o texto corretamente.

A Alteryx oferece suporte a muitas páginas de código que você pode selecionar ao inserir e gravar arquivos por meio da ferramenta Dados de Entrada e da ferramenta Dados de Saída, ou quando você converte tipos de dados com a ferramenta Conversão de Blob. Além disso, as funções ConvertFromCodepage e ConvertToCodepage (disponíveis nas ferramentas que possuem um editor de expressões) podem usar os identificadores de página de código para converter cadeias de caracteres entre páginas de código e Unicode®, o padrão universal de codificação para todos os caracteres escritos, conforme criado pela Unicode Consortium.

A Alteryx assume que uma cadeia de caracteres ampla é uma cadeia Unicode®, e uma estreita é uma cadeia Latin-1. Se você converter uma cadeia de caracteres em uma página de código, ela não será exibida corretamente. Portanto, as páginas de código só devem ser usadas para substituir problemas de codificação de texto em um arquivo. As páginas de código podem variar em computadores diferentes ou podem ser alteradas para um único computador, levando à corrupção dos dados. Para obter resultados mais consistentes, use Unicode®, como codificação UTF-8 ou UTF-16, em vez de uma página de código específica, o que permite a codificação de diferentes idiomas no mesmo fluxo de dados.

UTF-8 é a forma mais portátil e compacta de armazenar qualquer caractere, e é a mais utilizada. Tanto UTF-8 quanto UTF-16 são codificações de largura variável, mas UTF-8 é compatível com ASCII e os arquivos tendem a ser menores do que com UTF-16.

Para obter mais informações sobre páginas de código, acesse a Biblioteca MSDN.

Para suportar a mesma funcionalidade no Linux, a Alteryx emprega a biblioteca ICU. Usamos os mesmos IDs que estão no Windows, convertendo-os com conversores ICU. O ICU não oferece suporte a toda a lista de codificações do Windows ou pode haver diferenças ao converter os dados de uma página de código para outra.

Identificadores de página de código

Estes identificadores de página de código são compatíveis com as funções ConvertFromCodepage e ConvertToCodepage. Acesse Funções para obter mais informações.

ID Descrição Suporte
37 IBM EBCDIC - EUA/Canadá Motor original e AMP.
500 IBM EBCDIC - Internacional Motor original e AMP.
932 ANSI/OEM - Shift-JIS japonês Motor original e AMP.
949 ANSI/OEM - Coreano EUC-KR Motor original e AMP. Sem suporte para as ferramentas Baixar e Conversão de Blob.
1250 ANSI - Europa Central Motor original e AMP.
1251 ANSI - Cirílico Motor original e AMP.
1252 ANSI - Latim I Motor original e AMP.
1253 ANSI - Grego Motor original e AMP.
1254 ANSI - Turco Motor original e AMP.
1255 ANSI - Hebraico Motor original e AMP.
1256 ANSI - Árabe Motor original e AMP.
1257 ANSI - Báltico Motor original e AMP.
1258 ANSI/OEM - Vietnamita Motor original e AMP.
10000 Mac - Romano Motor original e AMP.
28591 ISO 8859-1 Latim I Motor original e AMP.
28592 ISO 8859-2 Europa Central Motor original e AMP.
28593 ISO 8859-3 Latim 3 Motor original e AMP.
28594 ISO 8859-4 Báltico Motor original e AMP.
28595 ISO 8859-5 Cirílico Motor original e AMP.
28596 ISO 8859-6 Árabe Motor original e AMP.
28597 ISO 8859-7 Grego Motor original e AMP.
28598 ISO 8859-8 Hebraico: Ordem visual Motor original.
28599 ISO 8859-9 Latim 5 Motor original e AMP.
28605 ISO 8859-15 Latim 9 Motor original e AMP.
54936 Chinês simplificado GB18030 Motor original e AMP. Sem suporte para as ferramentas Baixar e Conversão de Blob.
65001 Unicode UTF-8 Motor original e AMP.
1200 Unicode UTF-16 Motor original e AMP.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.