Skip to main content

Páginas de código

Uma página de código (também chamada "codificação de caracteres") é uma tabela de valores na qual cada caractere está atribuído a uma representação numérica. Uma página de código permite que um computador identifique caracteres e exiba o texto corretamente.

A Alteryx oferece suporte a muitas páginas de código que você pode selecionar ao inserir e gravar arquivos por meio da ferramenta Dados de Entrada e da ferramenta Dados de Saída , ou quando você converte tipos de dados com a ferramenta Conversão de Blob . Além disso, as funções ConvertFromCodepage e ConvertToCodepage (disponíveis nas ferramentas que possuem um editor de expressões) podem usar os identificadores de página de código para converter cadeias de caracteres entre páginas de código e Unicode®, o padrão universal de codificação para todos os caracteres escritos, conforme criado pela Unicode Consortium .

A Alteryx assume que uma cadeia de caracteres ampla é uma cadeia Unicode®, e uma estreita é uma cadeia Latin-1. Se você converter uma cadeia de caracteres em uma página de código, ela não será exibida corretamente. Portanto, as páginas de código só devem ser usadas para substituir problemas de codificação de texto em um arquivo. As páginas de código podem variar em computadores diferentes ou podem ser alteradas para um único computador, levando à corrupção dos dados. Para obter resultados mais consistentes, use Unicode®, como codificação UTF-8 ou UTF-16, em vez de uma página de código específica, o que permite a codificação de diferentes idiomas no mesmo fluxo de dados.

UTF-8 é a forma mais portátil e compacta de armazenar qualquer caractere, e é a mais utilizada. Tanto UTF-8 quanto UTF-16 são codificações de largura variável, mas UTF-8 é compatível com ASCII e os arquivos tendem a ser menores do que com UTF-16.

Para obter mais informações sobre páginas de código, acesse a  Biblioteca MSDN .

Para suportar a mesma funcionalidade no Linux, a Alteryx emprega a biblioteca ICU. Usamos os mesmos IDs que estão no Windows, convertendo-os com conversores ICU. O ICU não oferece suporte a toda a lista de codificações do Windows ou pode haver diferenças ao converter os dados de uma página de código para outra.

Identificadores de página de código

Estes identificadores de página de código são compatíveis com as funções ConvertFromCodepage e ConvertToCodepage . Acesse Funções  para obter mais informações.

ID

Descrição

Suporte

37

IBM EBCDIC - EUA/Canadá

Motor original e AMP.

500

IBM EBCDIC - Internacional

Motor original e AMP.

932

ANSI/OEM - Shift-JIS japonês

Motor original e AMP.

949

ANSI/OEM - Coreano EUC-KR

Motor original e AMP. Sem suporte para as ferramentas Baixar e Conversão de Blob.

1250

ANSI - Europa Central

Motor original e AMP.

1251

ANSI - Cirílico

Motor original e AMP.

1252

ANSI - Latim I

Motor original e AMP.

1253

ANSI - Grego

Motor original e AMP.

1254

ANSI - Turco

Motor original e AMP.

1255

ANSI - Hebraico

Motor original e AMP.

1256

ANSI - Árabe

Motor original e AMP.

1257

ANSI - Báltico

Motor original e AMP.

1258

ANSI/OEM - Vietnamita

Motor original e AMP.

10000

Mac - Romano

Motor original e AMP.

28591

ISO 8859-1 Latim I

Motor original e AMP.

28592

ISO 8859-2 Europa Central

Motor original e AMP.

28593

ISO 8859-3 Latim 3

Motor original e AMP.

28594

ISO 8859-4 Báltico

Motor original e AMP.

28595

ISO 8859-5 Cirílico

Motor original e AMP.

28596

ISO 8859-6 Árabe

Motor original e AMP.

28597

ISO 8859-7 Grego

Motor original e AMP.

28598

ISO 8859-8 Hebraico: Ordem visual

Motor original.

28599

ISO 8859-9 Latim 5

Motor original e AMP.

28605

ISO 8859-15 Latim 9

Motor original e AMP.

54936

Chinês simplificado GB18030

Motor original e AMP. Sem suporte para as ferramentas Baixar e Conversão de Blob.

65001

Unicode UTF-8

Motor original e AMP.

1200

Unicode UTF-16

Motor original e AMP.