Páginas de código

Last modified: February 02, 2022

A documentação estará disponível antes do lançamento do Designer Cloud para que você possa dar uma olhadinha. Este conteúdo pode mudar até o lançamento oficial.

Uma Página de código (também chamada de Conjunto de caracteres ou Codificação) é uma tabela de valores na qual cada caractere foi atribuído a uma representação numérica. Uma página de código possibilita que um computador identifique os caracteres e exiba o texto corretamente.

A Alteryx oferece suporte a muitas páginas de código que você pode selecionar ao inserir e enviar arquivos de dados por meio do ferramenta de dados de entrada e ferramenta dados de saída. Além disso, as funções do ConvertFromCodepage e ConvertToCodepage (disponíveis nas ferramentas que possuem um editor de expressões), podem usar os identificadores de página de código para converter cadeias de caracteres em páginas de código e Unicode®, o padrão universal de codificação para todos os caracteres escritos, conforme criado pelo Consórcio Unicode.

A Alteryx assume que uma cadeia de caracteres ampla é uma cadeia de caracteres Unicode®, e uma cadeia de caracteres estreita é uma cadeia de caracteres Latin 1. Se você converter uma cadeia de caracteres em uma página de código, ela não será exibida corretamente. Portanto, as páginas de código só devem ser usadas para substituir problemas de codificação de texto em um arquivo. As páginas de código podem variar em computadores diferentes ou podem ser alteradas para um único computador, levando à corrupção dos dados. Para obter resultados mais consistentes, use Unicode®, como codificação UTF-8 ou UTF-16, em vez de uma página de código específica, que permite a codificação de diferentes idiomas no mesmo fluxo de dados.

UTF-8 é a forma mais portátil e compacta de guardar qualquer caractere, e é utilizada com mais frequência. Tanto UTF-8 quanto UTF-16 são codificações de largura variável, mas UTF-8 é compatível com ASCII e os arquivos tendem a ser menores do que com UTF-16.

Para obter mais informações sobre páginas de código, visite a Biblioteca MSDN.

Para suportar a mesma funcionalidade no Linux, a Alteryx emprega a biblioteca ICU. Usamos as mesmas IDs que estão no Windows, transformando-as em conversoras de cadeia de caracteres de ICU-os em conversores de ICU de string. A ICU não suporta toda a lista de codificações do Windows ou pode haver diferenças ao converter os dados de uma página de código para outra.

Identificadores de página de código

Esses identificadores de página de código são suportados pelas funções ConvertFromCodepage e ConvertToCodepage. O suporte ocorre somente por meio de AMP.

ID Descrição
37 IBM EBCDIC - EUA/Canadá
500 IBM EBCDIC - Internacional
932 ANSI/OEM - Shift-JIS japonês
949 ANSI/OEM - Coreano EUC-KR
1250 ANSI - Europa central
1251 ANSI - Cirílico
1252 ANSI - Latim I
1253 ANSI - Grego
1254 ANSI - Turco
1255 ANSI - Hebraico
1256 ANSI - Árabe
1257 ANSI - Báltico
1258 ANSI/OEM - Vietnamita
10000 Mac - Romano
28591 ISO 8859-1 Latim I
28592 ISO 8859-2 Europa Central
28593 ISO 8859-3 Latim 3
28594 ISO 8859-4 Báltico
28595 ISO 8859-5 Cirílico
28596 ISO 8859-6 Árabe
28597 ISO 8859-7 Grego
28599 ISO 8859-9 Latim 5
28605 ISO 8859-15 Latim 9
54936 Chinês simplificado GB18030
65001 Unicode UTF-8
UTF16 Unicode UTF-16
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.