Páginas de código
A documentação estará disponível antes do lançamento do Designer Cloud para que você possa dar uma olhadinha. Este conteúdo pode mudar até o lançamento oficial.
Uma Página de código (também chamada de Conjunto de caracteres ou Codificação) é uma tabela de valores na qual cada caractere foi atribuído a uma representação numérica. Uma página de código possibilita que um computador identifique os caracteres e exiba o texto corretamente.
A Alteryx oferece suporte a muitas páginas de código que você pode selecionar ao inserir e enviar arquivos de dados por meio do ferramenta de dados de entrada e ferramenta dados de saída. Além disso, as funções do ConvertFromCodepage
e ConvertToCodepage
(disponíveis nas ferramentas que possuem um editor de expressões), podem usar os identificadores de página de código para converter cadeias de caracteres em páginas de código e Unicode®, o padrão universal de codificação para todos os caracteres escritos, conforme criado pelo Consórcio Unicode.
A Alteryx assume que uma cadeia de caracteres ampla é uma cadeia de caracteres Unicode®, e uma cadeia de caracteres estreita é uma cadeia de caracteres Latin 1. Se você converter uma cadeia de caracteres em uma página de código, ela não será exibida corretamente. Portanto, as páginas de código só devem ser usadas para substituir problemas de codificação de texto em um arquivo. As páginas de código podem variar em computadores diferentes ou podem ser alteradas para um único computador, levando à corrupção dos dados. Para obter resultados mais consistentes, use Unicode®, como codificação UTF-8 ou UTF-16, em vez de uma página de código específica, que permite a codificação de diferentes idiomas no mesmo fluxo de dados.
UTF-8 é a forma mais portátil e compacta de guardar qualquer caractere, e é utilizada com mais frequência. Tanto UTF-8 quanto UTF-16 são codificações de largura variável, mas UTF-8 é compatível com ASCII e os arquivos tendem a ser menores do que com UTF-16.
Para obter mais informações sobre páginas de código, visite a Biblioteca MSDN.
Para suportar a mesma funcionalidade no Linux, a Alteryx emprega a biblioteca ICU. Usamos as mesmas IDs que estão no Windows, transformando-as em conversoras de cadeia de caracteres de ICU-os em conversores de ICU de string. A ICU não suporta toda a lista de codificações do Windows ou pode haver diferenças ao converter os dados de uma página de código para outra.
Identificadores de página de código
Esses identificadores de página de código são suportados pelas funções ConvertFromCodepage
e ConvertToCodepage
. O suporte ocorre somente por meio de AMP.
ID | Descrição |
37 | IBM EBCDIC - EUA/Canadá |
500 | IBM EBCDIC - Internacional |
932 | ANSI/OEM - Shift-JIS japonês |
949 | ANSI/OEM - Coreano EUC-KR |
1250 | ANSI - Europa central |
1251 | ANSI - Cirílico |
1252 | ANSI - Latim I |
1253 | ANSI - Grego |
1254 | ANSI - Turco |
1255 | ANSI - Hebraico |
1256 | ANSI - Árabe |
1257 | ANSI - Báltico |
1258 | ANSI/OEM - Vietnamita |
10000 | Mac - Romano |
28591 | ISO 8859-1 Latim I |
28592 | ISO 8859-2 Europa Central |
28593 | ISO 8859-3 Latim 3 |
28594 | ISO 8859-4 Báltico |
28595 | ISO 8859-5 Cirílico |
28596 | ISO 8859-6 Árabe |
28597 | ISO 8859-7 Grego |
28599 | ISO 8859-9 Latim 5 |
28605 | ISO 8859-15 Latim 9 |
54936 | Chinês simplificado GB18030 |
65001 | Unicode UTF-8 |
UTF16 | Unicode UTF-16 |