コードページ

Last modified: February 02, 2022

ドキュメントは、Designer Cloud のリリース前に入手可能なため、機能などを事前に確認できます。ここに記載されている内容は、公式リリースまでの間に変更になる場合があります。

コードページ(文字セットまたはエンコーディングとも呼ばれる)は、各文字に数値表現が割り当てられた値のテーブルです。コードページを使用すると、コンピューターは文字を識別してテキストを正しく表示できます。

Alteryx では多くのコードページをサポートしており、入力データツールおよび出力データツールを使用してデータファイルを入出力するときに選択できます。さらに、式エディターのあるツールで使用できる ConvertFromCodepage 関数と ConvertToCodepage 関数は、コードページ識別子を使用して、コードページと Unicode® (Unicode Consortium が開発した、世界中の文字コードの業界規格) 間で文字列を変換できます。

Alteryx では、ワイド (全角) 文字列を Unicode® 文字列、ナロー (半角英数) 文字列を Latin-1 文字列としています。文字列をコードページに変換すると、正しく表示されなくなります。従って、コードページは、ファイル内のテキストエンコーディングの問題を上書きするためにのみ使用する必要があります。コードページは、コンピューターによって異なる場合があります。また、1 台のコンピューターでコードページを変更した場合、データの破損を招くこともあります。エンコーディングに一貫性を持たせるには、ある特定のコードページではなく、UTF-8 や UTF-16 などの Unicode® を使用します。これにより、同じデータストリーム内で異なる言語をエンコードできます。

UTF-8は、任意の文字を格納する最もポータブルでコンパクトな方法であり、最も頻繁に使用されます。UTF-8とUTF-16は両方とも可変幅のエンコーディングですが、UTF-8はASCIIと互換性があり、ファイルはUTF-16よりも小さくなる傾向があります。

コードページの詳細については、MSDN ライブラリを参照してください。

Alteryx は、Linux 上で同じ機能をサポートするために、ICU ライブラリを採用しています。Windows と同じ ID を使用して、ICU による文字コード変換を行います。ICU は Windows のエンコーディングをすべてサポートしているわけではありません。また、あるコードページから別のコードページにデータを変換するときに違いが生じる場合があります。

コードページ識別子

以下のコードページ識別子は、ConvertFromCodepage 関数および ConvertToCodepage 関数とともに使用することができます。サポートしているのは AMP のみです。

ID 説明
37 IBM EBCDIC - 米国/カナダ
500 IBM EBCDIC - インターナショナル
932 ANSI/OEM - 日本語 Shift-JIS
949 ANSI/OEM - 韓国語 EUC-KR
1250 ANSI - 中央ヨーロッパ
1251 ANSI - キリル文字
1252 ANSI - ラテン語I
1253 ANSI - ギリシャ語
1254 ANSI - トルコ語
1255 ANSI - ヘブライ語
1256 ANSI - アラビア語
1257 ANSI - バルト言語
1258 ベトナム語 ANSI/OEM
10000 MAC - ローマン
28591 ISO 8859-1ラテン語I
28592 ISO 8859-2中央ヨーロッパ
28593 ISO 8859-3 ラテン語 3
28594 ISO 8859-4バルト語
28595 ISO 8859-5キリル文字
28596 ISO 8859-6 アラビア語
28597 ISO 8859-7 ギリシャ語
28599 ISO 8859-9 Latin 5
28605 ISO 8859-15ラテン語9
54936 簡体字中国語 GB18030
65001 Unicode UTF-8
UTF16 Unicode UTF-16
このページは役に立ちましたか?

Alteryx 製品のご利用中に何か問題がございましたら、Alteryx コミュニティにアクセスするか、サポートにお問い合わせください。このフォームを送信できない場合E メールでお送りください。