コードページ

バージョン:
2023.1
Last modified: January 31, 2023

コードページ(文字セットまたはエンコーディングとも呼ばれる)は、各文字に数値表現が割り当てられた値のテーブルです。コードページを使用すると、コンピュータは文字を識別してテキストを正しく表示できます。

Alteryxは、データ入力ツールおよびデータ出力ツールを介してデータファイルを入出力する際、あるいは Blob 変換ツールを使用してデータ型を変換する際に選択できるコードページを多数サポートしています。さらに、式エディタを持つツールで使用できる ConvertFromCodepage 関数と ConvertToCodepage 関数は、コードページ識別子を使用して、複数のコードページと Unicode® (ユニコードコンソーシアムが作成したすべての文字の汎用文字エンコーディング標準) の間で文字列を変換できます。

Alteryx では、ワイド (全角) 文字列は Unicode® 文字列であり、ナロー (半角英数) 文字列は Latin 1 の文字列であるという前提で扱います。文字列を別のコードページに変換すると、正しく表示されません。従って、コードページは、ファイル内のテキストエンコーディングの問題を上書きするためにのみ使用する必要があります。コードページは、コンピュータの種類により異なる場合があり、同じコンピュータの上でも変更される場合があります。データの破損を招くこともあります。最も一貫性のある結果を得るには、特定のコードページではなく、UTF-8 や UTF-16 エンコードなどの Unicode® を使用します。これにより、同じデータストリーム内で異なる言語をエンコードできます。

UTF-8 は、任意の文字を格納できる最もポータブルでコンパクトな方法であり、最も広く使用されています。UTF-8とUTF-16は両方とも可変幅のエンコーディングですが、UTF-8はASCIIと互換性があり、ファイルはUTF-16よりも小さくなる傾向があります。

コードページの詳細な情報については、MSDN ライブラリを参照してください。

Linux で同じ機能をサポートするために、Alteryx は ICU ライブラリを採用しています。Windows 上と同じ ID を使用し、ID を文字列 ICU コンバータに変換します。ICU は Windows エンコーディングの全リストをサポートしておらず、異なるコードページ間でデータを変換するときに差分が生じる可能性があります。

コードページ識別子

これらのコードページ識別子は、 ConvertFromCodepage 関数および ConvertToCodepage 関数でサポートされます。詳細については、関数を参照してください。

ID 説明 サポート
37 IBM EBCDIC - 米国/カナダ 従来のエンジンと AMP エンジン。
500 IBM EBCDIC - インターナショナル 従来のエンジンと AMP エンジン。
932 ANSI/OEM - 日本語 Shift-JIS 従来のエンジンと AMP エンジン。
949 ANSI/OEM - 韓国語 EUC-KR 従来のエンジンと AMP エンジン。ダウンロードと Blob Convert ではサポートされていません。
1250 ANSI - 中央ヨーロッパ 従来のエンジンと AMP エンジン。
1251 ANSI - キリル文字 従来のエンジンと AMP エンジン。
1252 ANSI - ラテン語I 従来のエンジンと AMP エンジン。
1253 ANSI - ギリシャ語 従来のエンジンと AMP エンジン。
1254 ANSI - トルコ語 従来のエンジンと AMP エンジン。
1255 ANSI - ヘブライ語 従来のエンジンと AMP エンジン。
1256 ANSI - アラビア語 従来のエンジンと AMP エンジン。
1257 ANSI - バルト言語 従来のエンジンと AMP エンジン。
1258 ベトナム語 ANSI/OEM 従来のエンジンと AMP エンジン。
10000 MAC - ローマン 従来のエンジンと AMP エンジン。
28591 ISO 8859-1ラテン語I 従来のエンジンと AMP エンジン。
28592 ISO 8859-2中央ヨーロッパ 従来のエンジンと AMP エンジン。
28593 ISO 8859-3 ラテン語 3 従来のエンジンと AMP エンジン。
28594 ISO 8859-4バルト語 従来のエンジンと AMP エンジン。
28595 ISO 8859-5キリル文字 従来のエンジンと AMP エンジン。
28596 ISO 8859-6 アラビア語 従来のエンジンと AMP エンジン。
28597 ISO 8859-7 ギリシャ語 従来のエンジンと AMP エンジン。
28598 ISO 8859-8 ヘブライ語: 視覚的順序 従来のエンジン。
28599 ISO 8859-9 Latin 5 従来のエンジンと AMP エンジン。
28605 ISO 8859-15 Latin 9 従来のエンジンと AMP エンジン。
54936 簡体字中国語 GB18030 従来のエンジンと AMP エンジン。ダウンロードツールと Blob 変換ツールではサポートされていません。
65001 Unicode UTF-8 従来のエンジンと AMP エンジン。
1200 Unicode UTF-16 従来のエンジンと AMP エンジン。
このページは役に立ちましたか?

Alteryx 製品のご利用中に何か問題がございましたら、Alteryx コミュニティにアクセスするか、サポートにお問い合わせください。このフォームを送信できない場合E メールでお送りください。