コードページ
コードページ(文字セットまたはエンコーディングとも呼ばれる)は、各文字に数値表現が割り当てられた値のテーブルです。 コードページを使用すると、コンピュータは文字を識別してテキストを正しく表示できます。
Alteryx を介してデータファイルを入力および出力するときに選択できる多くのコードページをサポートしています。 データ入力ツール および 出力データツールを使用してデータ型を変換する場合、または Blob変換ツール。 また、 式エディタを持つツール内で使用できる ConvertFromCodepage および ConvertToCodepage 関数は、コードページ識別子を使用して、コードページと Unicode ®エンコーディングの間で文字列を変換することができ、ユニバーサルUnicode コンソーシアムによって作成されたすべての文字の文字エンコード標準。
Alteryx は、ワイド文字列が Unicode ®文字列で、狭い文字列がラテン1文字列であることを前提としています。 文字列をコードページに変換しても、正しく表示されません。 従って、コードページは、ファイル内のテキストエンコーディングの問題を上書きするためにのみ使用する必要があります。 コードページは、異なるコンピュータでは異なる場合があります。また、1台のコンピュータでANSIコードページを変更した場合、データの破損を招くこともあります。 最も一貫性のある結果を得られるように、特定のコードページではなく、utf-8 や utf-16 などの Unicode ®エンコーディングを使用して、同じデータストリーム内で異なる言語をエンコードできます。
utf-8 は、文字を格納するための最もポータブルでコンパクトな方法であり、最も頻繁に使用されます。 UTF-8とUTF-16は両方とも可変幅のエンコーディングですが、UTF-8はASCIIと互換性があり、ファイルはUTF-16よりも小さくなる傾向があります。
詳細については コードページでは、MSDN ライブラリを参照してください。
これらのコードページ識別子は、ConvertFromCodepageおよび ConvertToCodepage 関数で使用できます。 参照: 関数
37(IBM EBCDIC - 米国/カナダ)
437(OEM - 米国)
500(IBM EBCDIC - インターナショナル)
708(アラビア語 - ASMO)
720(アラビア語 - 透明ASMO)
737(OEM - ギリシャ語437G)
775(OEM - バルト語)
850(OEM - 多言語ラテン語I)
852(OEM - ラテン語II)
855(OEM - キリル文字)
857(OEM - トルコ語)
858(OEM - 多言語ラテン語I +ユーロ)
860(OEM - ポルトガル語)
861(OEM - アイスランド語)
862(OEM - ヘブライ語)
863(OEM - カナダ系フランス語)
864(OEM - アラビア語)
865(OEM - ノルウェー語)
866(OEM - ロシア語)
869(OEM - 現代ギリシャ語)
870 (IBM EBCDIC-多言語/ROECE (ラテン語-2))
874(ANSI / OEM - タイ語)
875(IBM EBCDIC - 現代ギリシャ語)
932(ANSI/OEM - 日本語Shift-JIS)
936(ANSI / OEM - 簡体字中国語GBK)
949(ANSI / OEM - 韓国語)
950(ANSI / OEM - 繁体字中国語Big5)
1026 (IBM EBCDIC-トルコ語 (ラテン-5))
1047(IBM EBCDIC - ラテン語-1 / オープンシステム)
1140 (IBM EBCDIC-米国カナダ (37 + ユーロ))
1141 (IBM EBCDIC-ドイツ (20273 + ユーロ))
1142 (IBM EBCDIC-デンマーク/ノルウェー (20277 + ユーロ))
1143 (IBM EBCDIC-フィンランド/スウェーデン (20278 + ユーロ))
1144 (IBM EBCDIC-イタリア (20280 + ユーロ))
1145 (IBM EBCDIC-ラテンアメリカ/スペイン (20284 + ユーロ))
1146 (IBM EBCDIC-イギリス (20285 + ユーロ))
1148 (IBM EBCDIC-国際 (500 + ユーロ))
1149 (IBM EBCDIC-アイスランド語 (20871 + ユーロ))
1250(ANSI - 中央ヨーロッパ)
1251(ANSI - キリル文字)
1252(ANSI - ラテン語I)
1253(ANSI - ギリシャ語)
1254(ANSI - トルコ語)
1255(ANSI - ヘブライ語)
1256(ANSI - アラビア語)
1257(ANSI - バルト語)
1258(ANSI / OEM - ベトナム)
1361(韓国語 - ジョハブ)
10000(MAC - ローマ字)
10001(MAC - 日本語)
10002(MAC - 繁体字中国語Big5)
10003(MAC - 韓国語)
10004(MAC - アラビア語)
10005(MAC - ヘブライ語)
10006(MAC - ギリシャ語I)
10007(MAC - キリル文字)
10008(MAC - 簡体字中国語GB 2312)
10010(MAC - ルーマニア)
10017(MAC - ウクライナ)
10021(MAC - タイ語)
10029(MAC - ラテン語II)
10079(MAC - アイスランド語)
10081(MAC - トルコ語)
10082(MAC - クロアチア)
20000(CNS - 台湾)
20001(TCA - 台湾)
20002(Eten - 台湾)
20003(IBM5550 - 台湾)
20004(TeleText - 台湾)
20005(Wang - 台湾)
20105(IA5 IRV国際アルファベットNo.5)
20106(IA5ドイツ語)
20107(IA5スウェーデン語)
20108(IA5ノルウェー語)
20127(US-ASCII)
20261(T.61)
20269(ISO 6937ノンスペーシングアクセント)
20273(IBM EBCDIC - ドイツ)
20277(IBM EBCDIC - デンマーク/ノルウェー)
20278(IBM EBCDIC - フィンランド/スウェーデン)
20280(IBM EBCDIC - イタリア)
20284(IBM EBCDIC - ラテンアメリカ/スペイン)
20285(IBM EBCDIC - 英国)
20290(IBM EBCDIC - 日本語カタカナ拡張版)
20297(IBM EBCDIC - フランス)
20420(IBM EBCDIC - アラビア語)
20423(IBM EBCDIC - ギリシャ語)
20424(IBM EBCDIC - ヘブライ語)
20833(IBM EBCDIC - 韓国語拡張)
20838(IBM EBCDIC - タイ語)
20866(ロシア語 - KOI8)
20871(IBM EBCDIC - アイスランド語)
20880 (IBM EBCDIC-キリル文字 (ロシア語))
20905(IBM EBCDIC - トルコ語)
20924 (IBM EBCDIC-ラテン-1/オープンシステム (1047 + ユーロ))
20932日本語 (JIS 0208-1990 および 0212-1990)
20936(簡体字中国語GB2312)
21025 (IBM EBCDIC-キリル文字 (セルビア語、ブルガリア語))
21027(Extアルファ小文字)
21866(ウクライナ語 - KOI8-U)
28591(ISO 8859-1ラテン語I)
28592(ISO 8859-2中央ヨーロッパ)
28593(ISO 8859-3ラテン語3)
28594(ISO 8859-4バルト語)
28595(ISO 8859-5キリル文字)
28596(ISO 8859-6アラビア語)
28597(ISO 8859-7ギリシャ語)
28598 (ISO 8859-8 ヘブライ語: 視覚的な順序)
28599(ISO 8859-9ラテン語5)
28603(ISO 8859-13ラテン語7)
28605(ISO 8859-15ラテン語9)
38598 (ISO 8859-8 ヘブライ語: 論理的な順序)
50220(ISO-2022半角カタカナを使用しない日本語)
50221(ISO-2022半角カタカナを使用する日本語)
50222(ISO-2022日本語JIS X 0201-1989)
50225(ISO-2022韓国語)
50227(ISO-2022簡体字中国語)
50229(ISO-2022繁体字中国語)
51949(EUC-韓国語)
52936(HZ-GB2312簡体字中国語)
54936(GB18030簡体字中国語)
57002(ISCII - デーヴァナーガリー)
57003(ISCII - ベンガル語)
57004(ISCII - タミル)
57005(ISCII - テルグ)
57006(ISCII - アッサム)
57007(ISCII - オリヤー)
57008(ISCII - カンナダ)
57009(ISCII - マラヤーラム)
57010(ISCII - グジャラト)
57011 (ISCII-パンジャブ語 (グルムキー))
65000(UTF-7)
65001(UTF-8)