HarmonyでサポートされているEncoding一覧
Encoding | 備考 | ||
文字集合と 文字符号化 が一体化 |
文字符号化 | ||
Big5 | Big5(中国語名:大五碼あるいは五大碼)は、繁体字中国語の文字コード(文字集合)で、台湾・香港・マカオといった繁体字圏で最も一般的に使われている。 Big5は文字集合と符号化方式が一体化している。 | ||
Big5-HKSCS | |||
CESU-8 | UTF-8 はサロゲートペアを1個の32bit値に変換して、その32bit値を4個の8bit値に変換する正規の符号化です。 一方 CESU-8 はサロゲートペアを2個の16bit値のまま、それぞれを3個の8bit値に変換する符号化です。 古いアプリケーションの互換性用に用意された符号化です。 | ||
EUC-JP | EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)は日本語の文字を扱う場合に利用されてきた符号化方式のひとつである。 | ||
EUC-KR | 朝鮮語向けのISO/IEC 2022のサブセットで8ビット符号の拡張法を用いている、EUCの一種。 | ||
GB18030 | GB 18030は、中華人民共和国(中国)が制定した文字コード(文字セット)の国家規格である。簡体字のほか、Unicodeに含まれる繁体字や日本、韓国などで使われる漢字をも含む。 | ||
GB2312 | 中華人民共和国の国家規格として定められた簡体字中国語の符号化文字集合 | ||
GBK | GBK は、中華人民共和国で使われている簡体字用の文字コード GB 2312 の拡張版である | ||
IBM-Thai | |||
IBM00858 | |||
IBM00863 | |||
IBM00864 | |||
IBM00865 | |||
IBM00866 | |||
IBM00868 | |||
IBM00869 | |||
IBM00870 | |||
IBM00871 | |||
IBM00918 | |||
IBM001140 | |||
IBM001141 | |||
IBM001142 | |||
IBM001143 | |||
IBM001145 | |||
IBM001146 | |||
IBM001147 | |||
IBM001148 | |||
IBM001149 | |||
IBM037 | |||
IBM0126 | |||
IBM0147 | |||
IBM273 | |||
IBM277 | |||
IBM278 | |||
IBM280 | |||
IBM284 | |||
IBM285 | |||
IBM290 | |||
IBM297 | |||
IBM420 | |||
IBM424 | |||
IBM437 | |||
IBM500 | |||
IBM775 | |||
IBM850 | |||
IBM852 | |||
IBM855 | |||
IBM857 | |||
IBM860 | |||
IBM861 | |||
IBM862 | |||
ISO-2022-CN | 複数の言語文字(文字集合)を切り替えて利用するISO-2022のサブセット規格で、支那語文字コードの符号化を規定した仕様。支那語環境のIRCや電子メールなどで使われることがある。 | ||
ISO-2022-JP | ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする。俗に「JISコード」と呼ばれることもある。 | ||
ISO-2022-JP-2 | |||
ISO-2022-KR | |||
ISO-8859-1 | ISO/IEC 8859は、ISOとIECによって規定された文字集合の規格で、8ビットで文字が表現されるうちの右半分(GR領域)用に用意されたシングルバイト文字コード。ISO/IEC
8859には複数の種類が存在しており、枝番によって区別される。 (Latin-1) 西欧言語 |
||
ISO-8859-13 | (Latin-7) バルト海沿岸地域を網羅するISO/IEC 8859-10(Latin-6)の後継 | ||
ISO-8889-15 | (Latin-9) 西欧言語でISO/IEC 8859-1(Latin-1)の後継 | ||
ISO-8859-2 | (Latin-2) 東欧言語 | ||
ISO-8859-3 | (Latin-3) その他のラテン文字言語 | ||
ISO-8859-4 | (Latin-4) 北欧言語 (既に古い仕様) | ||
ISO-8859-5 | |||
ISO-8859-6 | |||
ISO-8859-7 | |||
ISO-8859-8 | |||
ISO-8859-9 | |||
JIS_X0201 | JIS X 0201はラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合よりなっている。規格名称は7ビット及び8ビットの情報交換用符号化文字集合。名称が示す通り、7ビット符号と8ビット符号での運用が予定されている。 ASCIIと比較すると2文字が異なっており、92番の文字にバックスラッシュ ('\') の替わりに円記号 ('¥') が、126番にチルダ ('~') の替わりにオーバーライン ('‾') が割り当てられている。初版は1969年6月1日の制定 | ||
JIS_X0212-1990 | ・ JIS X 0212は、JIS X 0208:1983に含まれない文字を集めた、6067字の符号化文字集合を規定するJIS である。1990年10月1日に制定され、JIS
X 0208と組み合わせて利用される。 JIS X 0208との重複はない。 JIS補助漢字の通称がある。 ・ 国文学研究資料館の書誌データベース構築における研究成果に基づいた文字選定を行っており、学問研究向きの文字集合となっている。 |
||
KOI8-R | KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。 | ||
KOI8-U | KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。 | ||
Shift_JIS | Shift_JISは、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ1997年にJIS X 0208で標準化された。 | ||
TIS-620 | |||
US-ASCII | |||
UTF-16 | |||
UTF-16BE | |||
UTF-16LE | |||
UTF-32 | |||
UTF-32BE | |||
UTF-32LE | |||
UTF-8 | |||
windows-1250 | |||
windows-1251 | |||
windows-1252 | |||
windows-1253 | |||
windows-1254 | |||
windows-1255 | |||
windows-1256 | |||
windows-1257 | |||
windows-1258 | Windows-1258 is a code page used in Microsoft Windows to represent Vietnamese texts. Windows-1258 is compatible with neither the Vietnamese standard (TCVN 5712 / VSCII), nor the various other encodings in use in practice (VISCII, VNI, VPS). | ||
windows-31j | JIS X 0201とJIS X 0208からなるShift_JISに、独自の拡張文字を追加した文字コード(CCS)と文字コードの符号化方法(CES)である。 | ||
x-Big5-HKSCS-2001 | |||
x-Big5-Solaris | |||
x-euc-jp-linux | |||
x-EUC-TW | |||
x-eucJP-Open | |||
x-IBM1006 | |||
x-IBM1025 | |||
x-IBM1046 | |||
x-IBM1097 | |||
x-IBM1098 | |||
x-IBM1112 | |||
x-IBM1122 | |||
x-IBM1123 | |||
x-IBM1124 | |||
x-IBM1166 | |||
x-IBM1364 | |||
x-IBM1381 | |||
x-IBM1383 | |||
x-IBM300 | |||
x-IBM33722 | |||
x-IBM737 | |||
x-IBM833 | |||
x-IBM834 | |||
x-IBM856 | |||
x-IBM874 | |||
x-IBM875 | |||
x-IBM921 | |||
x-IBM922 | |||
x-IBM930 | |||
x-IBM933 | |||
x-IBM935 | |||
x-IBM937 | |||
x-IBM939 | |||
x-IBM942 | |||
x-IBM942C | |||
x-IBM943 | |||
x-IBM943C | |||
x-IBM948 | |||
x-IBM949 | |||
x-IBM949C | |||
x-IBM950 | |||
x-IBM964 | |||
x-IBM970 | |||
x-ISCII91 | |||
x-ISO-2022-CN-CNS | |||
x-ISO-2022-CN-GB | |||
x-iso-8859-11 | |||
x-JIS0208 | |||
x-JISAutoDetect | |||
x-Johab | |||
x-MacArabic | |||
x-MacCentralEurope | |||
x-MacCroation | |||
x-MacCyrillic | |||
x-MacDingbat | |||
x-MacGreek | |||
x-MacHebrew | |||
x-MacIceland | |||
x-MacRoman | |||
x-MacSymbol | |||
x-MacThai | |||
x-MacTurkish | |||
x-MacUkraine | |||
x-MS932-0213 | |||
x-MS950-HKSCS | |||
x-MS950-HKSCS-XP | |||
x-mswin-936 | |||
x-PCK | |||
x-SJIS_0213 | |||
x-UTF-16LE-BOM | |||
x-UTF-32BE-BOM | |||
x-UTF-32LE-BOM | |||
x-windows-50220 | |||
x-windows-50221 | |||
x-windows-874 | |||
x-windows-949 | |||
x-windows-950 | |||
x-windows-iso2022jp | |||