文字コードの解析、変換(エンコード、デコード)
文字コードの変換や解析を行います。
文字化けを起こしたメッセージを読みたいときなどに効果があります。
文字種によってはHTMLで表記できない場合や、このページソースで取得しないといけない場合など、正しく変換できない場合があります。
デコードの場合、変換前文字種を指定し、変換後文字種は通常「sjis」を指定する。
エンコードの場合、変換前文字種「なし」で変換後文字種を指定する。
正しく変換されない場合のみ、変換前文字種を変更する。
デコードの場合、最大入力文字数は 1000 字です。
ただしエンコードの場合の最大入力文字数は 80 字です。
よく使われる文字コードの特徴を説明しておきます。
【デコード時の設定方法】
jisコード→「$B$"$$$&$($*(B」
→変換前文字種:「jis」
→変換後文字種:「sjis」
eucコード→「、「、、、ヲ、ィ、ェ」
→変換前文字種:「euc-jp」
→変換後文字種:「sjis」
utf-8コード→「縺ゅ>縺・∴縺・」
→変換前文字種:「utf-8」
→変換後文字種:「sjis」
base64コード→「gqCCooKkgqaCqA==」
→変換前文字種:「base64_decode」
→変換後文字種:「sjis」
qprintコード→「=82=A0=82=A2=82=A4=82=A6=82=A8」
→変換前文字種:「qprint_decode」
→変換後文字種:「sjis」
urlエンコード→「%82%A0%82%A2%82%A4%82%A6%82%A8」
→変換前文字種:「urldecode」
→変換後文字種:「sjis」
メールヘッダー→「=?ISO-2022-JP?B?GyRCJCIkJCQmJCgkKhsoQg==?=」
→変換前文字種:「imaphead_decode」
→変換後文字種:「sjis」
メール本文→「=?ISO-2022-JP?B?GyRCJCIkJCQmJCgkKhsoQg==?=」
→変換前文字種:「decode_mime」
→変換後文字種:「sjis」
escapeコード→「%u3042%u3044%u3046%u3048%u304A」
このコードの場合は、
→文字コードの解析、変換(ISO-Latin-1)
- 【 変換結果 】