文字化け対策


みなさんは、こんな文字見たことありませんか?
古いホームページを見ている時、テキストファイルをExcelに取り込んだ時などに起きがちです、Windowsのメモ帳では、文字は読めるけど、改行されていないデータに出会うこともあります。

 これらは、文字コードと改行コードという2つの約束事が異なる時に起きる症状です。コンピュータで文字を表すには、「文字コード」というもので記録されます。昔、コンピュータが出来た時はアルファベットや数字など100種類程度の文字で良かったのですが、日本語では小学生レベルでも数千字の漢字文字が必要となります。さらに中国の漢字は数万もあって、文字コードはこれら各国への広まりにつれて新しい規格が取り入れられてきました。初期のコンピューターでは英数字だけの「ASCIIコード」、初期のパソコンでは日本語を扱える「Shift-JISコード」、電子メールなど各国の文字情報が混在するものは「ISO-XXXX」、最近のWindows/Mac等では「UTF-8/16コード」といった具合です。

さらにもう一つ、「改行コード」というのもあって、これはコードの種類としては2種類。
CR:carriage return(行末から行頭に戻す「復帰」)、LF:line feed(狭義の「改行」)
その組み合わせとしては、混在を含めて3種類もあります。メモ帳で改行が消える時は、これが原因です。
CRLF(Windows)、CRのみ(Mac)、LFのみ(Unix)

この対策としてお勧めは、下記の2つです。
・エディタという文字編集アプリを導入して、文字コード等を自動判別・変更させる。
 私は、WindowsではTeraPad、Macではmiというアプリを使っています。
・ネットでいろいろある「文字コード変換サイト」を利用する「文字コード変換」で検索。
 例えば、こんなサイトなど。
特に前者のエディタは、facebookのコメントで「間違って改行を押して登録!」なんて時の対策にもなるので、日頃から入れて使われることをお勧めします。