2012年04月25日

メールの文字コードの問題と保存しておいたメールが読めなくなる問題

 最近は、メールで UTF-8 でエンコードされたものが増えました。
 いや、そもそも、自分のメールの文字コードが何であるのか、ほとんど意識していない人も多いようです。
 しかし、オーツの場合は、メールのコードに敏感です。なぜならば、エディタでメールを読んでいるからです。
 読んだメールを個人ごとに一つのファイルにして、その先頭に追加していくようにしています。
 このあたりのやり方は、以前にもブログで書きました。
2010.6.3 http://o-tsu.seesaa.net/article/151966736.html
 最近、気がついたのですが、いくつかのファイル(中身が数百通のメール)を読んで見ると、下の方(つまり昔のメール)が文字化けを起こし、読めなくなっているものがありました。一つのファイル中にシフトJISと UTF-8 のメールが混在してしまったのです。エディタは、文字コードが何であれ、ファイルの内容が読めます。それらの間をコピペで文字列を移動させることもできます。しかし、オーツがどこかで操作を間違えたのだろうと思います。たぶん、シフトJISのファイルを開いて UTF-8 の本文をペーストしたか、その逆をしたと思われます。どこかで1回ミスをすると、それまで受信し蓄積してきたその人のメールが全部読めなくなってしまいます。その結果、メールの検索ができないことになり、大変不便です。
 もしかすると、オーツのミスでないかもしれません。中には、本文中にシフトJIS(本来はJISコードなのですが、メールソフトが勝手にシフトJISに変換してしまいます)と UTF-8 を混在させたようなメールがあったりするのです。メールソフトによっては、受信メールを引用して追記したりするとこうなる場合があるようです。
 ファイル全体が文字化けを起こすと大問題です。当該の人とのそこまでのメールの記録が全部失われるのと同じことですから、大きなダメージです。
 厳密に言えば、文字化けしているメールを取り出して、文字コード変換をすれば読めると思いますが、そういう操作が面倒に思います。
 そもそもオーツの流儀でファイルにメールを蓄積していくのは、以前のやりとりをメールソフトを使わずに確認するためです。それができなくなってしまうと、オーツの流儀のメリットが失われてしまいます。
 困ってしまいました。
 とうとうオーツ流メール術を捨てざるをえない日がやってきたようです。
2012.5.21 追記
 この話の続きを
http://o-tsu.seesaa.net/article/270847535.html
に書きました。
 よろしければご参照ください。
posted by オーツ at 04:28| Comment(3) | TrackBack(0) | パソコンとIT | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
 私もならってオーツ流メール術を長年実践しています。メールを保存する方法によりますが、テキストファイルに保存したあとで文字コードを復元というのはうまく行かないこともあると思いますので、新しいメールを書き足す前に「nkf -s mail_utf > mail_sjis」などによって文字コードを統一するのがよいのではないでしょうか? そんな手が使えない方法で処理なさっているのでしたら無意味なコメントとなり、申し訳ありません。
Posted by 98 at 2012年04月25日 06:27
98 様
 テキストファイルに保存した後でも、その部分をコピーして他のファイルにペーストして保存し、別の文字コードとして開いてみると、読める場合が大半のようです。
 nkf コマンドの利用も一つの手ですが、今のところ、数十通の受信メールが入ったメールボックスを1個のファイルとしてエディタでオープンしているので、この方法は実用的ではありません。
 オーツの場合は、単純にエディタで文字コードの変換を行っています。
 utf-8 のファイルを読み込み、別のシフトJISのファイルを開き、その状態で前者から後者へコピペすると、文字コードを変換してくれます。
 メール保存ファイルの先頭に追加するということは、つまりはコピペをしていることになりますので、自動的に文字コード変換を行っていることになります。
 受信ボックス全体を nkf で処理して、ファイル全部をシフトJISにしてしまうのも一つの方法ですが、utf-8 でないと読めないような内容のメールを送ってくる場合もあるので、そういう単純なやり方で大丈夫かどうか、心配が残ります。
Posted by オーツ at 2012年04月25日 07:47
浅知恵で無意味なコメントをしてしまい、失礼しました。

私は保存時にShift_JISに統一しています。本当はUnicodeにしたいのですが、そのための変更作業がおっくうでなかなか実行できません。
Posted by 98 at 2012年04月25日 17:24
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。

この記事へのトラックバック