2016年12月09日

ハングルをテキストデータで扱えるか(2)

 オーツが書いた以前のブログ記事
2016.11.5 http://o-tsu.seesaa.net/article/443525135.html
に対する追加記事です。
 98 さんからの情報によると、EmEditor
https://jp.emeditor.com/
で EUC(韓国語)を指定すると、簡単にハングルが扱えるという話です。さっそく EmEditor をダウンロードして Windows パソコンにインストールしてみました。
 Word で作った文書を EmEditor にコピペしてみると、ちゃんとハングルとして読めます。
 EUC(韓国語)では、ハングル部分が2バイト文字で表され、半角文字は普通の(つまり ASCII の)1バイト文字です。というわけで、オーツが使っているプログラムに通すこともできます。
 実際、プログラムを実行させて、出力結果を確認しました。今はテストランの段階ですが、特に問題なくハングルとして読めるようです。
 このプログラム、日本語の全角文字は何とか扱えるように作ってあるので、同じ2バイト文字系ということで問題なく扱えたのかなと思っています。
 オーツの疑問は 98 さんからのご教示により解決しました。
 ありがとうございました。
 もっとも、ハングルを扱うときだけ EmEditor を使うというのもわずらわしいものです。まあ、普段は MIFES、ハングルの時だけ EmEditor という使い分けになりそうです。
2016.12.10 追記
 さらにこの問題を追及して、MIFES でもハングルが扱えることがわかりました。
 その話を
http://o-tsu.seesaa.net/article/444759067.html
に書きました。
 よろしければご参照ください。
posted by オーツ at 07:43| Comment(4) | TrackBack(0) | パソコンとIT | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
MIFESをインストールして試してみましたが、確かに思い通りになりませんね。

しかし、秀丸でもハングル2バイト、半角1バイトとして韓国語テキストを扱えます。

私の想像では、MIFESの「韓国語(KS_C_5601-1987)」の単なるバグのように感じます。
メーカーに連絡しておっしゃってみてはいかがでしょうか?
もし直れば、エディタを使い分ける必要もなくなります。

私の想像が外れていたら申し訳ありません。
Posted by 98 at 2016年12月09日 10:00
少し試してみて、これはやはりMIFESのバグかと思われます。

韓国語のテキストをMIFESに貼り付けると、確かにハングルが文字化けしてまともに読めません。しかし、かまわずそれを「韓国語(KS_C_...)」で保存し、できたファイルをEmEditorや秀丸で開いて韓国語として表示させれば正しく元のハングルで表示されます。

このことから、“MIFESは内部的には韓国語のテキストを正しく処理しているのだが、表示の処理に根本的な誤りがある”ということではないかというのが私の推理です。
Posted by 98 at 2016年12月09日 11:37
文字化けした状態で置換を行うこともできました。出現頻度の高いハングルをローマ字か仮名漢字に全置換してみてください。あぶり出しのように当該のハングルの位置が確認できる状態になります。

それにしても韓国語対応を謳っているのにハングルが表示できないのはお粗末ですが、メーカーで動作を確認しておらず、韓国語を扱うユーザーが少ないということか、もしくは、開発者の環境では一般的でない韓国語フォントがインストールされていて問題なく表示される、のどちらかではないかと想像します。
Posted by 98 at 2016年12月09日 12:03
 何回も確認の上コメントをいただき、感謝しております。
 ソフト会社に連絡してみます。
 ありがとうございました。
Posted by オーツ at 2016年12月09日 13:26
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

※ブログオーナーが承認したコメントのみ表示されます。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/444731009
※ブログオーナーが承認したトラックバックのみ表示されます。

この記事へのトラックバック