2016年12月09日

ハングルをテキストデータで扱えるか(2)

 オーツが書いた以前のブログ記事
2016.11.5 http://o-tsu.seesaa.net/article/443525135.html
に対する追加記事です。
 98 さんからの情報によると、EmEditor
https://jp.emeditor.com/
で EUC(韓国語)を指定すると、簡単にハングルが扱えるという話です。さっそく EmEditor をダウンロードして Windows パソコンにインストールしてみました。
 Word で作った文書を EmEditor にコピペしてみると、ちゃんとハングルとして読めます。
 EUC(韓国語)では、ハングル部分が2バイト文字で表され、半角文字は普通の(つまり ASCII の)1バイト文字です。というわけで、オーツが使っているプログラムに通すこともできます。
 実際、プログラムを実行させて、出力結果を確認しました。今はテストランの段階ですが、特に問題なくハングルとして読めるようです。
 このプログラム、日本語の全角文字は何とか扱えるように作ってあるので、同じ2バイト文字系ということで問題なく扱えたのかなと思っています。
 オーツの疑問は 98 さんからのご教示により解決しました。
 ありがとうございました。
 もっとも、ハングルを扱うときだけ EmEditor を使うというのもわずらわしいものです。まあ、普段は MIFES、ハングルの時だけ EmEditor という使い分けになりそうです。
続きを読む
posted by オーツ at 07:43| Comment(4) | TrackBack(0) | パソコンとIT | このブログの読者になる | 更新情報をチェックする