単語の読みがなを校正しよう(1)


csv形式のファイルから単語を抽出するために、Jeditで不要なフィールドを削除をしたものをカットしてExcelにペーストするとレコードが少なくなってしまうという、いきなり訳のわからないトラブル(?)に見舞われているのであります。


 「??? なんで数が少なくなっちゃうんだろう……?」


と膨大な量のテキストデータをテキストやExcelにさんざん切ったり、貼ったりしまくった挙げ句、


 「これは自分のやり方が悪いんじゃなくて、たんにデータの作製方法がよろしくないのだ」


という結論に達したのであります。

なもんで、支給されたcsvデータを検証したところ、フィールド内にダブルクオーテーションが入っている箇所を発見し、それを削除したらレコードが少なくなることもなく、さくっとExcelに貼りつけOKに。


 「なーんだ、こんなことかよー」


んまあ、結果論といいますか原因さえわかってしまえば笑いごとですが、ここまでくるのにすでに半日が経過してしまっているわけです。


 「んまあ、おいらDB初心者だし……」


なんて自分をなぐさめつつ、引き続き単語の読みがなを取得するための検証にとりかかるのでありました。