仮名漢字変換システムを利用した効率化

以前『文字種の変換とフォントの罠』と題した記事で触れたことがあるように、文字にはそれぞれ固有の文字コードが割り当てられています。コンピュータは、文字コードを受け取るとそれを頼りに文字を判断しますから、コンピュータの側としてはコードさえもらえればそれでよいことになります。実際、コードを指定して文字の入力や検索ができるようになっているソフトウェアは意外とたくさんあるものです。

ここで、日本語という言語について考えてみましょう。コンピュータのキーボードには、カタカナや漢字のキーはありません。だからといって、すべての文字をコードで入力するのは非現実的です。そこで考え出されたのが、日本語の読みをローマ字またはかなで入力し、それをひらがな、カタカナ、漢字に変換する方法です。

このような入力方法は仮名漢字変換方式と呼ばれています。そして仮名漢字変換方式のために開発されたのが、一般にFEP (フェップ;Front End Processor の略)と呼ばれる装置です。厳密な意味でのFEPは仮名漢字変換システムだけを指すわけではなく、OSにデータを渡す前に(フロントエンド)それをフックして処理を行う装置のことなのですが、文字を扱う世界で常はFEPといえば仮名漢字変換システムを意味します ※注。

さて、日本語には同音異義語が多いため、FEP での変換には辞書が不可欠です。辞書に入っていない単語を変換したいときなど、ユーザーが自分でその単語を登録して使うこともできるようになっています。登録時には「読み」を指定しますが、この読みは必ずしも本来の読みと一致している必要はありません。よく使う単語や長い文を覚えやすい短い読みで登録しておけば、入力の作業がずいぶんと楽になるのです。

たとえば、ワイルドカード検索に使う文字の範囲や、よく使うウェブサイトのユーザーIDやドキュメントのパスワードなども、辞書に入れることができます。私は([0-9]{1,})という文字列の並びを「すうじ」という読みで登録してあります。これで全角数字の範囲を指定するときに、いちいち全角/半角を切り替えながら条件式を書かなくてすみますし、式を間違えたり忘れたりする心配もありません。

いずれにしても、入力が面倒だと感じる文字列に遭遇したら、FEP の辞書を使えないか考えてみるとよいでしょう。辞書への具体的な登録方法はATOKやIMEなどFEPの種類によって違うため個別に言及はしませんが、よく分からないという方はお使いのFEP の種類を明記した上でお気軽にお問い合わせください。

なお、自分が使っているFEP が何なのかを知るには、Windowsの[スタート]ボタンを出すときと同じようにマウスカーソルを画面の一番下に持っていきます。左端の[スタート]ボタンとはちょうど反対側、つまり右の一番端に時計と一緒に小さなアイコンがいくつか表示されると思います。このアイコンの上にマウスカーソルを合わせると、それぞれのプログラム名がポップアップで出てきます。そこでMS-IMEやATOK10などの文字を拾ってください。

※注 パソコンの環境がMS-DOSからWindowsになって、FEPではなくIME(Input Method Editor)と呼ばれるようになりました。本稿ではMS-IME との混同を避けるためにFEPという表現を使っています。

BACK