2014年9月7日日曜日

PC小ネタ:日本語入力とうまく付き合うには

 最近は「家電」のひとつとしてなじんでしまった感のあるパーソナルコンピューター(パソコン/PC)ですが、いまひとつ日本語入力の漢字変換が使いづらい、といった声が良く聞かれます。
実際、日本語変換ルーティンや学習機能に難があって使いにくい製品もないとは言えません。
中にはユーザー意見を取り入れながら改良中、といったものもあります。

しかし実は、ユーザー自身が変換辞書を「腐らせている」ケースもあるのです。


<変換が「腐る」わけ>

 一般的に入力ミスをしてしまった場合、誤った文字(列)を削除してから正しい文字を入力します。
一部の日本語入力システムなら、文字列を確定する前に Esc キーなどを押して文字列全体を削除してしまう手もあるでしょう。

 しかしユーザーの中には、「確定してからもう一度打ち直せばいいだろう」と思って誤った文字列をそのまま確定してしまう人も多いようですが、これが思い違いの元。

多くの日本語入力エンジンでは、日本語の係り受けを「文字列を入力確定した時点」で単語や係り受けなどを学習してしまいます。
この動作は携帯端末にある「予測変換機能」でも同様です。
場合によっては直前の変換内容も記憶しておき、その内容と連動させて変換内容を変えるものもあるようです。

そういった複雑な処理が行われるため、誤った入力ばかりを繰り返していると「間違った日本語を連発する不慣れな外国の人」のようなおかしな日本語変換辞書が出来上がってしまうのです。
しかもどうやら一部の入力エンジンではこういった誤変換学習を強めやすい設計になっているらしく、単漢字・記号変換や文章の部分訂正を繰り返すとごく短時間で辞書を腐らす事ができるようです。

これが個人所有の端末ならば「自業自得」ですので特にどうということもないですが、会社や学校などにある共有端末の場合だと笑ってもいられません。
自身の誤った辞書学習のせいで、その他大勢が迷惑する可能性もあるのです。
場合によっては、これが原因で組織間や人間間のトラブルに発展するかもしれません。

ですので、原則としては「丁寧に日本語入力する」ように努めるのが基本となります。
  1. 漢字変換前に入力ミスを見つけたら、確定しないで入力しなおす
  2. 漢字確定後にミスを見つけたら、送り仮名も含めてすべて削除してから入力しなおす
  3. ひらがなのみ、カタカナのみ、英数字のみを入力する場合はうかつに漢字変換しない
  4. ユーザー辞書機能にはどうしても使いたい単語や人名地名などのみを、正しい品詞設定で登録する
  5. 単漢字変換による記号変換は極力避ける
  6. Windows OS 標準の入力エンジンの場合、可能な限り長文で変換する。もし文節ごとに区切って入力したい場合は、必ず「前後の文脈を参照する」設定にしておく。また特に学習させたい係り受け関係がある場合に限り複数文節を一気に変換する
1と2はこれまでに書いたとおりです。
本来なら係り受けも含めて入力しなおすのが理想ですが、正直そこまでやるのは骨が折れるのであまりお勧めしません。

 3と4は、変な漢字変換候補を辞書に学習させないようにするための工夫です。
巷ではよく口語体の変語(「ふいんき」、「うるおぼえ」、「シュミレート」などなど)を素面で変換入力してしまう人がいます。

しかしこれらを無理矢理変換してしまうと、日本語入力ソフトは「新語なのかな?」と素直に判断して変換登録してしまいます。
また、場合によっては誤った変換結果を「新語」として辞書登録してしまうこともあり得ます。
誤った文章を入力しやすくなるだけでなく恥をかいてしまう事態になってしまうことも考えられますので、本当に正しい日本語なのかどうかを意識して入力する事が必要です。

もちろん、ユーザーが辞書登録する単語などについても内容を吟味しておく必要があります。
システムによってはユーザー登録した単語を最優先して表示する仕様になっていることもあるので、むやみに辞書登録していると誤変換を誘発しやすくなります。
ユーザー辞書などに登録する単語は、変換できない人名地名やよく使う取引先、あるいは文章を入力する際に頻出する造語や新語など、「どうしても必要な文字列」に限定しましょう。

ちなみに、Windows 標準のシステムだと「人名/地名優先」に切り替えることで人名や地名に関する変換候補が増えるようになっています。
また、どうしても話し言葉で入力したい人は「話し言葉優先」に切り替えると口語体で入力しやすくなります。
なお、システム辞書をバージョンアップすると新語などが追加される場合もあります。


 5は、変な位置で文節が区切られたり普通の文章に変な単語が出てきたりしないようにするための処置です。

「”2”で”丸囲みの2”」や「”きごう”で各種全角記号」などの特殊な変換ばかりを繰り返していると、「2」や「記号」という普通の言葉も変換しづらくなります。
場合によっては普通の文章変換でも特殊な記号が混ざってくることもあります。

通常の文章を入力している際は特に、単漢字などの特殊な変換は避けたほうが良いでしょう。
なお、キートップから入力できる記号であれば、変換を使わず直接入力したほうが辞書が腐りにくくなります。


 6の場合は少々限定的なものになります。

一部の Windows OS 標準の日本語入力システムでは、文節を考えない文字列変換を繰り返していると、入力エンジン側でそれが本来正しい日本語だと誤解して変換優先度を変えてしまうようです。
これはある程度辞書が出来上がった状態でも発生しやすいようなので、細心の注意が必要です。
しかもシステムの「仕様」によるものなので、例えシステム辞書を初期化したとしてもすぐに再発してしまいます。

ちなみに長文の一括変換の場合は比較的誤変換がおきにくいようなので、もしタイピングに自信がある方は試してみても良いでしょう。


 しかし、どうしても使い込むうちに「ひずみ」はできてきます。
辞書がおかしくなった場合の対処法をいくつか挙げてみます。


<自動登録単語・予測変換内容を修正・削除する>

 一部の日本語入力システムには、変換確定した文字列が新語と判断した場合、自動で辞書に登録してしまう機能があります。
この辞書は登録の手間が要らないのでそれなりに有用なのですが、日本語は非常に複雑なため品詞が適切に登録されない、という問題があります。
この「品詞誤り」の単語を辞書に残しておくと、適切に文節が区切られなくなっておかしな文章が出来上がってしまう可能性が高くなります。

そういった機能を持つ日本語入力システムを使っている場合は、自動登録単語の内容を調べてみたほうが良いでしょう。
もし「不自然な語句」があるなら、内容の訂正や削除を行いましょう。
ちなみに単語辞書であれば部分訂正が可能ですが、予測変換の場合は学習内容の初期化以外の削除方法が無いこともあります。

もちろん、自身が動詞などの活用形を持つ単語登録するときにも品詞に十分注意しましょう。


<ユーザー登録語句の内容を見直す>

 ユーザー辞書へ登録できる語句は、原則としてほとんど制限がありません。
読みと変換語句に何らの関係性がなくても、品詞がめちゃくちゃでも、システムの制限に引っかからなければ何でも登録できてしまいます。
だからといって「異常な語句」をむやみに増やしてしまうと、適切に日本語変換されない状態になってしまいます。

また、よく取引先の名前を短縮登録することをアドバイスしている書籍などを見かけますが、日本語でよく使われる文字列に対して短縮登録先を設定するのはあまりお勧めできません。

(例) 「アルマジロ運輸」=>”ある”、”あう”、など 「英雄商事」=>”えい”、”えいし”、など

こういった変換登録をしていると、普通の文章を変換しても短縮変換が優先的に表示される事が多くなり、入力ミスを起こしやすくなります。

 このような短縮文字列を登録する場合は、先頭の文字を全角記号などにして「これは短縮ですよ」とわかるような登録内容にすることをお勧めします。
例えば先の例の場合なら、「#ある」や「*えい」などで登録しておけば変換事故を起こしにくくなります。
ちなみにこれは、昔懐かしい固定電話の短縮ダイヤル(専用ボタンではなく)機能で利用されていた手法です。


<システム辞書を初期化する>

 それでもまだ変換結果に不満があるなら、いったんユーザー辞書をリセットして初期状態に戻すこともひとつの手です。
折角育て上げた辞書が消えるのはつらいところですが、不具合がある状態のまま使い続けるよりはましになることが多いです。

ただし一部の入力システムではこの処理に不具合があり、学習結果だけでなくシステム辞書そのものを消してしまう(か、参照できないようになる)ことがあるようです。
うかつには使用せず、「最後の手段」として慎重に使用するようにしてください。


以下、ちょっとしたおまけ
一括変換機能

(注)以下の例は「Microsoft IME」システムの場合です。
それぞれのシステムでは異なる可能性があるので、詳細は各システムのヘルプを参照してください。
  • F6キー: ひらがな一括変換。繰り返し押すと、先頭から対象を1文字ずつ増やしながらカタカナ+ひらがな変換する。
  • F7キー: 全角カタカナ一括変換。繰り返し押すと、末尾から対象を1文字ずつ減らしながらカタカナ+ひらがな変換する。
  • F8キー: 半角カタカナ一括変換。カタカナが半角文字になる以外はF7キーと同じ機能。
  • F9キー: 全角英字一括変換。繰り返し押すと、すべて大文字>先頭のみ大文字>先頭のみ小文字>すべて小文字、の順に切り替わる。
  • F10キー: 半角英字一括変換。英字が半角文字になる以外はF9キーと同じ機能。
  • 無変換キー: 押す度にすべての文字が ひらがな>全角カタカナ>半角カタカナ、の順に切り替わる。
  • Shift無変換キー: Shiftキーを押しながらだと、無変換キーを押す度にすべての文字が 全角英字>半角英字、の順に切り替わる。

0 件のコメント: