Vistaに搭載される、かな漢字変換ソフト「IME 2007」は、変換エンジンを刷新する。「Trigram/SLM」という技術を新たに導入する(注:2006年11月時点で、同技術は「the 2007 Office system」での提供であり、Vista版IME 2007には搭載されないことが明らかになった)。名前は難しいが、「3つの文字」を意味する「Trigram」がその特徴を表している。変換実行時に、3つの語のつながりやすさを考慮するのだ。
IMEの辞書には、膨大な量の文書を解析して導き出したデータが入っている。日本語としてよく使われる語はどれか、どの語とどの語がつながりやすいか、などのデータだ。例えば形容詞と名詞は接続することが多いが、動詞と動詞が続いて登場することはあまりない。こうした情報をあらかじめ辞書データとして用意しておく。
変換時にはこの辞書を参照し、結果を決める。従来は2つの単語のつながりやすさを見て結果を決めていたが、今回からは3つの単語を対象にする。その結果、口語のようにくだけた表現などの誤変換が減らせるという。
なおIME 2007は、Vistaとほぼ同時期の出荷が予定されている「the 2007 Office system」でも提供される。Vistaに搭載されるIME 2007は、Office版から一部の機能が削られる見込みだ。
|