ニュース
ジャストシステム、新エンジンを搭載し誤変換が30%削減された「ATOK 2017」
~10年ぶりの刷新でディープラーニングを駆使
2016年12月1日 14:11
株式会社ジャストシステムは、新エンジンを搭載した日本語入力システム「ATOK 2017 for Windows」シリーズを2017年2月3日に発売する。税別価格は「ベーシック」が8,000円、「プレミアム」が12,000円。
ATOK 2017では、これまでのATOKでは取り込めなかった日本語の特徴をディープラーニングで抽出し、従来の変換アルゴリズムに組み込んだ「ATOKディープコアエンジン」を搭載。従来の変換アルゴリズム「ATOKハイブリッドコア」が選択した候補と、新しい変換アルゴリズムが選択した候補を比較し、より自然な変換候補を提示するという。
これまで文節区切りや同音語の第一候補として適切に提示できていた賢さを活かしつつ、不自然であった変換を自然な日本語に変換するようチューニングしている。また、学習情報の蓄積が場合によっては思い通りの変換を妨げていた事象を解消したとしており、誤変換を30%削減できたという。
具体的な例を挙げると、例えばATOK 2016で「さいしんもでるもでる」を変換しようとすると「最新モデルモデル」になっていた。名詞の後ろに名詞が続くのは不自然ではないが、2つ続くのは不自然であるため、ATOK 2017では「最新/モデルも/出る」と言ったように正しく変換できる。
同音語選択についても、例えば「けいたいつうしんりょう7ぎが」の場合、従来は「携帯通信料7ギガ」となっていたが、料金の単位はギガではないことを認識し、ATOK 2017では「携帯通信量7ギガ」に正しく変換できる。
さらに、「三都市」という単語を学習した後、「さとうさんとしのださん」と入力した場合、従来は「佐藤/三都市の/打算」と学習結果を間違って使ってしまうが、ATOK 2017では学習した後でも自然な日本語になるように配慮しており、「佐藤/さんと/篠田/さん」のように正しく変換してくれるという。
このほか、「へんしん」という言葉に対してインターネットで調べると「変身」の方が多くヒットするが、ATOK 2017ではあえて日常で使うことが多い「返信」を変換後方の冒頭に持ってくるなどの配慮を行なっているという。
日本語入力オフで日本語を英字として入力してしまっても、ATOKがそれを日本語だと認識した場合、ガイダンスを提示し、Shift+変換キーで日本語変換できる状態に戻せる機能を搭載した。
上位のATOK 2017[プレミアム]では、「岩波国語辞典 for ATOK」、「明鏡ことわざ成句使い方辞典 for ATOK」、「大修館四字熟語辞典 for ATOK」、「ジーニアス英和/和英辞典」を収録。岩波国語辞典では、関連語へのリンクを充実させ、新しい言葉との出会いの機会を増やした。明鏡ことわざ成句使い方辞典は、誤用表現から適切な表現を探す際に使える。
なお、サブスクリプションモデルの「ATOK Passport」は、これまでWindows版とMac版のみが学習データのクラウドアップロードが可能で、Android版はダウンロードのみだったが、今後Android版もアップロードに対応させる予定だとしている。現時点では詳細は未定で、決まり次第改めて正式発表を行なう予定。
ディープラーニングを駆使した変換は現時点ではWindows版のみだが、今後Mac版、そしてシステムの全体性能を見つつAndroid版にも順次搭載するとしている。
ATOKは1982年に登場した「KTIS(Kana-Kanji Transfer Input System)」から数えて2017年で35周年を迎える。これを記念し、「ATK35リクエスト辞書選抜総選挙 for Windows」と題したオンラインキャンペーンを開始。35種類の辞書がエントリーされており、選ばれた1位の辞書が実際に制作されプレゼントされる。