ニュース
「しょうらひあ」も「将来は」にきちんと変換できる、ATOKのディープラーニング
2017年12月5日 17:25
株式会社ジャストシステムは12月5日、日本語入力システム「ATOK for Windows (Tech Ver.31)」、および日本語ワープロソフト「一太郎2018」シリーズを発表した。
新ATOKの特徴については、速報記事「【速報】ATOK、パッケージ版廃止で月額制のみに」も参照されたいが、この記事では、新ATOKの機能の詳細、および一太郎の新機能について、発表会での説明をベースに紹介していく。
入力もディープラーニングで補正する新ATOK
既報のとおり、Windows/Mac向けのATOKは今後「ATOK Passport」に集約し、パッケージ版が廃止される。ATOK Passportでは、Windows/Mac/Android共通で最大10台にインストールできる。買い切りのAndroid向けATOKは提供を継続し、機能強化が順次図られるが、その頻度はATOK Passportから少し遅れることになる。
一太郎2018にもATOK for Windows (Tech Ver.31)相当の機能がバンドルされるが、こちらはATOK Passportで年に数回予定されている新機能の実装は行なわれず、基本的にセキュリティパッチや一部辞書のアップデートにとどまる。また、ATOK Passport専用の機能は利用できない。
新ATOKでの最大の特徴は、ディープラーニングの技術を入力段にも応用した「ATOKディープコレクト」機能の実装だ。日本語入力のストレスは「変換したい単語が出てこない」ことよりも、入力ミス訂正のためにBackSpaceを数回押さなければならない点に着目したのがATOKディープコレクトとなる。
この機能では、タッチタイピングしていて、どうしてもローマ字の順序が逆になったり、子音が続いたりといった、日本語として不自然さ/異質さを検出し修正する。たとえば「将来は(しょうらいは:shouraiha)」と入力しようとして「しょうらひあ:shourahia」のようになってしまった場合、「ひあ:hia」というのは日本語として明らかに不自然である。
そこで、「hia」をヒントに、ローマ字の順序を並べ替えたり、打鍵の近いキーを入れたりして、「日本語の文字列にもっとも近いだろう」と、ATOKディープコレクトが判断したものを採用し、打鍵文字列を修復する。
ただこのATOKディープコレクトは既存の日本語を対象に学習しているため、変わった読み方の外来語や新語には対応できない。そういった場合は「Shift+BackSpace」で即座に自動修復を訂正し、確定すれば次回以降自動修復しないようにできる。
ATOK Passportのみで利用可能な機能として、新たに「ATOKマンスリーレポート」が加わった。これは過去1カ月間で入力した文字の総数をもとに、タイピングミスの傾向もグラフィカルに表示できる。よく間違えるキーなどをユーザー自身が把握しておけば、以降入力ミスが減らせるのではないかという思いつきのもと実装されたものだ。なお、レポートはローカル処理によって生成される。
また、ATOK Passport[プレミアム]のみで使用可能なクラウド辞典に、「広辞苑 第七版」が加わった。10年ぶりに改訂された広辞苑は、「自撮り」、「スマホ」、「ビットコイン」、「ディープラーニング」といった新語を追加。また、一部項目は、近年使われるようになった表現方法なども取り入れられた。
出力をきわめる一太郎2018
日本語ワープロソフトの一太郎2018は、従来と同様「一太郎2018」、「一太郎2018 プレミアム」、「一太郎2018 スーパープレミアム」の3ラインナップを用意。発売は2月9日で、税別価格は順に2万円、25,000円、38,000円。
一太郎2018のテーマは「出力をきわめる」である。目的からレイアウトなどをサポートする「アウトプットナビ」が強化され、中とじ本、PDFや電子書籍、小説投稿、画像としての出力といったさまざまな用途に対応した。
縦組みレイアウト時、見開き両面印刷の本文行位置が揃えられるほか、縦組み引用符や傍点の見やすさが改善した。また、仕上がりイメージから選んで目次を作成できる「目次ギャラリー」は、160種類のデザインを用意した。頻出語チェックも行なえるようになったほか、文書校正機能では、小説用に、文の作法チェックや、擬音語/擬態語の過指摘の抑制を行なった。
一太郎2018 プレミアムと一太郎2018 スーパープレミアムは、小説「君の名は。」にも使われた「イワタ書体」8種類を収録。一太郎向けの特別対応として、ベタ組みで2倍ダッシュが繋がるようにデザインされている(通常版では離れる)。
また、最新の「広辞苑 第七版 for ATOK」、異なる声で会話文を読み分けできるようになった音声読み上げソフト「詠太8」、文字デザインが行なえる“モジグラフィ 花子プラス”を新たに搭載した「花子 2018」、標的型攻撃メールのリスク軽減や、高精細ディスプレイへの対応を行なったメーラー「Shuriken 2018」なども同梱される。なお、花子単体のパッケージ版は税別9,800円、Shuriken 2018の単体パッケージは税別4,800円で販売される。
一太郎2018 スーパープレミアムではさらに、2008年~2017年の10年分の世界の出来事を資料化した「ブリタニカ国際年鑑 一太郎2018年版」を収録。本来個人では契約できない、300万点の画像ライブラリ「Britannica ImageQuest」の1年利用権も添付する。
さらに、PDFソフト「JUST PDF 3[作成・編集]」、フル機能を備えたフォトレタッチ「Zoner Photo Studio X」、表計算ソフト「JUST Calc 3 /R.3」、プレゼンテーションソフト「JUST Focus 3 /R.3」も同梱する。