iPhone 4Sの隠し球機能「Siri」とは?

10月5日 開催



 アップルは5日、「iPhone 4S」の現地発表会の内容を日本でも公開した。この中では、iPhone 4Sのソフト、ハード、そしてサービスについて説明がなされたのだが、最後に、いわゆる「One more thing」として発表されたのが「Siri」(シリ)という機能だ。

Siriとは、発声によってユーザーの行動の手助けをするインテリジェントなアシスタント

 これは一言で言うと、人が発話した質問から、音声を読み取り、意味を解析/認識し、それに対して音声と付帯情報を使って、適切な返答をする技術である。誤解を恐れずに言うなら、古い例で恐縮だが、iPhoneがナイトライダーのK.I.T.T.になるようなものである。

 Android端末にもその機能があるように、音声認識機能は、現在さほど難しいことではない。しかし、機械に意味や文脈となると、まだ荷が重い。十分な精度で意味認識を行なうには、アップルの説明に倣うと、「今日 天気」、「再生 ビートルズ」、「電話 119」などの簡単な書式に沿って発話する必要がある。

 それに対して、Siriでは、通常の口語体で話した内容も適切に読み取ることができる。例えば、今日の天気を知りたい時「今日の天気は?」だけでなく、「クパチーノでは雨が降る?」、「今日は傘を持っていくべき?」、「最新の天気予報は?」といった質問が全て同じ内容を意味していることを理解し、いずれの質問に対しても、「今日の天気はこのような感じです」という合成音声と合わせて、グラフィカルな天気予報が画面に表示されるのだ。

Siriを起動したところ 「今日の天気は?」と音声で訊くと、まず認識結果がテキストで表示され 「本日の天気はこのような感じです」という音声とともに、天気予報が表示される

 さらにSiriでは、ユーザーの質問に答えるだけでなく、ユーザーの意図を汲んだ上で、アプリと連携して、設定を行なう。例えば、「明日6時に起こして」とSiriに伝えると、アラームを6時にセットするし、「フィル・シラーとのランチを金曜の午後に設定」と伝えると、了解した旨を音声で伝え、カレンダーアプリにその予定を登録する。その際に、認識が間違っていないかも尋ねられるので、了承すると登録が完了する。

 この読み上げと認識機能を使って、運転時など手が離せない時に、受信したメッセージを読み上げさせた上で、音声入力したメッセージを返信することもできる。

 Siriの使い方は、ホームボタンを1〜2秒押すだけ。画面にマイクをかたどったSiriのアイコンが表示されるので、その状態で話しかける。

 ただし、どのような質問や命令に答えられるわけではなく、対応できる内容/アプリとしては、電話、音楽再生、iMessage、カレンダー、リマインダー、地図(道案内)、天気予報、株価情報、アラーム、Web検索などとなっている。しかし、発表会のデモでは100%と言える精度で話者の意図を理解しており、返答を出すまでの時間もほんの1〜2秒程度。合成音声の発声もかなり自然で、今まで映画で見ていたような機能が、199ドル(米国)という価格のデバイスに降りてくる。

 これについては動画を見てもらうのがもっとも手っ取り早いと思われるので、以下の動画を参考にして欲しい。

 なお、残念ながら、Siriが当初対応する言語は英語、仏語、独語のみ。その他の言語については順次対応が拡大される予定。

【動画】ユーザー「What is the hourly forecast?(今日の1時間おきの天気予報は?)」Siri「Here's the weather for today.(本日の天気は下記の通りです。)」

【動画】ユーザー「Do I need a raincoat today?(今日はレインコートが必要かな?)」Siri「It sure looks like rain today.(本日は雨が降りそうです。)」

【動画】ユーザー「Wake me up tomorrow at 6AM.(明日午前6時に起こしてくれ。)」Siri「Ok. I set it for 6AM.(了解。アラームを午前6時にセットしました。)」

【動画】ユーザー「Find me a great Greek restaurant in Palo Alto.(パロアルトのおいしいギリシャ式レストランを探してくれ。)」Siri「I found 14 Greek restaurants. 5 of them are in Palo Alto. I've sorted them by rating.(14のギリシャ式レストランを見つけました。その内5つがパロアルトにあります。それらを人気順に表示します。)」

【動画】ユーザー「Give me directions to Hoover Tower.(フーバータワーまでの道順を教えてくれ。)」Siri「Here are directions to Hoover Tower.(フーバータワーへの道順は以下の通りです。)」

【動画】ユーザー「Read my message.(メッセージを読み上げてくれ。)」Siri「New message from Phil Schiller. When can we have lunch? (フィル・シラーからの新しいメッセージです。ランチはいつ行けるかな?※ここでメッセージに対するメッセージの待ち受け状態にもなる。)」

【動画】ユーザー「Do I have any meetings Friday at noon?(金曜のお昼にミーティングはあるかな?)」Siri「You don't have anything on your calendar for this Friday at 12PM(今週金曜日の12時にはカレンダーに何の予定も入っていません。)」

【動画】ユーザー「Schedule lunch on Friday at noon with Phil Schiller?(金曜日のお昼にフィル・シラーとのランチをスケジュール登録してくれ?)」Siri「OK, I set up your meeting with Phil Schiller for this Friday. Are you ready for me to schedlue it?(了解しました。フィル・シラーとのミーティングを今週の金曜日に設定しました。これでよろしいですか?)」ユーザー「Confirm that.(確認した)」Siri「OK, I scheduled your meeting with Phil Schiller for this Friday.(了解しました。フィル・シラーとのミーティングを今週の金曜日に登録しました。)」

(2011年 10月 5日)

[Reported by 若杉 紀彦]