「声」という新しいUI--Alexaボイスデザインガイド いろはの「い」

CAMPHOR- Advent Calendar 2017 の 18日目 の記事です。
CAMPHOR-で運営メンバーの @tomokortn です。

我が家にGoogle Home Miniが届いた!

前までカレンダーや音楽再生などちょっとしたことでスマホを触っていましたが、
今はスマートスピーカーの操作は楽すぎて、ちょっとしたことでスマホ触るのが億劫になります。
コンピュータ→スマートフォンウェアラブル端末の「小さくして持ち運べるようにしました!」というリニアな流れとはまた違う体験があるので、ぜひ買ってください!!!

そしてそして、新しい端末が届くとデザインガイドラインが気になってしまいますよね><
はやくもAmazon Alexa Voice Design Guideが公開されています!

「スマートスピーカーってめっちゃ聞くけど、ゆうてあんま知らん」「ガイドラインの読み方わからん」「年の瀬だし、時間ない!」って言う方向けに、基礎の基礎からまとめてみました。

Faster, easier, and more fun

まずは、Alexaが目指している世界観について。

1. Faster

料理中に3分測りたいときに、汚れた手を洗って、タイマー探して、そこまで歩いて、タイマー操作して3分セットする・・・ああ1分くらい経ったんじゃない?
Alexaなら、鍋の前で「Alexa, 3分測って」

2. Easier

「Alexa, 音楽をかけて」でAlexaは曲を選び、再生し、アーティストについて学習します。
Alexaはメニューやスクリーンの代わりとなり、ユーザーから手と目を解放します。

3. More Fun

ユーザとAlexaの対話の中にゲーム性やユーモア、ストーリーを加えることによって、ユーザがやりたいことをより楽しく実現できるようにする。

れっつ Voice Design!

スキル設計するときには、ユーザーとAlexaの対話(dialog)の台本(script)を作成します。

スキル(Skill) …スマートスピーカーの機能・能力のこと。スマホでいうネイティブアプリにあたるようなもの。

書き言葉ではなく、話し言葉で作るようにしましょう!

Voice Designの3ステップ

  1. Dialog Sketch(対話の下書き)
  2. User Flow
  3. Interaction Model

f:id:tomokortn:20171213194400p:plain

1. Dialog Sketch

ユーザハッピーにつながるシナリオをラフに描いてみます。
シンプルでOK!
その後、書いたシナリオをもとにユーザのペルソナやスキルのコアバリューを整理します。

2. User Flow

体験全体のフローを書きます。
ユーザとAlexaの対話を映画の台本のように書いていきながら、
スキルの起動方法、ユーザからAlexaに入力してほしい情報やWebサイトなど他の媒体から入手すべき情報なども整理します。

3. Interaction Model

2で作ったユーザフローに、分岐やエラーケースを加えて拡大します。
ユーザは長く話すかもしれないし、短く話すかもしれない。
ユーザは想定外のことを話すかもしれないし、黙り込んでしまうかもしれない。
いろんなパターンを人間同士で対話しながら、どんどん枝を増やしていけば、最終的には長くて深い、網羅的なフローチャートになっているでしょう!
人間同士で対話しながら作ることは、Alexaの話す言葉が 自然な言い回しか/適切な長さか長さ/程よい情報量か/明瞭か… に貢献するので、どんどん声に出して改良していきましょう!!

話し言葉と書き言葉の違い

書き言葉では冗長な表現を避けますが、VUIではユーザと同じ言葉をAlexaの発言の中に混ぜて、ユーザに安心感を与えます。
このテクニックは landmarking といいます。
ex)
User「午前10時に何がある?」
Alexa「午前10時には部署会議があります」

また、Alexaの話し方を調整するのに、Speech Syntesis Markup Language(SSML)というマークアップ言語があります。
概要はこちらのブログで!

dev.classmethod.jp

ユーザの話をAlexaが聞き取れるように設計する

台本ができたら、インテント(Intent)を決定します。

Intentは直訳すると意図という意味ですが、Alexaの場合は以下の意味になります。

インテントはあなたのスキルが実行可能な特定の物事を指します。例えば旅行プランニングのスキルは、PlanATrip(旅行の計画)やBookTheTrip(旅行の予約)、Stop(停止)、Cancel(キャンセル)、Help(ヘルプ)の5つのインテントを持つでしょう。

インテントと発話の関係について

f:id:tomokortn:20171213202935p:plain What Users Say | Amazon Alexa Voice Design Guideから画像をお借りして、インテントと発話の関係について軽く触れます。

Utterance - 発話: ユーザーが自分の要望をAlexaに伝えるため、またはAlexaからの質問に答えるために話す言葉のことです。

Wake word - ウェイクワード: ユーザーがAlexaに話しかけたいときに発するコマンドのことです。

Invocation name - 呼び出し名: スキル利用時にユーザーが呼びかけるカスタムスキルの名前です。

Slot - スロット: インテントの引数でリクエストに関する追加情報をAlexaに与えます。

ユーザが言いそうな様々な文章やフレーズ、単語を設計に盛り込み、すべての対話が心地よく進むようにしましょう。

VUIで留意すべきこと

ユーザから承諾を得たい場合を考えます。
GUI(Graphic User Interface)の場合、call-to-actionボタンによって入力が一意に定まりますが、
VUI(Voice User Interface)の場合、はい/オッケー/よさそう/いいよ…など同じ意味を表す言い回しが多数存在しています。
このように、インテントを起動させるべき発話(utterance)は複数存在しているので、会話シミュレーションを活用するなどして丁寧にリストアップしてあげる必要があります。
1インテントに対し、30以上のサンプル発話 を用意することが推奨されています。

デザインが完成したら

チェックリストがあるので、チェックしてみましょう!

おまけ

Voice Design Guideを読んでみた感想

デザインプロセスに関して、1インテントにつき30以上のサンプル文が要求されることなど、発話の抜け漏れのなさや発話の要素分解が求められ、かなりロジカルで地味な印象を受けた。ユーザ調査がめっちゃ好きなデザイナーにとってVUIデザイナーは天職になりうると思う。

また、以下の3点から、日本で海外製スキルが流行するのは時間がかかると考える

  1. 英語版スキルの上陸はネイティブのスピードについていけるリスニング・スピーキング能力が求められる。
  2. VUIは、GUIのようにアイコンなどの非言語情報でユーザ理解をサポートできない。
  3. Slot(変数)に関して、英語や中国語、フランス語などの語順の自由度の低い言語はSlotの設定が比較的楽そうだが、日本語やロシア語のような語順の自由度が高い言語は開発がつらそう...

我が家のGoogle Home活用法

我が家のGoogle Home MiniはUS英語に言語設定しています。 UK英語に設定して見たのですが、US英語の方がスキルが多かったので、US英語にしています。
適当に英語喋っても結構聞き取ってくれるので、自信になります。
毎朝「Hey Google, good morning!」っていうと天気やニュースを返してくれて、ちょっとずつ聞こえる英語が増えてきて嬉しいです。
寝る前は「Hey Google, tell me some story」といって、眠れる森の美女など適当な寓話を聴いています。

参考リンク

Amazon Alexa Voice Design Guide (日本語)
Amazon Alexa Voice Design Guide
Alexa Skill Testing Tool - Echosim.io (Alexaをブラウザでお試しできるサイト)