音声UIが普及する理由と変える暮らし、そしてデザインプロセスへの影響を考える

連載

エクスペリエンスデザインの基礎知識

2017年は、自然言語で機械を操作する、対話形式のUIが繰り返し話題になりました。対話形式のUIには、チャットボットの様なテキストベースの対話もありますが、この記事は音声対話だけを対象とします。音声UIは、スマートフォン、スマートスピーカー、スマートTVなどの製品で採用され、UIの主流のひとつとして日々の生活のあちこちで見られるようになりつつあります。こうした急速な変化は、まもなく音声によるインタラクションが、GUIの代替として使われるようになるだろうことを示唆しています。

ガートナーの予測によれば、2018年に技術とのインタラクションの30%が音声UIになるだろうということです。

そこでこの記事では、音声UIがどのようにデジタル製品との関わりを変えるか、そしてそれがデザイナーにどんな意味を持つのかを議論します。

なぜ音声UIが主流になりつつあるのか?

音声UIを詳細に議論するには、音声UIが突然広まった理由の理解が重要です。この新しいインタラクションの媒介が急速に採用されたのは、次のような理由によります。

音声は自然なインタラクションを提供する

音声UIがとても魅力的である理由の一つは、人々にとって言葉による会話が自然な形であることです。人間の脳は、基本的に声の主を人間として理解するようできています。そのため、音声は、機械相手ではなく、人とのコミュニケーションを想起させます。これは、大抵の人にとって、視覚的なインターフェースとのインタラクションよりも、音声によるインタラクションの方が自然であることを意味します。ビジュアルインターフェースを音声と置き換えれば、ユーザーは、より慣れ親しんだ環境に身を置けるのです。

煩わしさの少ない体験

人々は、長い間、インターフェースと呼ばれる仲介物を通して技術を使ってきました。今日のインタラクションの大半は、GUIと呼ばれる仲介手段に基づいています。残念ながら、GUIは、デジタル製品を扱う最も容易な手段ではありません。ユーザーはまずインターフェースの使い方を学ぶ必要がありますし、次に操作するたびにその情報を思い出さなければなりません。多くの状況で、音声UIはもっと容易に使えます。音声UIとのインタラクションでは、ユーザーはデバイスに話しかけるだけです。使い方を学ばせたり思い出させることの少ないインターフェースは、煩わしさを低減するでしょう。

システムの使い方を学ばなければならないGUIと比べ、音声UIは学習の労力を飛躍的に減らす 画像著作権: cnet

技術とユーザーに、音声を受け入れる準備が(ついに)できた

音声UIは新しいコンセプトのように思えるかもしれませんが、最初のGUIの登場よりもずっと前から存在していました。初期の音声UIの一つはShoeboxと呼ばれ、1960年代初期にIBMによってつくられました。今日の音声認識システムの先駆者です。

IBMのShoeboxは音声の指示に応じて計算を行う実験的な機械 画像著作権: IBM

音声UIの更なる開発は、コンピューターの能力によって制限されました。人間の声をリアルタイムに解析して解釈するには高い処理能力が求められるのです。それが可能になるだけでも、50年以上の時間が必要でした。しかし、今や、機械学習とAIの力により、音声UIが、技術を操作する新しい様式になる可能性を持った時代に入りつつあります。

もう一つの音声UIの発展に影響した重要な要因は、音声処理の可能なデバイスの数です。今日、世界の人口の1/3がスマートフォンを持ち、音声入力を利用可能です。このような状況で、多くの人々が音声入力を使い始めることを予測するのは難しいことではありません。

言語による対話は人々に分かりやすく、それが音声UIの採用を後押しする 画像著作権: Adobe Stock

音声UIは製品の使い方をどのように変えるか

繰り返し作業を楽にする

今のところ音声UIは、何か新しい問題を解決しているわけではありませんが、多くの人々の昔ながらの問題を解決し、彼らの生活を改善しています。天気を確認したり、アラームを設定したり、メッセージに応えたり、料理のレシピを探したり、これらは、我々が繰り返し行う作業です。もちろん、こうした作業を、スマートフォンやコンピューターのGUIを使って行うことは可能です。しかし、そのためには、まずデバイスを手にしなければなりません。人々は、主に家や車の中にいるときは、手を使わずに操作できる音声UIを好む傾向にあります。

家で料理しているときや車を運転しているときなど、特定の状況で音声UIは都合が良い 画像著作権: KPBC

進歩した音声アシスタント

音声UIは、個人アシスタントとして必要不可欠な存在になるでしょう。各人に合わせたデジタル体験の提供を容易にする新しい技術が登場するでしょう。その瞬間に必要なものを理解するだけでなく、次に必要になるものも予測する個人アシスタントを想像してみてください。それは、全く予想さえしなかった領域も含め、生活のあらゆる場面を支援するようになるでしょう。

グーグルホームはグーグルアカウントと結合され、個人の好みを学ぶ

独立したアプリやサービスの統合

今のWebやモバイルはひどい状況です。何かを買ったり新しいサービスを使うごとに、アプリをダウンロードしたりアカウントを作らなければなりません。音声ベースのシステムはこの状況を変えるでしょう。もし人と話すのと同じようにサービスを束ねて会話できるようになったら、宿の予約やピザの注文に専用のアプリをダウンロードしようと思うでしょうか?

IoTデバイスの利用手段として

いまでは、インターネットに接続されているのは、スマートフォンやコンピューターだけではありません。温度調節機や照明など様々なIoTデバイスもインターネットに接続されています。我々の暮らしの中に現れ始めたこうしたデバイスの中には、GUIに適さないものも存在します。音声UIは、そんなデバイスを日常に組み込むことも容易にするでしょう。

特定の種類のウェアラブルやIoTデバイスからは、キーボードやタッチスクリーンが無くなるかもしれない 画像著作権: Adobe Stock

パーソナルな体験の実現

音声を用いたインタラクションは、ユーザーとシステムの間に個人的な関係をつくります。今日でも、アマゾンエコーやグーグルホームのユーザーは、彼らのデバイスと近しい関係を構築している人達がいます。彼らにとってデバイスは、製品というよりは友人に近いものとして認識されています。

音声によるインタラクションの技術が発展するほど、人のように反応し、振舞うようになる

視覚的なUIを使えないユーザーの生活を変える

大幅に改善されるアクセシビリティは、音声によるユーザー体験の、最も大きな効果のひとつです。音声UIは、画面やキーボードを使えない人々に、コンピューターの持つ力を与えます。アマゾンエコーのレビューを読めば、視覚的な障害を持つユーザーの生活をデバイスが変えた、という刺激的なストーリーを、いくつも見つけることができるでしょう。

音声UIは視覚的なインターフェースを使えない人々の生活を変える 画像著作権: Adobe Stock

音声UIにより、デザインプロセスはどのように変わるか

音声UIデザインのスキルが、デザイナーにとって主要な戦略的スキルになるのは間もなくでしょう。大きな変化が待っています。大半のUXデザイナーは、物理的な入力と視覚的な出力から構成される体験をつくる経験を積んでいます。しかし、音声UIはGUIとは全く異なり、デザイン原則やガイドラインも、同じものをそのまま適用することはできません。音声を使ったシステムをつくるには、デザイナーは以下の側面にこれまでよりも注目するよう求められるでしょう。

先読みのデザイン

音声UIの主要な目的は、ユーザーがシステムと会話する労力を最小化することにあります。音声による人と機械のやり取りでは、ユーザーが出す指示には無限の可能性があります。デザイナーがすべての可能性を予期することは不可能ですが、状況を読んだフローをつくることは可能です。成功の鍵は会話の流れを間違わないことです。そのためには、ユーザーの最初の意図、すなわち、そもそも使おうと思った理由の理解が重要です。そして、会話の個々のやり取りで、ユーザーが求めるものや期待するものを予期して、適切な反応を形成します。

すべての言葉を理解しようと格闘するのではなく、意図の理解を試みる 画像著作権: API

機能の発見しやすさ

GUIでは、デザイナーは利用可能な選択肢を明確にユーザーに示すことが可能です。音声UIでは同じ事が不可能です。音声UIには、視覚的要素のような一覧性はありません。従って、音声で操作するデバイスを眺めてみても、UIに何ができるのか知る術はないでしょう。状況に応じて音声で示すようにデザインし、音声UIのシステムにできることへの期待を明確に設定することが必要です。

情報の優先順位付け

GUIでは、数多くの異なるオプションを同時に提示することができますが、音声を使う場合は、情報を簡潔にし、ユーザーが混乱したり過負荷にならないよう配慮することが必要です (言葉を聴くとき、人々は10秒から15秒で集中が切れます)。デザイナーは、「より少ないほど良い」を念頭に、ユーザーに提供する情報の優先順位付けをして会話をしましょう。

おわりに

音声UIの必要性は現実のものです。そして、そうした体験は既に日々の生活を変えています。既存の視覚的な体験をすぐに置き換えるものではないかもしれませんが、音声UIという選択肢の追加は、既存の体験を拡張し、ユーザーに大きな影響を持ちます。願わくば、世界がもっとアクセシブルになりますように。

この記事はHow Conversational User Interfaces Will Change Our Lives(著者:Nick Babich)の抄訳です