音声インタフェースと
Webアクセシビリティ
 西本卓也(東京大学)
  2008年11月15日


                1
インタフェースの原則
• 目標:音声インタフェース設計の体系化
 – 既存のHMIに関する提案の再構成
• 基本原則(1996)
 – 労力最少:移動量、回数、操作容易性
 – 透過性:状態理解、手順連想、フィードバック
 – 頑健性:誤入力防止、修復容易性
• 構成原則(1996)
 – 初心者、熟練者、上級利用移行
• 導入原則(2008)
 – 有用性、適合性、妥当性
                           2
ワープロによる文書作成
• 目標
 – あるパラグラフをもう少し短くしたい(曖昧)
• 意図形成
 – ある文末で段落を変える(具体的決定)
• 行為系列の特定
 – カーソル移動、改行コード挿入、空白挿入、、
• 行為実行、状態知覚、状態解釈、評価

• 海保 他:認知的インタフェース,新曜社,1991

                             3
実行の淵と評価の淵
Norman, Draper (ed.) : User Centered System Design,1986.




                                                           4
電話音声応答システム
• プロンプトの例:
  – 1:各イベントの時間・内容についてお知らせします。**
    *から音声でお答えください。
  – 2:***から音声でお答えください。各イベントの時間・
    内容についてお知らせします。
• ユーザは少しずつプロンプトを聞く
  – 任意のタイミングでバージインできる
  – プロンプトを聞きながら何度も評価と実行を行う
• 言語情報の効果:命令表現、文末表現
• 非言語/パラ言語情報(Raman: Auditory UI)
  – 効果音が鳴ったらプロンプトの最後
  – 声の種類に意味を持たせる
                        高山 他: SP2001-132, 2002.
                                           5
ミクロな実行・評価モデル
• 「一次元の揮発性メディア」としての音声
• AJAXも同型の問題?




                        6
実行と評価の不自然な対応
• 問題発見の切り口として
 – キー操作に対するフィードバックの遅れ
  • 「音切れ」の重要性
  • 音声対話システムにも同様の課題
 – システム状況の知覚
  • 不自然な因果関係から
 – 超早口化されて聞き取り困難な合成音声
  • 聞こえているのが「奇跡」
  • 心的辞書が活用できないと聞こえないはず
• 「バッドノウハウ」の温床
 – 「次のリンク」を使って「斜め読みする」
 – コンテンツを後ろからさかのぼって読む
                          7
対策の例
• 音声インタフェース固有の快適性の追求
 – 専用TTSが必要:応答速度、情報伝達速度
 – 妥当な評価尺度、評価手法の確立
• タスクの本質的な構造に基づく設計
 – 画面ではなくアプリの情報を音声化
  • 対面朗読→模擬対話→読み上げ用HTMLアプリ
  • 「ショッピングカート」/アンドゥの重要性
 – 開発が大変、効率化したい
  • Ruby on Rails + {VoiceXML or HTML}
  • モダリティ階層モデル
     – REST : Representational State Transfer
     – Galatea Dialog Studio としての実装


                                                8
対面朗読者と視覚障害者の対話の分析とその応用,
             情処研報, 2007-SLP-11, pp.55-60, Feb 2007.




階層化メニュー

特選御膳
  ・・・
松花堂弁当
スタンダード1
  ・・・・


 カツカレー
 ステーキカレー
 天むす
 松花堂
「お気に入り」リスト                                        9
MVCモデルとマルチモーダル
• MVC = Model / View / Controller
• View => Modality Component




                                    10
マルチモーダルIFの6階層モデル




               11
まとめ
• 音声IFとしてのWebアクセシビリティ
• マルチモーダルIFの原則
 – 問題点の抽出
 – 「実行」と「評価」の対応という観点から
 – 個別の問題に関する評価と改良
• 課題
 – もっと体系的な方法論
 – HTMLの現実に即した問題解決
 – Voice Webの可能性
   • 音声認識の有用性と適合性??

                         12

More Related Content

PDF
ベイジアンネットワークモデリング勉強会20140206
PPT
音声インタフェースとWebアクセシビリティ
PDF
電子書籍小説の「立ち読み」インタフェース 牛尼剛聡
PDF
Argカフェ&argフェスト冒頭説明
PPTX
ヒューマンインタフェースな学会に参加してみた
PDF
インタフェースのこころ
PDF
ユーザーインタフェースの分解
PDF
『UXデザインの教科書』を書きました
ベイジアンネットワークモデリング勉強会20140206
音声インタフェースとWebアクセシビリティ
電子書籍小説の「立ち読み」インタフェース 牛尼剛聡
Argカフェ&argフェスト冒頭説明
ヒューマンインタフェースな学会に参加してみた
インタフェースのこころ
ユーザーインタフェースの分解
『UXデザインの教科書』を書きました

Similar to 音声インタフェースとWebアクセシビリティ (20)

PPT
音声インタフェースとWebアクセシビリティ
PDF
2009 splc-a framework for constructing semantically composable feature models...
PPTX
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
PDF
Deep learning勉強会20121214ochi
PDF
生活支援ロボットのマルチモーダル言語理解技術
PDF
マイニング探検会#12
PDF
20110305_Code4Lib2011参加報告会:田辺浩介参加報告
PDF
IVS CTO Night & Day 2016 Tech Talk - AI
PDF
徳丸本ができるまで
PDF
opensource and accessibility (Dec2000) Part 2
PDF
Localization in SOE
PDF
SOE-LOC
PDF
SOE-Loc
PPTX
Learning to control the specificity in neural response generation
PDF
対話システム, 南泰浩
PDF
自然言語処理分野の最前線(ステアラボ人工知能シンポジウム2017)
PDF
自由文思考プログラミング環境における手続的機能の実装
PPT
Pattern mining-scrum gatheringtokyo20130115
PDF
分析・モニタリングのために作文活動を測定するシステムの設計
PDF
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
音声インタフェースとWebアクセシビリティ
2009 splc-a framework for constructing semantically composable feature models...
いまさらアジャイル巡業 In Tokyo アジャイルモデリング
Deep learning勉強会20121214ochi
生活支援ロボットのマルチモーダル言語理解技術
マイニング探検会#12
20110305_Code4Lib2011参加報告会:田辺浩介参加報告
IVS CTO Night & Day 2016 Tech Talk - AI
徳丸本ができるまで
opensource and accessibility (Dec2000) Part 2
Localization in SOE
SOE-LOC
SOE-Loc
Learning to control the specificity in neural response generation
対話システム, 南泰浩
自然言語処理分野の最前線(ステアラボ人工知能シンポジウム2017)
自由文思考プログラミング環境における手続的機能の実装
Pattern mining-scrum gatheringtokyo20130115
分析・モニタリングのために作文活動を測定するシステムの設計
XP祭り関西2011 森崎 修司「プラクティスが有効にはたらく前提は明らかになっていますか?」
Ad

More from Takuya Nishimoto (20)

PPTX
221217 SwiftはPythonに似ている
PPTX
220427-pydata 統計・データ分析 特集
PPTX
220126 python-datalake-spark
PPTX
211120 他人の書いたPythonスクリプトをステップ実行で理解する
PPTX
211020 すごい広島 with OSH 2021.10
PPTX
210917 オープンセミナー@広島のこれまでとこれから
PPTX
210911 これから始める電子工作とMicroPython
PPTX
210728 mpy
PPTX
210630 python
PPTX
210526 Power Automate Desktop Python
PPTX
210428 python
PPTX
200918 hannari-python
PPTX
200429 python
PPTX
200325 flask
PPTX
200208 osh-nishimoto-v2
PPTX
191208 python-kansai-nishimoto
PPTX
191101 nvda-sightworld-nishimoto
PPTX
191114 iotlt-nishimoto
PPTX
191030 anna-with-python
PPTX
190916 nishimoto-nvda-pyconjp
221217 SwiftはPythonに似ている
220427-pydata 統計・データ分析 特集
220126 python-datalake-spark
211120 他人の書いたPythonスクリプトをステップ実行で理解する
211020 すごい広島 with OSH 2021.10
210917 オープンセミナー@広島のこれまでとこれから
210911 これから始める電子工作とMicroPython
210728 mpy
210630 python
210526 Power Automate Desktop Python
210428 python
200918 hannari-python
200429 python
200325 flask
200208 osh-nishimoto-v2
191208 python-kansai-nishimoto
191101 nvda-sightworld-nishimoto
191114 iotlt-nishimoto
191030 anna-with-python
190916 nishimoto-nvda-pyconjp
Ad

音声インタフェースとWebアクセシビリティ