SlideShare a Scribd company logo
複数人と対話可能な
           音声対話ロボットの構築
1   関口・西崎研究室
    T05KF012 上平拓弥
ロボットの実例




    ロボット名:キクラゲ
                 2
インタフェース:
実際のカードを使用してゲームが可能

自作したカードリーダ
既製品のアーム
  (アームの操作は付属の関数を使用)




                      3
ロボットの構成
PC(Linux)×2
PC(Windows)×1
AGC(Automatic Gain Control)回路×2
ロボットアーム×1
カードリーダ×1
マイク×2

以上で構成されている
                                  4
2012年1月19日(木)訪問




      ロボット名:キクラゲ
                   5
「相手・カード指名式ばば抜き」のルール

                きくらげ、カエル
                 持ってる?

ユーザA

   相手・カードの組を
  指名して、当てた人も、
  そのカードを場へ出す。
                 うん、持ってる。

                (アームが「カエル」を
                つかんで場へ出す。)


ユーザB
                              6
「相手・カード指名式ばば抜き」のルール



ユーザA




ユーザB
                      7
ロボットの内部処理概要
 音      キーワード              スピーカ
 声       抽出
        モジュール     音声再生
                  モジュール
 音声認識
音声認識
 エンジン
エンジン
        対話管理       アーム操作
                   モジュール
        モジュール

                           ロボット
                カード管理      アーム
                モジュール             8
ロボットアームを実装する意味は

対話は,常に音声だけで行うとは限らない
実物かディスプレイかで心象が変わる
対話する時間も変化する




                      9
複数話者への対応1/2
 ユーザごとに対話を管理          (分散型対話管理手法)


  話者識別:各マイクへの入力の大きさで識別
  重複発話:認識エンジンを話者毎に割り当てる
             認識エンジン
               ①      対話処理
                                発話履歴A
       MIC
ユーザA
              スピーカ    応答   履歴   システム
                      制御         履歴
              アーム          管理


                                発話履歴B

       MIC   認識エンジン    対話処理
ユーザB           ②
                                        10
複数話者への対応2/2
ユーザ間の対話を含めた対話処理
 手札の予測が可能で戦略性能が向上
 ゲームの進行を理解できる

太郎、タコのカードを下さい       タコのカードは
   花                  花子か
   子

                      次は太郎
                太      の番だ
                郎


  ごめん、ないです
                              11
実際にゲームを行った結果1/2
ロボットの動作の集計
6人のユーザによって
ゲームを6回行い動作を分類した

                   誤りが集中した
                    1ゲームは
                    途中で中断




 誤動作:1ゲームあたり平均2回

                             12

More Related Content

PDF
20180807 NefryUserMeetup#1
PDF
音声言語対話を介した人間と機械のコミュニケーション技術
PPTX
会話型ロボットを作った話
PDF
旅ゲー風アプリ・コンテンツを自動構築する
PDF
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
PPTX
TensorFlowで会話AIを作ってみた。
PDF
ET2016 組込みシステムに適した コンポーネントシステムTECSの最新状況
PDF
時系列トピックのバーストを同定するシステムの紹介 (専門家向け)
20180807 NefryUserMeetup#1
音声言語対話を介した人間と機械のコミュニケーション技術
会話型ロボットを作った話
旅ゲー風アプリ・コンテンツを自動構築する
TensorFlow を使った 機械学習ことはじめ (GDG京都 機械学習勉強会)
TensorFlowで会話AIを作ってみた。
ET2016 組込みシステムに適した コンポーネントシステムTECSの最新状況
時系列トピックのバーストを同定するシステムの紹介 (専門家向け)

Viewers also liked (13)

PDF
ゲームのレビューから収集した意見の集約
PDF
質問・回答サイトにおけるトラブル相談事例の分析
PDF
時系列トピックのバーストを同定するシステムの紹介 (初心者向け)
PDF
ご当地グルメを題材とする4択クイズの生成
PDF
ウォーゲーム:StarCraftの戦略推薦
PDF
ゲーム攻略サイトを網羅的に収集し、攻略情報を集約する
PDF
シナリオを情報源とする映画の要約
PDF
TOPPERSプロジェクト紹介 OSC2016京都
PDF
乳幼児の認知発達を誘発する売れ筋絵本を推薦する
PDF
組込み向けスクリプト言語mrubyをEV3で動かしてみよう
PDF
対話システム, 南泰浩
PPTX
Unityで音声認識
PPTX
自然言語処理
ゲームのレビューから収集した意見の集約
質問・回答サイトにおけるトラブル相談事例の分析
時系列トピックのバーストを同定するシステムの紹介 (初心者向け)
ご当地グルメを題材とする4択クイズの生成
ウォーゲーム:StarCraftの戦略推薦
ゲーム攻略サイトを網羅的に収集し、攻略情報を集約する
シナリオを情報源とする映画の要約
TOPPERSプロジェクト紹介 OSC2016京都
乳幼児の認知発達を誘発する売れ筋絵本を推薦する
組込み向けスクリプト言語mrubyをEV3で動かしてみよう
対話システム, 南泰浩
Unityで音声認識
自然言語処理
Ad

Similar to 複数人と対話可能な音声対話ロボットの構築 (11)

PDF
Nishimoto110111twcu p2
PDF
人間とのインタラクションにより言葉と行動を学習するロボット, 岩橋直人
PDF
記号を用いたコミュニケーションを実現するために何が必要か?― 記号創発ロボティクスの 視点から ―
PDF
人間とのインタラクションにより言葉と行動を学習するロボット(岩橋 直人)
PDF
生活支援ロボットのマルチモーダル言語理解技術
PPTX
連続音声からの語彙学習と 自動巡回ロボットへの応用
PDF
ロボカップ@ホーム入門
PPT
探索的検索のための音声入力インタフェースの検討
PDF
ロボティクスにおける言語の利活用
PDF
ロボットの音声コミュニケーション技術:言葉や能力の壁を越えるデータ指向知能に向けて
PDF
論文読み 20170525
Nishimoto110111twcu p2
人間とのインタラクションにより言葉と行動を学習するロボット, 岩橋直人
記号を用いたコミュニケーションを実現するために何が必要か?― 記号創発ロボティクスの 視点から ―
人間とのインタラクションにより言葉と行動を学習するロボット(岩橋 直人)
生活支援ロボットのマルチモーダル言語理解技術
連続音声からの語彙学習と 自動巡回ロボットへの応用
ロボカップ@ホーム入門
探索的検索のための音声入力インタフェースの検討
ロボティクスにおける言語の利活用
ロボットの音声コミュニケーション技術:言葉や能力の壁を越えるデータ指向知能に向けて
論文読み 20170525
Ad

More from utsuro_lab (16)

PDF
機械学習による球面リバーシ(オセロ)AIの開発
PPTX
各プレーヤー視点での役職確定情報に基づく人狼ログ・ダイジェストの作成
PDF
社会センサーとしての検索エンジンを用いて市場シェアを予測しよう
PDF
球面リバーシ(オセロ)
PDF
ウェブ検索者の情報要求観点の集約と俯瞰に関する研究
PDF
「みんなが調べた」のに「Wikipediaには書いてない」ことを集約・俯瞰する
PDF
検索エンジン・エンハンスト・サジェスト・・・サジェストを補足する
PDF
音声を検索するための索引付け方式の紹介(専門家向け)
PDF
音声を検索するための索引付け方式の紹介(初心者向け)
PDF
ニュース・ツイッター間の対応を考慮したバースト・トピックの同定
PDF
大規模ブロガー空間からブロガーを収集し、ブロガー・コミュニティを自動生成・自動拡張する
PDF
大規模ブロガー空間において、関心事項ごとのコミュニティを発見する
PDF
大規模ブロガー空間において、関心事項ごとのコミュニティを発見する
PDF
Wikipediaの知識を総動員して、話題の分布を俯瞰する
PDF
日中時系列ニュースにおけるトピックモデルの推定と二言語間対応の同定
PDF
時系列トピックのバーストを同定するシステムの紹介 (初心者向け・旧版)
機械学習による球面リバーシ(オセロ)AIの開発
各プレーヤー視点での役職確定情報に基づく人狼ログ・ダイジェストの作成
社会センサーとしての検索エンジンを用いて市場シェアを予測しよう
球面リバーシ(オセロ)
ウェブ検索者の情報要求観点の集約と俯瞰に関する研究
「みんなが調べた」のに「Wikipediaには書いてない」ことを集約・俯瞰する
検索エンジン・エンハンスト・サジェスト・・・サジェストを補足する
音声を検索するための索引付け方式の紹介(専門家向け)
音声を検索するための索引付け方式の紹介(初心者向け)
ニュース・ツイッター間の対応を考慮したバースト・トピックの同定
大規模ブロガー空間からブロガーを収集し、ブロガー・コミュニティを自動生成・自動拡張する
大規模ブロガー空間において、関心事項ごとのコミュニティを発見する
大規模ブロガー空間において、関心事項ごとのコミュニティを発見する
Wikipediaの知識を総動員して、話題の分布を俯瞰する
日中時系列ニュースにおけるトピックモデルの推定と二言語間対応の同定
時系列トピックのバーストを同定するシステムの紹介 (初心者向け・旧版)

複数人と対話可能な音声対話ロボットの構築