SlideShare a Scribd company logo
Pepperと
Watson音声関連API
Forex Robotics 株式会社
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
まず最初に
これは失敗談です。
_| ̄|○
お気軽にお聞き流しください。
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
機械学習
市場予測システムの
研究開発
その他API研究開発
ロボット
ロボットアプリ開発
開発支援
金融
MT4 EA開発
開発支援
髙橋一行
たかはしかずゆき
Forex Robotics株式会社
代表取締役
1+1
社員は1名、1Pepper
(2016年5月現在)
元
トレンドマイクロ株式会社
コンシューマ製品開発、
企画、技術リサーチ
2015
年9月創業
ガレージ起業です。
IBM
Global Entrepreneur
Program 参加
Pepper関連
ハッカソン
2回受賞
認定ロボアプリパートナー
(Basic)
Bluemix
Node-RED
Watson API
DashDB
使い
ロボット
革命
イニシアティブ
正会員
Copyright 2015 Forex Robotics Co. Ltd. Allright Reserved.
ロボットスタート様の業界マップにロボットアプリ開発会社として紹介
出典: Communication Robot Industy Map / 2016 Q1 / Japan robot start inc.
本題:ある日、
Pepper開発支援先のお客様に言われたこと
「Pepperで中国語の翻訳
できないかなぁ?
追加デバイスなしで。」
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
どういうことか?
•小売店の店頭にはPepperがすでに設置済み。
•お店に中国人の団体客様がくる。(バスで来るから50
人くらい?)
•が、中国語が話せるスタッフは2名のみ。
•Pepperが「日本語中国語」翻訳してくれれば、日本語
しか話せないスタッフでも対応できる。
•Pepperをリースしてるから、追加コストはかけられない。
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
ところが、
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
音声認識
Speech to text
音声合成
Text to speech
テキスト翻訳
Language Translation
Pepperの音声認識機能では
フリーワードの認識は苦手。(というかほとんどできない)
でもPepper + Watsonの連携ならできるんじゃないか?
しかしそんなに甘くなかった。。。
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
音声認識
Speech to text
音声合成
Text to speech
テキスト翻訳
Language Translation
英語
ポルトガル語
スペイン語
フランス語
アラビア語
英語(UK)
ポルトガル語
(ブラジル)
英語(US)
日本語
中国語
(北京語)
アラビア語
スペイン語
スペイン語
英語(US,UK)
ポルトガル語
(ブラジル)
フランス語
ドイツ語
イタリア語
日本語
き、機能がつながらない!( ゚Д゚)
さらに追い打ち
Pepperのマイクはノイズを拾いやすい問題
• 推測
• Pepperのマイクは頭頂部にある。
• 頭部にはファンもついているため、ノイズを拾いやすい。
• 音声データ自体がWatson音声認識には不利な状況。
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
本来は無音状態のはず
Pepperからだと
Watsonでなかなか正しく認識できない問題
• 千 売り場は どこで
• うん 無理は どこ
• チェン氏は どこです
• 支援 おりはどこ で
• D_エー売り場とか
• 遅延 売りは どこで
• チェーン 売り場 とこ です
• D_エー売り は どこ です
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
(例)
「チェーン売り場は
どこですか?」
そもそも音声認識とは
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
O H A
1.波形ら母音と、子音の認識
千
チェン
遅延
チェーン
2.認識した音から単語を類推
• 推測
• 単語を選択する際に、頻度の高い単語に寄せられてしまうのではないか?
• とすると、専門用語の出現頻度は低いので認識率は下がる可能性がある。
• そもそも登録されていない単語は認識しない可能性もあり。
まとめ
• Pepperの音声認識機能ではフリーワードの認識は難しい。
• Watsonの音声認識APIは、Pepperでのフリーワード音声認
識を補完してくれる頼もしい存在。
• でも日本語中国語翻訳はWatson APIだけでは実現でき
なかった。(2016年5月現在)
• Watsonの音声認識への要望
• 専門用語の認識が苦手なので、頻度調整機能が欲しい。
• ノイズに関する機能改善ができると最高!
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
でも、最終的にプロトタイプは作りました
• 実演デモを見たい方はロボットフォーラム2016(7月、8月)で参考出展予定
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
http://youtu.be/tTufpC5xReo
最後に
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.
ロボットと基幹システムの連携などのお仕事を募集してます!
協力会社などの仲間も募集中!
一緒に業界を盛り上げましょう
http://forexrobotics.jp/contact.html
お問い合わせは以下まで、
ご清聴ありがとうございました
Copyright ©2015 – 2016 Forex Robotics Co. Ltd. All rights Reserved.

More Related Content

PDF
IBM Bluemix + Watson(MS) + Eagle Eye で行う 表情認識システム
PDF
SoftLayerで始めるデジタルマーケティング
PDF
Pepperで翻訳ソフトを作ってみた
PDF
PHP,Go,Elasticsearchによる、@cosmeを5倍速くする取り組み
PPTX
デブサミ2016 | 日本発IoTプラットフォームビジネスへの挑戦 SORACOM 立ち上げ格闘記
PDF
20160621 KDL_monacaソリューションセミナー
PDF
Mobilitydev2019 10 31_slideshare
PDF
kintone hive ライトニングトーク M-SOLUTIONS 植草様
IBM Bluemix + Watson(MS) + Eagle Eye で行う 表情認識システム
SoftLayerで始めるデジタルマーケティング
Pepperで翻訳ソフトを作ってみた
PHP,Go,Elasticsearchによる、@cosmeを5倍速くする取り組み
デブサミ2016 | 日本発IoTプラットフォームビジネスへの挑戦 SORACOM 立ち上げ格闘記
20160621 KDL_monacaソリューションセミナー
Mobilitydev2019 10 31_slideshare
kintone hive ライトニングトーク M-SOLUTIONS 植草様

What's hot (19)

PDF
サイオステクノロジー
PPTX
アプリエンジニアでもできる閉域網構築のススメ!
PDF
Self-Driving System with IoT
PDF
20180119 AI で業務効率化 ~B To Employee ではじめる Chat Bot~
PDF
SoftLayer Bluemix Community Festa 2016 Program Guide
PPTX
大阪Innovation egg 第6回資料:SORACOM AirやBeamそして新サービスについて
PDF
カメラを利用したアプリを作って約1000人で遊んだ話
PDF
【SoftLayerのスタートアップ企業支援プログラム Catalyst事例】テラスマイル株式会社
PPTX
kintone アプリ & バーコード活用 & Excel 連携
PPTX
StrongLoopでサクっと始めるAPIエコノミー
PDF
Bluemixで実現する高速CMS環境と活用方法
PPTX
Reproではじめるアプリのグロースハック_20160621_monaca
PDF
Monacaソリューションセミナー20160621
PDF
【C-3】なぜ顧客はsfa製品からkintoneに移行するのか
PDF
Val研究所
PDF
Api meet up online#6 session1 ginco
PPTX
SORACOM Conference Discovery 2017 | B4. IoT、クラウド、CIOは技術にどう向き合うか
PDF
AI for Media 2018 Updateセミナー: 株式会社Jストリーム様: AI動画解析に対応!動画配信基盤 ”VideoAid” のご紹介
PDF
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
サイオステクノロジー
アプリエンジニアでもできる閉域網構築のススメ!
Self-Driving System with IoT
20180119 AI で業務効率化 ~B To Employee ではじめる Chat Bot~
SoftLayer Bluemix Community Festa 2016 Program Guide
大阪Innovation egg 第6回資料:SORACOM AirやBeamそして新サービスについて
カメラを利用したアプリを作って約1000人で遊んだ話
【SoftLayerのスタートアップ企業支援プログラム Catalyst事例】テラスマイル株式会社
kintone アプリ & バーコード活用 & Excel 連携
StrongLoopでサクっと始めるAPIエコノミー
Bluemixで実現する高速CMS環境と活用方法
Reproではじめるアプリのグロースハック_20160621_monaca
Monacaソリューションセミナー20160621
【C-3】なぜ顧客はsfa製品からkintoneに移行するのか
Val研究所
Api meet up online#6 session1 ginco
SORACOM Conference Discovery 2017 | B4. IoT、クラウド、CIOは技術にどう向き合うか
AI for Media 2018 Updateセミナー: 株式会社Jストリーム様: AI動画解析に対応!動画配信基盤 ”VideoAid” のご紹介
AI for Media 2018 Update セミナー: 株式会社ユニゾンシステム: スピーチ AI を活用した文字起こしプラットホームの活用
Ad

PepperとWatson音声関連API