SlideShare a Scribd company logo
ВИРТУАЛЬНЫЙ ПОМОЩНИК
С РАСПОЗНАВАНИЕМ И СИНТЕЗОМ РЕЧИ

               ПРОБЛЕМЫ И РЕШЕНИЯ
О КОМПАНИИ ЦРТ


                    КОМАНДА ЦРТ
                    • Более 350 человек
                    • 28 кандидатов и
                      докторов наук
                                          КАФЕДРА ЦРТ
ТЕХНОЛОГИИ                                В ИТМО
                                          •   Магистратура
•   Распознавание речи
                                          •   Аспирантура
•   Синтез речи
                                          •   Дополнительное образование
•   Голосовая биометрия
•   Запись и анализ речи

                           ПРОДАЖИ
                           • Офисы в 6 странах мира
                           • Продажи в 75 странах

                                                                           2
ЦРТ - ЛИДЕР ПО ПРОЕКТАМ СГС В РОССИИ




                                       3
РЕЧЕВЫЕ ТЕХНОЛОГИИ И ВИРТУАЛЬНЫЕ ПОМОЩНИКИ

                        Виртуальный помощник – это компьютерный персонаж,
                        предоставляющий пользователю необходимую
                        информацию через:
                         WEB

                         Мобильные устройства

                         Терминалы самообслуживания

                           40 производителей
                           5 поколений
                           2-е поколение – синтез речи
                           3-е поколение – распознавание речи




                        Виртуальный помощник сегодня – это
                        мультимодальная система, способная
                        вести с пользователем диалог в режиме
                        «speech-to-speech»


                                                                            4
КОМПОНЕНТЫ И ТРЕБОВАНИЯ




           Основной показатель эффективности виртуального
                 помощника – релевантность ответов

                        Релевантность зависит от:
                         точности распознавания речи
                         качества синтеза речи

                                                            5
КАК ПОЛУЧИТЬ КАЧЕСТВЕННЫЙ ЗВУК?


 Точность распознавания речи зависит от качества
  звука

 Множество различных микрофонов и настроек на
  компьютерах пользователей

 Необходимость подтверждать осуществление
  доступа к микрофону




 Пользователь должен нажимать на кнопку (push-
  to-talk)

 Задача двухканальной шумоочистки и режим
  hotword bargein
                                                    6
КАК ПОВЫСИТЬ ТОЧНОСТЬ РАСПОЗНАВАНИЯ РЕЧИ?


             Варианты использования модуля распознавания речи




 1.




 2.




                                                                7
КАК СДЕЛАТЬ ГРАММАТИКИ И ЯЗЫКОВЫЕ МОДЕЛИ?


                               Источники данных




     Поисковые запросы

     Записи звонков
    в контактный центр

     Текстовые запросы
    к виртуальному помощнику

     Метод “Wizard of OZ”




                                                  8
КАКИЕ СТАНДАРТЫ ИСПОЛЬЗОВАТЬ?


                                              ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




            VoiceXML

            Speech Recognition Grammar Specification

            Semantic Interpretation for Speech Recognition

            Speech Synthesis Markup Language

            Speech Input API Specification

            Speech JavaScript API



                                                                           9
КАК ПОВЫСИТЬ КАЧЕСТВО СИНТЕЗА РЕЧИ?


                                            ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




    Использовать голос, соответствующий персонажу

    Провести предварительную настройку на текстах из предметной
     области (специальная лексика, аббревиатуры)

    Настроить синтез основных реплик системы (паузы и интонация)

    Использовать функцию синхронизации губ (lipsync)




                                                                         10
КАК СДЕЛАТЬ ДИАЛОГ БОЛЕЕ ЕСТЕСТВЕННЫМ?


                                           ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




   Использовать автоматический анализ эмоций

   Использовать голосовую идентификацию




                                                                        11
КОМПОНЕНТЫ ПЕРСПЕКТИВНОЙ СИСТЕМЫ


                                   ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ




                                                                12
СПАСИБО ЗА ВНИМАНИЕ!

         ВОПРОСЫ?                                 КОНТАКТЫ

                                   Санкт-Петербург
         ДОКЛАДЧИК:                Адрес: Санкт-Петербург, ул. Красуцкого, 4
                                   Телефон: (+7 812) 325-88-48

   ПЕТР МИЦОВ                      Факс: (+7 812) 327-92-97
                                   Отдел продаж: (+7 812) 325-88-48 доб.1
  Руководитель группы разработки   Эл. почта: stc-spb@speechpro.com
                                   Почтовый адрес: 196084 Санкт-Петербург а/я
   и внедрения систем голосового
                                   515 «Центр речевых технологий»
         самообслуживания
     Центр Речевых Технологий
                                   Москва
      mitsov@speechpro.com         Адрес: Москва, ул. Марксистская, д.3, стр.5,
                                   Бизнес-центр "Таганский", 3 этаж, офис 5.3.1.
                                   Телефон: (+7 495) 661-75-50
                                   Факс: (+7 495) 661-75-17
                                   Эл. почта: stc-msk@speechpro.com




                                                                             13

More Related Content

PDF
Логические алгоритмы классификации
PPT
Lecture1
PDF
4 ling
PPTX
Compreno_Starostin
PPT
Системы автоматической обработки текста и лингвистический автомат
PPTX
Прикладная лингвистика: проблемы моделирования языка в действии
PDF
Логический анализ текстов на противоречия
PDF
Компьютерная лингвистика в Яндексе
Логические алгоритмы классификации
Lecture1
4 ling
Compreno_Starostin
Системы автоматической обработки текста и лингвистический автомат
Прикладная лингвистика: проблемы моделирования языка в действии
Логический анализ текстов на противоречия
Компьютерная лингвистика в Яндексе

Similar to Mitsov (20)

PDF
Открытые коммуникации
PDF
Cti voice technologies scheglov
PDF
Cti voice technologies scheglov
PPTX
RealSpeaker Ru
PPTX
It realspeaker-12/01/12
PPTX
RealSpeaker
PPTX
Real speaker ru
PPTX
test
PPTX
Realspeakerru 06-12
PPTX
Realspeakerru 08-01
PPTX
Цифровой Агент
PPT
Системы автоматического синтеза речи
PPTX
RealSpeaker Ru
PPTX
RealSpeaker
PDF
Голосовая Платформа
PPTX
RealSpeaker - the best innovation startup in Russia (Startup of the year award)
PDF
W2 kneller истрасофт
PPTX
RealSpeaker PRO RUS
PPTX
RealSpeaker RUS
PPTX
RealSpeaker
Открытые коммуникации
Cti voice technologies scheglov
Cti voice technologies scheglov
RealSpeaker Ru
It realspeaker-12/01/12
RealSpeaker
Real speaker ru
test
Realspeakerru 06-12
Realspeakerru 08-01
Цифровой Агент
Системы автоматического синтеза речи
RealSpeaker Ru
RealSpeaker
Голосовая Платформа
RealSpeaker - the best innovation startup in Russia (Startup of the year award)
W2 kneller истрасофт
RealSpeaker PRO RUS
RealSpeaker RUS
RealSpeaker
Ad

More from NLPseminar (20)

PPTX
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
PPTX
Events
PPTX
Tomita
PPT
бетин
PDF
Andreev
PPTX
клышинский
PDF
конф ии и ея гаврилова
PPTX
кудрявцев V3
PPT
rubashkin
PPTX
Vlasova
PDF
Ageev
PPSX
Khomitsevich
PPTX
акинина осмоловская
PDF
Serebryakov
PPT
потапов
PPT
molchanov(promt)
PDF
белканова
PDF
Skatov
PPTX
гвоздикин
PPT
веселов
[ИТ-лекторий ФКН ВШЭ]: Диалоговые системы. Татьяна Ландо
Events
Tomita
бетин
Andreev
клышинский
конф ии и ея гаврилова
кудрявцев V3
rubashkin
Vlasova
Ageev
Khomitsevich
акинина осмоловская
Serebryakov
потапов
molchanov(promt)
белканова
Skatov
гвоздикин
веселов
Ad

Mitsov

  • 1. ВИРТУАЛЬНЫЙ ПОМОЩНИК С РАСПОЗНАВАНИЕМ И СИНТЕЗОМ РЕЧИ ПРОБЛЕМЫ И РЕШЕНИЯ
  • 2. О КОМПАНИИ ЦРТ КОМАНДА ЦРТ • Более 350 человек • 28 кандидатов и докторов наук КАФЕДРА ЦРТ ТЕХНОЛОГИИ В ИТМО • Магистратура • Распознавание речи • Аспирантура • Синтез речи • Дополнительное образование • Голосовая биометрия • Запись и анализ речи ПРОДАЖИ • Офисы в 6 странах мира • Продажи в 75 странах 2
  • 3. ЦРТ - ЛИДЕР ПО ПРОЕКТАМ СГС В РОССИИ 3
  • 4. РЕЧЕВЫЕ ТЕХНОЛОГИИ И ВИРТУАЛЬНЫЕ ПОМОЩНИКИ Виртуальный помощник – это компьютерный персонаж, предоставляющий пользователю необходимую информацию через:  WEB  Мобильные устройства  Терминалы самообслуживания  40 производителей  5 поколений  2-е поколение – синтез речи  3-е поколение – распознавание речи Виртуальный помощник сегодня – это мультимодальная система, способная вести с пользователем диалог в режиме «speech-to-speech» 4
  • 5. КОМПОНЕНТЫ И ТРЕБОВАНИЯ Основной показатель эффективности виртуального помощника – релевантность ответов Релевантность зависит от:  точности распознавания речи  качества синтеза речи 5
  • 6. КАК ПОЛУЧИТЬ КАЧЕСТВЕННЫЙ ЗВУК?  Точность распознавания речи зависит от качества звука  Множество различных микрофонов и настроек на компьютерах пользователей  Необходимость подтверждать осуществление доступа к микрофону  Пользователь должен нажимать на кнопку (push- to-talk)  Задача двухканальной шумоочистки и режим hotword bargein 6
  • 7. КАК ПОВЫСИТЬ ТОЧНОСТЬ РАСПОЗНАВАНИЯ РЕЧИ? Варианты использования модуля распознавания речи 1. 2. 7
  • 8. КАК СДЕЛАТЬ ГРАММАТИКИ И ЯЗЫКОВЫЕ МОДЕЛИ? Источники данных  Поисковые запросы  Записи звонков в контактный центр  Текстовые запросы к виртуальному помощнику  Метод “Wizard of OZ” 8
  • 9. КАКИЕ СТАНДАРТЫ ИСПОЛЬЗОВАТЬ? ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ  VoiceXML  Speech Recognition Grammar Specification  Semantic Interpretation for Speech Recognition  Speech Synthesis Markup Language  Speech Input API Specification  Speech JavaScript API 9
  • 10. КАК ПОВЫСИТЬ КАЧЕСТВО СИНТЕЗА РЕЧИ? ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ  Использовать голос, соответствующий персонажу  Провести предварительную настройку на текстах из предметной области (специальная лексика, аббревиатуры)  Настроить синтез основных реплик системы (паузы и интонация)  Использовать функцию синхронизации губ (lipsync) 10
  • 11. КАК СДЕЛАТЬ ДИАЛОГ БОЛЕЕ ЕСТЕСТВЕННЫМ? ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ  Использовать автоматический анализ эмоций  Использовать голосовую идентификацию 11
  • 12. КОМПОНЕНТЫ ПЕРСПЕКТИВНОЙ СИСТЕМЫ ДОПОЛНИТЕЛЬНЫЕ ВОЗМОЖНОСТИ 12
  • 13. СПАСИБО ЗА ВНИМАНИЕ! ВОПРОСЫ? КОНТАКТЫ Санкт-Петербург ДОКЛАДЧИК: Адрес: Санкт-Петербург, ул. Красуцкого, 4 Телефон: (+7 812) 325-88-48 ПЕТР МИЦОВ Факс: (+7 812) 327-92-97 Отдел продаж: (+7 812) 325-88-48 доб.1 Руководитель группы разработки Эл. почта: stc-spb@speechpro.com Почтовый адрес: 196084 Санкт-Петербург а/я и внедрения систем голосового 515 «Центр речевых технологий» самообслуживания Центр Речевых Технологий Москва mitsov@speechpro.com Адрес: Москва, ул. Марксистская, д.3, стр.5, Бизнес-центр "Таганский", 3 этаж, офис 5.3.1. Телефон: (+7 495) 661-75-50 Факс: (+7 495) 661-75-17 Эл. почта: stc-msk@speechpro.com 13