hi@realspeaker.org
Виктор Осетров
API для преобразовании речи в текст
Основано на технике глубокого обучения
Получить APIСкачать или
Количество жестких дисков объемом 10 терабайт, которые потребуются российским
операторам связи для хранения всех переговоров в соответствии с «антитеррористическими
законами» Ирины Яровой.
Source: Meduza
3
API для преобразования аудио в текст
Тестовая страница:
https://api.realspeaker.org/recognition/ru-RU
Библиотеки с примерами:
https://bitbucket.org/realspeaker/realspeaker.js
База данных
накопленная
по речи за 3
года
3
API
доступ
Мы делаем API для проверки произношения
Храните в
тексте, а не
в аудио
Ключ
Распознавание
речи в текст
Как это работает
3
Мы делаем API для проверки произношения
Обработка после коммуникации.
Oktell по завершению коммуникации включает свой алгоритм для обработки контента.
В этом алгоритме можно прописать получение пути к записи разговора или копирование этой записи в папку,
которая нам нужна.
Для начала эта запись (stereo) должна быть разбита на два mono файла.
Эти файлы должны быть восприняты системой как единая связка и из этой связки должен сформироваться
диалог с таймингом фраз и обозначением спикера.
Соответственно Oktell должен отправить какой-то запрос в систему, чтобы та забрала файл, при помощи
инструмента запуска внешнего приложения с параметрами можно запустить наше приложение или
воспользоваться функцией запроса WEB формы.
После чего система Oktell должна получить ответ в виде текста (с таймингом и разбиением на диалог). И эту
информацию Oktell поместит в таблицу с помощью sql запроса.
Пример того, как текст должен попасть в таблицу:
Вариант 1 (один из возможных кейсов)
Диалог Оператор Собеседник
12.08.2016 15:01:29
Оператор - Добрый день
меня зовут Петр
12.08.2016 15:01:50
Собеседник - Добрый
хочу кота
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:29
Оператор - Добрый день,
меня зовут Петр
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:50
Собеседник - Добрый, хочу
кота
3
Мы делаем API для проверки произношения
Обработка в конце рабочего дня
В Oktell за весь день в базе данных формируются записи путей к записям разговоров.
Ночью автоматически запускается сценарий, который будет выгружать все пути записей разговоров в файл
или напрямую в приложение.
Также возможен вариант прохода по очереди. Берется запись в базе данных, в которой лежит путь к записи
разговора после чего формируется запрос и отправляется нам на сервер (варианты описаны выше в
варианте 1)
- Приложение или запрос на сервер должно вернуть текст.
- Этот текст помещается в базу данных.
Вариант 2 (один из возможных кейсов)
Диалог Оператор Собеседник
12.08.2016 15:01:29
Оператор - Добрый день
меня зовут Петр
12.08.2016 15:01:50
Собеседник - Добрый
хочу кота
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:29
Оператор - Добрый день,
меня зовут Петр
12.08.2016 15:02:15
Оператор - У нас нету
12.08.2016 15:01:50
Собеседник - Добрый, хочу
кота
более 3,5 тыс платных пользователей
Стоимость
100 000
руб
/500 руб за
расшифровку 1
тыс. минут
Подключение
+API/SDK
Наша команда
Виктор
Осетров
CEO
Алия
Мусина
Finance/
CFO
Артем
Смирнов
CTO
Облака и мобильная
версия
Сегодня
Windows
Локальный рынок
Мультиплатформенность
и
Мультиязычность
ВидениеСтарт
Дорожная карта
Наши преимущества
RealSpeaker 2.0
Д е ш е в л е ,
н е ж е л и х р а н и т ь
а у д и о н а д и с к е
+
Г о т о в ы й
п р о д у к т
р а с п о з н а в а н и я
К о н в е р т а ц и я
ф а й л о в
в
т е к с т
С о б с т в е н н а я
б а з а
д а н н ы х
Снизим Ваши затраты на диски!
realspeaker.net

More Related Content

PPTX
Уязвимости сервисов
PDF
RealSpeaker statistics
PPTX
RealSpeaker RUS для МТС
PPTX
RealSpeaker Rus startup project
PPTX
RealSpeaker
PPTX
It realspeaker-12/01/12
PDF
Презентация реалспикер на русском языке
PDF
RealSpeaker 2.0 for Draper
Уязвимости сервисов
RealSpeaker statistics
RealSpeaker RUS для МТС
RealSpeaker Rus startup project
RealSpeaker
It realspeaker-12/01/12
Презентация реалспикер на русском языке
RealSpeaker 2.0 for Draper

Viewers also liked (7)

PPTX
Personal kitchen hygiene. Preparation for Survival week. Draper University.
PPTX
RealSpeaker for Sberbank
PPTX
3 minpitchrealspeakerlatest
PPTX
RealSpeaker & Forbes
PDF
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
PPTX
Презентация РеалСпикер от 18 марта 2014 года
PPTX
RealSpeaker презентация на русском языке
Personal kitchen hygiene. Preparation for Survival week. Draper University.
RealSpeaker for Sberbank
3 minpitchrealspeakerlatest
RealSpeaker & Forbes
Маркетинговое исследование: Рынок систем распознавания речи 2012-2016 гг.
Презентация РеалСпикер от 18 марта 2014 года
RealSpeaker презентация на русском языке
Ad

Similar to API для преобразования речи в текст (20)

PPT
Информационные ресурсы и сервисы Интернета
PPTX
сетевые протоколы
PPT
Flash Media Server
PPTX
архитектура и принципы работы типового Web приложения
PPT
введение в интернет
DOCX
Аудио в текст.docx
PPT
Твое место во всемирной паутинеи
PPTX
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
PPTX
Natural Language Processing (NLP) with .NET for #dotnetby meetup-29
PPT
Лекция 1. Модель OSI.
PPT
Maleev
PPTX
Html лаб 2
PPT
Инфраструктура социального проекта
PPTX
Python-технология которую легко продавать!
PPTX
Протокол HTTP
PPTX
Cпецкурс 2014, занятие 7. Web-приложения
PPT
4CIO.ppt
PPT
4CIO.ppt
Информационные ресурсы и сервисы Интернета
сетевые протоколы
Flash Media Server
архитектура и принципы работы типового Web приложения
введение в интернет
Аудио в текст.docx
Твое место во всемирной паутинеи
Протокол HTTP. Клиент-серверная модель взаимодействия. Servlet API
Natural Language Processing (NLP) with .NET for #dotnetby meetup-29
Лекция 1. Модель OSI.
Maleev
Html лаб 2
Инфраструктура социального проекта
Python-технология которую легко продавать!
Протокол HTTP
Cпецкурс 2014, занятие 7. Web-приложения
4CIO.ppt
4CIO.ppt
Ad

More from RealSpeaker 2.0 (20)

PDF
20161018204632
PDF
MyRussia18 - 15 слайдов
PDF
Cамый вежливый программист
PPTX
Safe presentation about ticks for Survival week. Draper University
PDF
InvestorDeck RealSpeaker 2.0
PPTX
RealSpeaker 2_0_investor
PPTX
Presentation about the main ideas of the DeepDive (Stanford University)
PPTX
RealSpeaker (Chile 4.0)
PDF
Регистрация компании в США. Древо решений: Делавер или Калифорния
PPTX
Presentation RealSpeaker (3.0) Chile
PPTX
RealSpeaker Chile V 2.0
PPTX
RealSpeaker - Chile v.1.0
PPTX
RealSpeaker Skolkovo SuperLeague presentation (october of 2014)
PPTX
Surviving Malaysia (according to Hofstede model)
PPTX
RealSpeaker Russia September
PPTX
RealSpeaker English September 2014
PPTX
RealSpeaker for Tesla
PPTX
RealSpeaker & MTS
PDF
SCRUM - разработка без начальника
PDF
Протоколы испытаний
20161018204632
MyRussia18 - 15 слайдов
Cамый вежливый программист
Safe presentation about ticks for Survival week. Draper University
InvestorDeck RealSpeaker 2.0
RealSpeaker 2_0_investor
Presentation about the main ideas of the DeepDive (Stanford University)
RealSpeaker (Chile 4.0)
Регистрация компании в США. Древо решений: Делавер или Калифорния
Presentation RealSpeaker (3.0) Chile
RealSpeaker Chile V 2.0
RealSpeaker - Chile v.1.0
RealSpeaker Skolkovo SuperLeague presentation (october of 2014)
Surviving Malaysia (according to Hofstede model)
RealSpeaker Russia September
RealSpeaker English September 2014
RealSpeaker for Tesla
RealSpeaker & MTS
SCRUM - разработка без начальника
Протоколы испытаний

API для преобразования речи в текст

  • 1. hi@realspeaker.org Виктор Осетров API для преобразовании речи в текст Основано на технике глубокого обучения Получить APIСкачать или
  • 2. Количество жестких дисков объемом 10 терабайт, которые потребуются российским операторам связи для хранения всех переговоров в соответствии с «антитеррористическими законами» Ирины Яровой. Source: Meduza
  • 3. 3 API для преобразования аудио в текст Тестовая страница: https://api.realspeaker.org/recognition/ru-RU Библиотеки с примерами: https://bitbucket.org/realspeaker/realspeaker.js
  • 4. База данных накопленная по речи за 3 года 3 API доступ Мы делаем API для проверки произношения Храните в тексте, а не в аудио Ключ Распознавание речи в текст Как это работает
  • 5. 3 Мы делаем API для проверки произношения Обработка после коммуникации. Oktell по завершению коммуникации включает свой алгоритм для обработки контента. В этом алгоритме можно прописать получение пути к записи разговора или копирование этой записи в папку, которая нам нужна. Для начала эта запись (stereo) должна быть разбита на два mono файла. Эти файлы должны быть восприняты системой как единая связка и из этой связки должен сформироваться диалог с таймингом фраз и обозначением спикера. Соответственно Oktell должен отправить какой-то запрос в систему, чтобы та забрала файл, при помощи инструмента запуска внешнего приложения с параметрами можно запустить наше приложение или воспользоваться функцией запроса WEB формы. После чего система Oktell должна получить ответ в виде текста (с таймингом и разбиением на диалог). И эту информацию Oktell поместит в таблицу с помощью sql запроса. Пример того, как текст должен попасть в таблицу: Вариант 1 (один из возможных кейсов) Диалог Оператор Собеседник 12.08.2016 15:01:29 Оператор - Добрый день меня зовут Петр 12.08.2016 15:01:50 Собеседник - Добрый хочу кота 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:29 Оператор - Добрый день, меня зовут Петр 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:50 Собеседник - Добрый, хочу кота
  • 6. 3 Мы делаем API для проверки произношения Обработка в конце рабочего дня В Oktell за весь день в базе данных формируются записи путей к записям разговоров. Ночью автоматически запускается сценарий, который будет выгружать все пути записей разговоров в файл или напрямую в приложение. Также возможен вариант прохода по очереди. Берется запись в базе данных, в которой лежит путь к записи разговора после чего формируется запрос и отправляется нам на сервер (варианты описаны выше в варианте 1) - Приложение или запрос на сервер должно вернуть текст. - Этот текст помещается в базу данных. Вариант 2 (один из возможных кейсов) Диалог Оператор Собеседник 12.08.2016 15:01:29 Оператор - Добрый день меня зовут Петр 12.08.2016 15:01:50 Собеседник - Добрый хочу кота 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:29 Оператор - Добрый день, меня зовут Петр 12.08.2016 15:02:15 Оператор - У нас нету 12.08.2016 15:01:50 Собеседник - Добрый, хочу кота
  • 7. более 3,5 тыс платных пользователей
  • 8. Стоимость 100 000 руб /500 руб за расшифровку 1 тыс. минут Подключение +API/SDK
  • 10. Облака и мобильная версия Сегодня Windows Локальный рынок Мультиплатформенность и Мультиязычность ВидениеСтарт Дорожная карта
  • 11. Наши преимущества RealSpeaker 2.0 Д е ш е в л е , н е ж е л и х р а н и т ь а у д и о н а д и с к е + Г о т о в ы й п р о д у к т р а с п о з н а в а н и я К о н в е р т а ц и я ф а й л о в в т е к с т С о б с т в е н н а я б а з а д а н н ы х
  • 12. Снизим Ваши затраты на диски! realspeaker.net