SlideShare a Scribd company logo
Ml and its bright future
Светлое будущее с
Machine Learning
Сергей Мелехин
Определение
“A computer program is said to learn from experience E
with respect to some class of tasks T and performance
measure P if its performance at tasks in T, as measured
by P, improves with experience E.”
Mitchell, T. (1997). Machine Learning. McGraw Hill. p. 2. ISBN 0-07-042807-7
Суть
Суть
Y = f(X)
hΘ
(X) ≈ Y
Куда бежать?
В порядке увеличения трудозатрат
(1) Использование готовых сервисов и API
(2) Дообучать готовую модель
(3) Разрабатывать и обучать собственные модели
Более
гибко, но
больше
усилий
Cloud Machine
Learning APIs
See, Hear and
Understand the
world
Cloud
Natural Language
Cloud
Speech
Cloud
Translate
Cloud
Vision
99
Vision API Demo
https://cloud.google.com/vision/
Лица
Лица, части лица, эмоции
OCR
Распознавание текста
Классификация
Определяет объекты на картинке
Логотипы
Распознаёт известные логотипы
Палитра
Выдаёт палитру
доминирующих цветов
NSFW
Распознаёт разные
неприличности
Cloud Vision API
Vision API: Определение объектов
Image Detected
Items
Vision API Р
JSON запрос с
изображением
или URL
Получение
результата
в JSON
Запрос к
REST API1 2 3
Confidential & ProprietaryGoogle Cloud Platform 12
Cloud Natural Language API
Разделение текста на предложения,
выделение частей речи и
зависимостей в предложении.
Выделение объектов вроде
личностей, организаций, событий,
мест и т.д.
Определение эмоциональной окраски
текста.
Синтаксический анализ Выделение объектов
Анализ эмоциональной окраски
1313
Natural Language API Demo
https://cloud.google.com/natural-language
Confidential & ProprietaryGoogle Cloud Platform 14
Cloud Speech API
Распознавание речи для
голосового взаимобедйствия с
вашими приложениями или
Speech to Text преобразования.
Распознаёт более 80
языков мира.
Возвращает
предварительные
результаты по мере
поступления данных.
Отвфильтровывайте
неприемлимый контент.
Аудио может подаваться напрямую с
микрофона устройства, либо в виде файлов в
различных форматах, например FLAC, AMR,
PCMU and linear-16.
Справляется с зашумлённым
сигналом и не требует
дополнительного
шумоподазвления.
Аудио файлы могут содержаться
прямо в запросе, либо
находиться на Google Cloud
Storage (в будущих релизах).
Распознавание речи Словарный запас Фильтрация
Потоковое
распознавание
Раскознавание в реальном времени Зашумлённый сигнал Гибкий API
1515
Cloud Speech API Demo
https://cloud.google.com/speech/
Чего ещё почитать?
Codelabs
codelabs.developers.google.com/codelabs/cloud-vision-intro/index.html
codelabs.developers.google.com/codelabs/cloud-speech-intro/index.html
codelabs.developers.google.com/codelabs/cloud-nl-intro/index.html
For Developers
cloud.google.com/vision/
cloud.google.com/speech/
cloud.google.com/natural-language/
cloud.google.com/translate/
Stack Overflow
Mobile Vision
API
Компьютерное
зрение
работающее
прямо на
устройстве
Android
Face API
Лица, глаза, улыбки...
Barcode API
1D и 2D штрихкоды
Text API
Распознавание текстов
Common Mobile Vision API
Поддержка быстрого определения и отслеживания объектов прямо на устройстве
NEW!
Googly Eyes Android App
Video credit Google
1. Объявляем Face Detector и получаем части лица
3. Для каждого лица рисуем глаза
FaceDetector detector = new FaceDetector.Builder()
.setLandmarkType(FaceDetector.ALL_LANDMARKS)
.build();
SparseArray<Face> faces = detector.detect(image);
for (int i = 0; i < faces.size(); ++i) {
Face face = faces.valueAt(i);
for (Landmark landmark : face.getLandmarks()) {
// Draw eyes
2. Получаем список лиц на картинке
Face API
Photo credit developers.google.com/vision
Простой Java API
image detected
items
Detector
1. Создаём объект detector
2. detectedItems = detector.detect(image)
Photo credit developers.google.com/vision
Text Detection
Тексты на языках с латиницей
Распознаёт структуру текста.
Photo credit Getty Images
Структура текста
Blocks
Lines
Words
Lines
Words Words Words
Распознавание
штрихкодов
1D barcodes
EAN-13/8
UPC-A/E
Code-39/93/128
ITF
Codabar
2D barcodes
QR Code
Data Matrix
PDF-417
AZTEC
UPC
DataMatrix
QR Code
PDF 417
Video and image credit Google
Combined Vision & Translation
Примеры и документация
Googly Eyes Code Sample
github.com/googlesamples/android-vision/tree/master/visionSamples/googly-eyes
Codelabs
codelabs.developers.google.com/codelabs/face-detection/
codelabs.developers.google.com/codelabs/mobile-vision-ocr/
Mobile Vision Developers
developers.google.com/vision/
GitHub Code Samples
github.com/googlesamples/android-vision
Stack Overflow
Ищите и задавайте вопросы с тегом android-vision
● Open source ML
библиотека
● Оптимизирована для
Deep Learning
● Для исследований и
production
● Лицензия Apache 2.0
Hello World
Image from https://github.com/mnielsen/neural-networks-and-deep-learning
?
Что видим мы Что “видит” компьютер
Ml and its bright future
3131
TensorFlow Playground Demo
http://playground.tensorflow.org/
Множество примеров на tensorflow.org
Codelab - goo.gl/xGsB9d Video - goo.gl/B2zYWN
TensorFlow for Poets
Mobile TensorFlow
Claude Monet - Bouquet of Sunflowers
Images from the Metropolitan Museum of Art (with permission) Image by @random_forests
Многомерный вектор
Граф операций
Граф потока данных
Модель задаётся в виде направленного
ациклического графа
● Граф задаётся на языке высокого уровня
(обычно Python)
● Граф компилируется и оптимизируется
● Граф выполняется на доступных устройствах
(CPU, GPU)
● Данные (в виде тензоров) проходят через
вершины графа
● TensorFlow вычисляет градиенты автоматически
Архитектура
● Ядро на C++
● Биндинги на Python и C++
Core TensorFlow Execution System
CPU GPU Android iOS ...
C++ front end Python front end ...
Raspberry
Pi
DatacentersYour laptop Android iOS
Портируемый и масштабируемый
/Serving
Open-source решение для хостинга моделей
http://googleresearch.blogspot.com/2016/05/announcing-syntaxnet-worlds-most.html
spotted salamander fire salamander retriever
Распознавание изображений с
помощью Inception
https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html
Ml and its bright future
Ml and its bright future
Image source: Wikimedia
+ =
A Neural Algorithm of Artistic Style http://arxiv.org/abs/1508.06576
?
Image source: Wikimedia
+ =
A Neural Algorithm of Artistic Style http://arxiv.org/abs/1508.06576
Image source: Wikimedia
+ =
A Neural Algorithm of Artistic Style http://arxiv.org/abs/1508.06576
goo.gl/fyDxhC
Ml and its bright future
Ml and its bright future
50
[glacier]
Google Photos
Ml and its bright future
Smart reply
in Inbox by Gmail
10%
of all responses
sent on mobile
tensorflow.org
github.com/tensorflow
Хотите знать болше?
Coursera by Andrew Ng https://www.coursera.org/learn/machine-learning#
Бесплатный курс на Udacity Deep Learning, goo.gl/iHssII
Специализация на Coursera по-русски:
https://www.coursera.org/specializations/machine-learning-data-analysis
Инструкции, видео
MNIST for Beginners, goo.gl/tx8R2b
TF Learn Quickstart, https://goo.gl/6k2BaX
TensorFlow for Poets, goo.gl/bVjFIL
ML Recipes, goo.gl/KewA03
TensorFlow and Deep Learning without a PhD, goo.gl/pHeXe7
Хочу всё знать!
Ml and its bright future

More Related Content

PPTX
CodeFest 2011. Сошников Д. — Разработка игр для Windows Phone 7
PPTX
Как делать глобальный проект
PPTX
Локализация - как делать глобальный проект?
PPTX
Go Mobile! Windows Phone 7 for all
PDF
DDD Workshop
PPTX
Микросервисы в .NET Core
PPTX
настоящий нейронет сталь
PPTX
О сиськах, лени и некомпетентности (презентация для партнеров Adobe)
CodeFest 2011. Сошников Д. — Разработка игр для Windows Phone 7
Как делать глобальный проект
Локализация - как делать глобальный проект?
Go Mobile! Windows Phone 7 for all
DDD Workshop
Микросервисы в .NET Core
настоящий нейронет сталь
О сиськах, лени и некомпетентности (презентация для партнеров Adobe)

Similar to Ml and its bright future (20)

PPTX
Python-технология которую легко продавать!
PDF
Особенности тестирования мобильных приложений (Android, iOS)
PDF
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
PPTX
DLR Hosting
ODP
игровая логика, проблемы и решения
PPT
Разработка мобильных приложений под Android на примере детских мобильных прил...
PPT
С.Лалов "Corona SDK для разработки кроссплатформенных приложений", DUMP-2014
PPSX
Programming history. Algorithm
PPT
4CIO.ppt
PPT
4CIO.ppt
PDF
Видеозвонки и шаринг экрана в мобильном приложении
PPT
инструменты веб разработчика
PPTX
Безболезненная гаджетизация вашей площадки
PPTX
[RU] Connecting AutoCAD and Python (by Alex Bausk)
PPTX
Эмоции в разработки. Спасаем продуктивность
PDF
"IntelliJ IDEA и Android Studio для Android-разработчиков". Филипп Торчинский...
PPTX
SECR2013: Как научить ваших детей программировать
PDF
Павел Федотовский «Как мы разрабатывали приложение для DotNetRu на Xamarin.Fo...
PDF
Inevitability of the cloud 2015 (Russ)
PPT
Mind map
Python-технология которую легко продавать!
Особенности тестирования мобильных приложений (Android, iOS)
Alexey Savchenko, Evangelist, Unreal Engine/ Epic Games
DLR Hosting
игровая логика, проблемы и решения
Разработка мобильных приложений под Android на примере детских мобильных прил...
С.Лалов "Corona SDK для разработки кроссплатформенных приложений", DUMP-2014
Programming history. Algorithm
4CIO.ppt
4CIO.ppt
Видеозвонки и шаринг экрана в мобильном приложении
инструменты веб разработчика
Безболезненная гаджетизация вашей площадки
[RU] Connecting AutoCAD and Python (by Alex Bausk)
Эмоции в разработки. Спасаем продуктивность
"IntelliJ IDEA и Android Studio для Android-разработчиков". Филипп Торчинский...
SECR2013: Как научить ваших детей программировать
Павел Федотовский «Как мы разрабатывали приложение для DotNetRu на Xamarin.Fo...
Inevitability of the cloud 2015 (Russ)
Mind map
Ad

More from Sergey Melekhin (13)

PPTX
Deeper learning dev fest nn
PPTX
Docker for developers
PDF
Dev fest siberia 2017 build a robot
PPTX
How deep is deep learning
PPTX
Project tango
PDF
Основные подходы к организации Highload сервисов
PDF
NoCaptcha
PDF
Почему Терминаторы нам пока не страшны
PDF
Angular2
PPT
Халява, Please!
PDF
Синие против красных
PDF
Волков не бояться! Бизнес логика и РСУБД
Deeper learning dev fest nn
Docker for developers
Dev fest siberia 2017 build a robot
How deep is deep learning
Project tango
Основные подходы к организации Highload сервисов
NoCaptcha
Почему Терминаторы нам пока не страшны
Angular2
Халява, Please!
Синие против красных
Волков не бояться! Бизнес логика и РСУБД
Ad

Ml and its bright future