SlideShare a Scribd company logo
Анализ данных:
Data Science
и Data Engineering
Ermakov Petr @ HeadHunter
GeekWeekConf 2015 @ 22.11.2015
http://bit.ly/data_gwc2015
О себе
• HeadHunter, Старший разработчик
• МГТУ им Баумана, Лектор
• https://ru.linkedin.com/in/
ermakovpetr
• https://www.facebook.com/
ermakovpetr
План на лекцию
• Услышим много buzzword’ов
• Увидим кучу разных графиков
• Узнаем как обстоят дела с работой для data
scientist’ов
Апрель 2013 года, delphianalytics.net
Кто такие data scientist’ы?
https://twitter.com/josh_wills/status/198093512149958656
Кто такие data scientist’ы?
http://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
Кто такие data scientist’ы?
http://www.scoop.it/t/what-i-really-do/p/4021709708/2014/05/21/data-scientist
Сколько нужно
data scientist’ов?
Сколько нужно
data scientist’ов?
Сколько нужно
data scientist’ов?
Сколько нужно
data scientist’ов?
http://xkcd.ru/605/
На чем пишут
data scientist’ы?
Какие инструменты используют
data scientist’ы?
Сколько зарабатывают
data scientist’ы?
Как стать data scientist’ом?
http://nirvacana.com/thoughts/becoming-a-data-scientist/
Где готовят
data scientist’ов?
• МФТИ
• ВШЭ
• МГУ
Очные курсы
• Бесплатные
• ШАД: https://yandexdataschool.ru
• ПЗАД: http://www.machinelearning.ru/wiki/index.php?
title=Спецкурс_«Прикладные_задачи_анализа_данных»
• Платные
• New Professions Lab: http://newprolab.com/bigdata/
• Школа данных “Билайн”: http://bigdata.beeline.digital
• MLClass: http://dscourse.mlclass.ru
MOOC
• Mining Massive Datasets https://www.coursera.org/course/
mmds
• Practical Machine Learning https://www.coursera.org/course/
predmachlearn
• Data Analysis and Statistical Inference https://
www.coursera.org/course/statistics
• Core Concepts in Data Analysis https://www.coursera.org/
course/datan
• Statistics: Making Sense of Data https://www.coursera.org/
course/introstats
MOOC
• Introduction to Data Science https://www.coursera.org/course/
datasci
• Natural Language Processing https://www.coursera.org/course/
nlangp
• Neural Networks for Machine Learning https://
www.coursera.org/course/neuralnets
• Machine Learning https://www.coursera.org/course/
machlearning
• Machine Learning https://www.coursera.org/learn/machine-
learning
Meetups
• http://www.meetup.com/Moscow-Data-Science/
• http://www.meetup.com/Moscow-Data-Fest/
• http://www.meetup.com/Moscow-Independent-Data-Science-Meetup/
• https://www.facebook.com/groups/1413405125598651/
• https://www.facebook.com/groups/1505369016451458/
Data Engineer
http://blog.udacity.com/2014/12/data-analyst-vs-data-scientist-vs-data-engineer.html
Data Engineer
Анализ данных кликом
мыши
• Excel
• SAS
• SPSS
• Azure ML
Демонстрация
HeadHunter
• HeadHunter – это интернет-компания
• … а не рекрутер
• Высокие нагрузки:
• ~2k rps
• 1 минута простоя затронет 30k пользователей
Карьерные возможности
HeadHunter
• Java: Hibernate, Spring, Guice, Jersey
• http://hh.ru/vacancy/14729102
• Frontend: HTML, JS, CSS, XSL
• http://hh.ru/vacancy/13987888
• IOS
• http://hh.ru/vacancy/14309333
• Data Scientist: Python, Machine Learning
• http://hh.ru/vacancy/14310288
• Автоматизация тестирования: Java,
Selenium:
• http://hh.ru/vacancy/14309756
• Системный администратор Linux
• http://hh.ru/vacancy/13886018
• Свежие вакансии: http://hh.ru/employer/1455
Школа программистов
HeadHunter
• http://school.hh.ru
• Java, Python, SQL, Networking, Frontend, Git, …
• заканчивается 6 набор
• Набор каждую осень, подписывайтесь на сайте
Спасибо за внимание
До новых встреч
http://bit.ly/data_gwc2015

More Related Content

PDF
Data Science: с чего начать опытному программисту
PDF
Data Engineering Quick Guide
PPTX
Introduction to Data Engineering
PDF
Demystifying Data Engineering
PPTX
Netflix Data Engineering @ Uber Engineering Meetup
PDF
[Impact Lab] IT инструменты для проекта
PDF
Open Data Visualization
PDF
Opendataschool datavis
Data Science: с чего начать опытному программисту
Data Engineering Quick Guide
Introduction to Data Engineering
Demystifying Data Engineering
Netflix Data Engineering @ Uber Engineering Meetup
[Impact Lab] IT инструменты для проекта
Open Data Visualization
Opendataschool datavis

Similar to Анализ данных: Data Science и Data Engineering @ GeekWeekConf 2015 (20)

PDF
Opendataschool datavis
PPT
Большому аналитику - большие данные
PPTX
Дата-журналистика. Визуализация контента
PDF
How to become a Data Scientist
PDF
Opendata practice for Global Editors Hackathon
PDF
Как обучать работе с открытыми данными?
PDF
Обработка данных для построения цифровой истории в журналистике данных
PPT
Data journalism 2013
PPTX
Онлайновые методы проверки источников и контента
PPTX
Современное программное обеспечение в работе психолога
PPTX
Журналистика данных 101
PPTX
Восхождение Гражданской науки о данных
PPTX
Rising of Citizen Data Science
PPTX
!Predictive analyticbasics part1
PDF
Журналистика данных (Data Journalism)
PDF
Data management syllabus
PDF
Base1. Entry 6
PDF
Introduction to Open Data Data Journalism
PDF
10 основных метрик для анализа вашего сайта - 1.12.2014
 
PPTX
ИПК_Социология и метрика интернет сми
Opendataschool datavis
Большому аналитику - большие данные
Дата-журналистика. Визуализация контента
How to become a Data Scientist
Opendata practice for Global Editors Hackathon
Как обучать работе с открытыми данными?
Обработка данных для построения цифровой истории в журналистике данных
Data journalism 2013
Онлайновые методы проверки источников и контента
Современное программное обеспечение в работе психолога
Журналистика данных 101
Восхождение Гражданской науки о данных
Rising of Citizen Data Science
!Predictive analyticbasics part1
Журналистика данных (Data Journalism)
Data management syllabus
Base1. Entry 6
Introduction to Open Data Data Journalism
10 основных метрик для анализа вашего сайта - 1.12.2014
 
ИПК_Социология и метрика интернет сми
Ad

Анализ данных: Data Science и Data Engineering @ GeekWeekConf 2015