SlideShare a Scribd company logo
2 search
Поиск в ответе
за всё
Федор Романенко
Качество поиска Яндекса,
ведущий менеджер-эксперт
Поиск – главные компоненты
Поиск - робот
Скачать и обработать интернет

•
•
•
•
•

4

10 млрд. страниц
2000 серверов для кеша
10 петабайт
5 млрд. скачивается ежедневно
50 алгоритмов обхода
Поиск - BigData
Собрать все данные и многократно обработать

•
•
•
•
•

5

все логи (только поиск > 200 млн. хитов в день)
2000 серверов
20 петабайт
500 задач одновременно
1000 факторов ранжирования
Поиск - онлайн
Каждый запрос ищем по всему интернету

•
•
•
•
•
•
•
6

7 дата-центров
20000 серверов
5000 серверов обрабатывает запрос
50мс на поиск по 10 млрд.
10 тыс. деревьев на 1000 факторах для 1 док.
200 млн. запросов в день
2K RPS
Поиск - вертикали
Лучше понимаем мир через моделирование
•
•
•
•

20 вертикалей
отдельные сервисы: Яндекс.Видео, Яндекс.Картинки, ...
моделирование реальности: объекты, а не страницы
типы объектов: видео-клипы, картинки с копиями, товары,
предложения
• майним и агрегируем информацию по объектам

7
Качество
Возникает, когда есть, из чего выбирать
Поиск - качество
Выбираем единицы из миллионов
•
•
•
•

[яндекс] - 20 млн. ответов, нужно выбирать
лингвистика – 20 языков
10 млн. ручных оценок
машинное обучение: 10 тыс. деревьев на 1000
факторах
• 20 формул
• 100 классификаторов
• построение выдачи из вертикалей и колдунщиков
9
Поиск - работа над качеством
Нет одного алгоритма поиска, есть сотни маленьких
•
•
•
•
•
•

10

определяем продуктовые требования
выбираем метрику, чтобы измерить и сравнить
повышаем за счет новых сигналов и других приемов
метрика, по которой все хорошо, - плохая метрика
различных качеств и метрик очень много
проверяем на пользователях: AB-тестинг, TDI
Главное окошко рунета

???
200 миллионов в день

[вконтакте]

[фермионная струна]
[почему я такая умная, а живу как дура]
[продажа заводов по производству несъемной опалубки]
[зачем люди объединяются в группы, что группа дает человеку]
[анджелина джоли]
[ошибка 3004 в itunes при обновлении ios 7, что делать]
[……..]
Единый ответ
Люди начинают решать ВСЕ
задачи через поиск
Единый ответ
Мы можем
• Найти информацию в интернете
Но также и
• Ответить фактом
• Показать видео, дать послушать музыку
• Задать уточняющий вопрос
• Проводить на вертикальный сервис
• Подобрать бизнес
• Начать процесс взаимодействия (Острова)
Ограничений нет!
14
• В поисковом окне люди формулируют все
свои потребности

• Граница между поисковыми
и информационными сервисами условна
• Поиск – это гигантский искусственный супермозг, который должен помочь всем
• Сервис, который к нему не подключен,
не сможет помочь многим
15
Ценности
Яндекс нужен, только пока создает
уникальные ценности для людей:
помогает в онлайне или оффлайне
Нужно использовать сильные стороны
• Top 5: Google, Baidu, Yahoo, Яндекс, Bing
• Dream-team из 5000 человек
• Очень много данных
• Big Data, технологии анализа
• Умеем создавать информационные продукты
• Известность и очень много денег
• 50 млн пользователей на старте
17
Ценности: случаи из жизни

• Поиск с русской морфологией
• Почта без спама
• экосистема Маркета
• Директ для бизнеса
• Пробки по трекам

• ….

18
Онлайн и оффлайн
Онлайн – Яндекс.Новости
Можно почитать Новости на главные темы
в основных изданиях

20
Оффлайн – Яндекс.Такси
Теперь можно вызвать Такси,
которое приедет через 10 мин

21
Сервис будущего?

Придумаем за 10 минут
Яндекс.Пассажир - сделаем

• Блок с GPS+GSM в автобусах
• Мосгортранс: данные о маршрутах и турникетах
• Оцифруем использованные билеты из урн
• Наложим треки людей на граф города
• Машиннообучим оценку времени проезда

23
Яндекс.Пассажир - результат
Пользователям
• Построение маршрутов
Городу

• Поможем ГИБДД настроить светофоры
• Мосгортрансу оптимизировать маршруты
Бизнесу

• Перегруженные линии для частников
Монетизация
• Реклама в автобусах с учетом загрузки
24
Роли и скиллы
Свою роль ты выбираешь сам!
Роли в супер-команде (1/2)
• Разработчик ядра
отличный C++, оптимизация, сети, процессоры
• Разработчик качества
С++, матстатистика, машинное обучение, анализ
данных, математическая культура
• Разработчик-тимлид
отличный разработчик, самостоятельное решение
задач, работа с людьми
• Лингвист
лингвистика, языки, программирование, дата
майнинг
26
Роли в супер-команде (2/2)
• Аналитик
базовое программирование, знание жизни,
матстатистика
• Продуктовый менеджер
знание людей, жизни и отрасли, интуиция, здравый
смысл, грамотность
• Проджект-менеджер
достижение целей, работа с людьми, способность
учиться
• Руководитель сервиса
всё вышеперечисленное, структурное мышление,
ответственность за результат
27
Теперь твоя очередь!
Федор Романенко
Ведущий менеджер-эксперт
качества поиска
+7-903-6841530
fedor57@yandex.ru

Спасибо!

More Related Content

PPT
Конференция Cybermarketing 2015: Быстровыдача. Актуальность и особенности раб...
PPT
DUMP-2013 Наука и жизнь - Найти за одну секунду - Бугай Владимир
PDF
1 search
PDF
Богдан Гаркушин "Способы организации поиска по сайту"
PPTX
инструментарий управления разработкой Mail.ru group, александр горный
PDF
Разработка аналитической системы для высоконагруженного медиа, Олег Новиков, ...
PPTX
Discovering Common Motifs in Cursor Movement Data
PDF
Yandex may 2013 a san-tsan_msan
Конференция Cybermarketing 2015: Быстровыдача. Актуальность и особенности раб...
DUMP-2013 Наука и жизнь - Найти за одну секунду - Бугай Владимир
1 search
Богдан Гаркушин "Способы организации поиска по сайту"
инструментарий управления разработкой Mail.ru group, александр горный
Разработка аналитической системы для высоконагруженного медиа, Олег Новиков, ...
Discovering Common Motifs in Cursor Movement Data
Yandex may 2013 a san-tsan_msan

Viewers also liked (20)

PDF
Дмитрий Щадей "Что помогает нам писать качественный JavaScript-код?"
PDF
Артём Кошелев "Тестирование фронтенда с HtmlElements: разработка быстрее, под...
PDF
Алексей Андросов "Тотальная заморозка = быстрая загрузка"
PDF
Henning Brauer: OpenBSD's pf: Design, Implementation and Future
PDF
John Kenevey, Open Compute "Open Compute Project: history, value proposition...
PDF
"Architecting and testing large iOS apps: lessons from Facebook". Adam Ernst,...
PDF
"Open Mapping on iOS" — Justin Miller, MapBox
PDF
Управлять успешностью продукта или идти вслепую? Исследования для продакт-мен...
PDF
поиск яндекса; архитектура
PDF
Андрей Ковалев - Безопасность сайта: мифы и реальность
PDF
2013 09 14 http-протокол
DOCX
Timothy Wayne Samples (1)
PPTX
Noemi machado deber
PDF
4 ling
PPTX
íNdicelady escobar
PPT
2.capacitación servicio-social-obligatorio
PDF
Tini de Bucourt en India- Revista Hola
PDF
Graphic design
PDF
La nube especial
PPTX
Jogo de xadrez
Дмитрий Щадей "Что помогает нам писать качественный JavaScript-код?"
Артём Кошелев "Тестирование фронтенда с HtmlElements: разработка быстрее, под...
Алексей Андросов "Тотальная заморозка = быстрая загрузка"
Henning Brauer: OpenBSD's pf: Design, Implementation and Future
John Kenevey, Open Compute "Open Compute Project: history, value proposition...
"Architecting and testing large iOS apps: lessons from Facebook". Adam Ernst,...
"Open Mapping on iOS" — Justin Miller, MapBox
Управлять успешностью продукта или идти вслепую? Исследования для продакт-мен...
поиск яндекса; архитектура
Андрей Ковалев - Безопасность сайта: мифы и реальность
2013 09 14 http-протокол
Timothy Wayne Samples (1)
Noemi machado deber
4 ling
íNdicelady escobar
2.capacitación servicio-social-obligatorio
Tini de Bucourt en India- Revista Hola
Graphic design
La nube especial
Jogo de xadrez
Ad

Similar to 2 search (20)

PDF
20131105 романенко
PDF
20131112федорроманенко
PPT
Ashmanov Future Of Se
PPT
Лекция "Архитектура поиска Яндекса"
PPTX
О_Яндексе
PPT
поисковые системы презентация ученика
PPT
Puple's presentation
PDF
Обзор информации о SEO
PDF
Генадій Колтун — Комунізм наступає: що будемо робити, коли машини навчаться п...
PPTX
PPT
История поисковых машин
PPT
Ad Labs фомин 2010 2
PPT
Кто потеснит полнотекстовый поиск?
PDF
Последние тренды поискового маркетинга
PPTX
Медиаклуб «SEO для НКО: инструкция по применению»
PDF
Рождение, философия и инструменты Google 2011
PDF
SemBook. Глава 1. Поисковые системы
PDF
Choister
PDF
Choister
PPTX
Сравнение методов оценки качества поиска — Роман Поборчий, Яндекс
20131105 романенко
20131112федорроманенко
Ashmanov Future Of Se
Лекция "Архитектура поиска Яндекса"
О_Яндексе
поисковые системы презентация ученика
Puple's presentation
Обзор информации о SEO
Генадій Колтун — Комунізм наступає: що будемо робити, коли машини навчаться п...
История поисковых машин
Ad Labs фомин 2010 2
Кто потеснит полнотекстовый поиск?
Последние тренды поискового маркетинга
Медиаклуб «SEO для НКО: инструкция по применению»
Рождение, философия и инструменты Google 2011
SemBook. Глава 1. Поисковые системы
Choister
Choister
Сравнение методов оценки качества поиска — Роман Поборчий, Яндекс
Ad

More from Yandex (20)

PDF
Предсказание оттока игроков из World of Tanks
PDF
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
PDF
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
PDF
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
PDF
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
PDF
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
PDF
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
PDF
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
PDF
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
PDF
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
PDF
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
PDF
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
PDF
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
PDF
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
PDF
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
PDF
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
PDF
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
PDF
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
PDF
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
PDF
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...
Предсказание оттока игроков из World of Tanks
Как принять/организовать работу по поисковой оптимизации сайта, Сергей Царик,...
Структурированные данные, Юлия Тихоход, лекция в Школе вебмастеров Яндекса
Представление сайта в поиске, Сергей Лысенко, лекция в Школе вебмастеров Яндекса
Плохие методы продвижения сайта, Екатерины Гладких, лекция в Школе вебмастеро...
Основные принципы ранжирования, Сергей Царик и Антон Роменский, лекция в Школ...
Основные принципы индексирования сайта, Александр Смирнов, лекция в Школе веб...
Мобильное приложение: как и зачем, Александр Лукин, лекция в Школе вебмастеро...
Сайты на мобильных устройствах, Олег Ножичкин, лекция в Школе вебмастеров Янд...
Качественная аналитика сайта, Юрий Батиевский, лекция в Школе вебмастеров Янд...
Что можно и что нужно измерять на сайте, Петр Аброськин, лекция в Школе вебма...
Как правильно поставить ТЗ на создание сайта, Алексей Бородкин, лекция в Школ...
Как защитить свой сайт, Пётр Волков, лекция в Школе вебмастеров
Как правильно составить структуру сайта, Дмитрий Сатин, лекция в Школе вебмас...
Технические особенности создания сайта, Дмитрий Васильева, лекция в Школе веб...
Конструкторы для отдельных элементов сайта, Елена Першина, лекция в Школе веб...
Контент для интернет-магазинов, Катерина Ерошина, лекция в Школе вебмастеров ...
Как написать хороший текст для сайта, Катерина Ерошина, лекция в Школе вебмас...
Usability и дизайн - как не помешать пользователю, Алексей Иванов, лекция в Ш...
Cайт. Зачем он и каким должен быть, Алексей Иванов, лекция в Школе вебмастеро...

2 search

  • 2. Поиск в ответе за всё Федор Романенко Качество поиска Яндекса, ведущий менеджер-эксперт
  • 3. Поиск – главные компоненты
  • 4. Поиск - робот Скачать и обработать интернет • • • • • 4 10 млрд. страниц 2000 серверов для кеша 10 петабайт 5 млрд. скачивается ежедневно 50 алгоритмов обхода
  • 5. Поиск - BigData Собрать все данные и многократно обработать • • • • • 5 все логи (только поиск > 200 млн. хитов в день) 2000 серверов 20 петабайт 500 задач одновременно 1000 факторов ранжирования
  • 6. Поиск - онлайн Каждый запрос ищем по всему интернету • • • • • • • 6 7 дата-центров 20000 серверов 5000 серверов обрабатывает запрос 50мс на поиск по 10 млрд. 10 тыс. деревьев на 1000 факторах для 1 док. 200 млн. запросов в день 2K RPS
  • 7. Поиск - вертикали Лучше понимаем мир через моделирование • • • • 20 вертикалей отдельные сервисы: Яндекс.Видео, Яндекс.Картинки, ... моделирование реальности: объекты, а не страницы типы объектов: видео-клипы, картинки с копиями, товары, предложения • майним и агрегируем информацию по объектам 7
  • 9. Поиск - качество Выбираем единицы из миллионов • • • • [яндекс] - 20 млн. ответов, нужно выбирать лингвистика – 20 языков 10 млн. ручных оценок машинное обучение: 10 тыс. деревьев на 1000 факторах • 20 формул • 100 классификаторов • построение выдачи из вертикалей и колдунщиков 9
  • 10. Поиск - работа над качеством Нет одного алгоритма поиска, есть сотни маленьких • • • • • • 10 определяем продуктовые требования выбираем метрику, чтобы измерить и сравнить повышаем за счет новых сигналов и других приемов метрика, по которой все хорошо, - плохая метрика различных качеств и метрик очень много проверяем на пользователях: AB-тестинг, TDI
  • 12. 200 миллионов в день [вконтакте] [фермионная струна] [почему я такая умная, а живу как дура] [продажа заводов по производству несъемной опалубки] [зачем люди объединяются в группы, что группа дает человеку] [анджелина джоли] [ошибка 3004 в itunes при обновлении ios 7, что делать] [……..]
  • 13. Единый ответ Люди начинают решать ВСЕ задачи через поиск
  • 14. Единый ответ Мы можем • Найти информацию в интернете Но также и • Ответить фактом • Показать видео, дать послушать музыку • Задать уточняющий вопрос • Проводить на вертикальный сервис • Подобрать бизнес • Начать процесс взаимодействия (Острова) Ограничений нет! 14
  • 15. • В поисковом окне люди формулируют все свои потребности • Граница между поисковыми и информационными сервисами условна • Поиск – это гигантский искусственный супермозг, который должен помочь всем • Сервис, который к нему не подключен, не сможет помочь многим 15
  • 16. Ценности Яндекс нужен, только пока создает уникальные ценности для людей: помогает в онлайне или оффлайне
  • 17. Нужно использовать сильные стороны • Top 5: Google, Baidu, Yahoo, Яндекс, Bing • Dream-team из 5000 человек • Очень много данных • Big Data, технологии анализа • Умеем создавать информационные продукты • Известность и очень много денег • 50 млн пользователей на старте 17
  • 18. Ценности: случаи из жизни • Поиск с русской морфологией • Почта без спама • экосистема Маркета • Директ для бизнеса • Пробки по трекам • …. 18
  • 20. Онлайн – Яндекс.Новости Можно почитать Новости на главные темы в основных изданиях 20
  • 21. Оффлайн – Яндекс.Такси Теперь можно вызвать Такси, которое приедет через 10 мин 21
  • 23. Яндекс.Пассажир - сделаем • Блок с GPS+GSM в автобусах • Мосгортранс: данные о маршрутах и турникетах • Оцифруем использованные билеты из урн • Наложим треки людей на граф города • Машиннообучим оценку времени проезда 23
  • 24. Яндекс.Пассажир - результат Пользователям • Построение маршрутов Городу • Поможем ГИБДД настроить светофоры • Мосгортрансу оптимизировать маршруты Бизнесу • Перегруженные линии для частников Монетизация • Реклама в автобусах с учетом загрузки 24
  • 25. Роли и скиллы Свою роль ты выбираешь сам!
  • 26. Роли в супер-команде (1/2) • Разработчик ядра отличный C++, оптимизация, сети, процессоры • Разработчик качества С++, матстатистика, машинное обучение, анализ данных, математическая культура • Разработчик-тимлид отличный разработчик, самостоятельное решение задач, работа с людьми • Лингвист лингвистика, языки, программирование, дата майнинг 26
  • 27. Роли в супер-команде (2/2) • Аналитик базовое программирование, знание жизни, матстатистика • Продуктовый менеджер знание людей, жизни и отрасли, интуиция, здравый смысл, грамотность • Проджект-менеджер достижение целей, работа с людьми, способность учиться • Руководитель сервиса всё вышеперечисленное, структурное мышление, ответственность за результат 27
  • 29. Федор Романенко Ведущий менеджер-эксперт качества поиска +7-903-6841530 fedor57@yandex.ru Спасибо!