Структура и алгоритмы  Q&A  сервиса на примере Воробьев Александр  Witology, R&D WITOLOGY R&D SEMINAR
Карточка компании Год основания: 2007 Основатели:  Max Ventilla, Damon Horowitz, Rob Spiro, and Nathan Stoll Место: Калифорния Владелец:  Google ( с февраля 2010 ) Веб-адрес:  www.vark.com Домашняя страница:
Архитектура платформы
Отбор пользователей для ответов:  Двухэлементная аспектная модель Пользователи Запросы Теги
Учет социальных связей Отбор пользователей для ответа происходит на основе  ранжирующей функции:
Тегирование пользователей
Извлечение тем из обновлений статусов (сообщения в  Twitter , новостные сообщения в  Facebook ). Извлечение тем из сообщений в  Aardvark . Поведение в  Aardvark  в отношении данной темы (активность, скорость ответов). Социальные связи с компетентными в теме пользователями. Оценки его ответов в  Aardvark . Тегирование пользователей Пользователь при регистрации указывает от 3 тем, где он компетентен. Его друзья и приглашающий его участник могут указать темы, где он компетентен (их компетентности в темах при этом должны учитываться). Извлечение тегов из загруженных профайлов ( Facebook ,  LinkedIn  и др.). Извлечение тем из неструктурированного текста с блогов, домашних страниц пользователя, на которые он дал ссылку ( SVM  и  tf - idf  алгоритмы).
Определение социальных связей
Тегирование запросов Введенный в систему запрос проходит следующие предварительные этапы:
Тегирование запросов Далее для запроса выводятся 4 списка тегов с весами:
Определение значимости совпадения Для определения значимости совпадения слова из запроса со словом из документа (список тегов пользователя, профайл пользователя) используется мера значимости  TF-IDF :
Статистика
Статистика

More Related Content

PDF
Программа семинара
PPTX
Ispras (трудаков, коршунов)
PPT
Semantic forse presentation
PPTX
Digital Society Laboratory (Аршавский)
PPT
Со страхом и трепетом и радостью
PPTX
Producto 2 hist
PPT
Redesocialclubedobluetooth com-090618115252-phpapp02
PPT
лес – наше богатство
Программа семинара
Ispras (трудаков, коршунов)
Semantic forse presentation
Digital Society Laboratory (Аршавский)
Со страхом и трепетом и радостью
Producto 2 hist
Redesocialclubedobluetooth com-090618115252-phpapp02
лес – наше богатство

More from Witology (20)

PDF
Жизнь как игра. Комментарий Ростислава Яворского о геймификации в журнале "Ко...
PDF
Интерактивные общественные советы | Приложение 1
PDF
Интерактивные общественные советы | Обращение
PDF
Брошюра о проекте "Сбербанк21 Будущее"
PPTX
Отчет по проекту Совершенствование таможенного администрирования
PPTX
Промежуточные итоги реализации краудсорсинга в рамках Национальной предприним...
PPTX
Отзывы Рабочей группы в рамках Национальной предпринимательской инициативы
PPTX
Отчет по проекту Поддержка доступа на рынки зарубежных стран и поддержка эк...
PDF
Witology company presentation
PDF
Мировой и российский рынки People as the platform
PPTX
Social Organization
PPTX
"Социально-сетевой анализ форумов при помощи пакета UCINet"
PPTX
Алгоритмы анализа графов социальных связей
PPT
Алгоритмы классификации в машинном обучении
PPTX
Интересные результаты RUSSIR'11: WEB of DATA
PPTX
Модели когнитивной психологии и задачи искусственного интеллекта
PPTX
Основы теории менеджмента знаний
PPTX
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
PPTX
Анализ формальных понятий: Применение в Witology
PPT
Методы агрегирования информации и краудсорсинг
Жизнь как игра. Комментарий Ростислава Яворского о геймификации в журнале "Ко...
Интерактивные общественные советы | Приложение 1
Интерактивные общественные советы | Обращение
Брошюра о проекте "Сбербанк21 Будущее"
Отчет по проекту Совершенствование таможенного администрирования
Промежуточные итоги реализации краудсорсинга в рамках Национальной предприним...
Отзывы Рабочей группы в рамках Национальной предпринимательской инициативы
Отчет по проекту Поддержка доступа на рынки зарубежных стран и поддержка эк...
Witology company presentation
Мировой и российский рынки People as the platform
Social Organization
"Социально-сетевой анализ форумов при помощи пакета UCINet"
Алгоритмы анализа графов социальных связей
Алгоритмы классификации в машинном обучении
Интересные результаты RUSSIR'11: WEB of DATA
Модели когнитивной психологии и задачи искусственного интеллекта
Основы теории менеджмента знаний
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Анализ формальных понятий: Применение в Witology
Методы агрегирования информации и краудсорсинг
Ad

Структура и алгоритмы Q&A сервиса на примере Aardvark

  • 1. Структура и алгоритмы Q&A сервиса на примере Воробьев Александр Witology, R&D WITOLOGY R&D SEMINAR
  • 2. Карточка компании Год основания: 2007 Основатели: Max Ventilla, Damon Horowitz, Rob Spiro, and Nathan Stoll Место: Калифорния Владелец: Google ( с февраля 2010 ) Веб-адрес: www.vark.com Домашняя страница:
  • 4. Отбор пользователей для ответов: Двухэлементная аспектная модель Пользователи Запросы Теги
  • 5. Учет социальных связей Отбор пользователей для ответа происходит на основе ранжирующей функции:
  • 7. Извлечение тем из обновлений статусов (сообщения в Twitter , новостные сообщения в Facebook ). Извлечение тем из сообщений в Aardvark . Поведение в Aardvark в отношении данной темы (активность, скорость ответов). Социальные связи с компетентными в теме пользователями. Оценки его ответов в Aardvark . Тегирование пользователей Пользователь при регистрации указывает от 3 тем, где он компетентен. Его друзья и приглашающий его участник могут указать темы, где он компетентен (их компетентности в темах при этом должны учитываться). Извлечение тегов из загруженных профайлов ( Facebook , LinkedIn и др.). Извлечение тем из неструктурированного текста с блогов, домашних страниц пользователя, на которые он дал ссылку ( SVM и tf - idf алгоритмы).
  • 9. Тегирование запросов Введенный в систему запрос проходит следующие предварительные этапы:
  • 10. Тегирование запросов Далее для запроса выводятся 4 списка тегов с весами:
  • 11. Определение значимости совпадения Для определения значимости совпадения слова из запроса со словом из документа (список тегов пользователя, профайл пользователя) используется мера значимости TF-IDF :