SlideShare a Scribd company logo
Команда Rock Band
Rock Band
Reinforcement Learning – что это?
Данные
Алгоритм
Profit
Данные
Алгоритм
…………….Profit
SupervisedLearning
ReinforcementLearning
Настольные игры
Компьютерные игры
Аналитика динамический процессов
Обучение роботов простым действиям
Reinforcement Learning – зачем это нужно?
Q-learning – пытаемся предсказать будущее
Картинка с экрана
(как её видит человек)
Нейронная сеть
Предсказание действия, которое
принесет больше очков
Prioritized Sampling
Random Sampling (by Google DeepMind) Prioritized Sampling (based on Prioritized Sweeping 1993)
Для обучения выбираются
случайные игры в прошлом
Выбираются самые «интересные
игры» - те, в которых результат был
неожиданным для алгоритма
Игры отборочного тура: Gopher
Игры отборочного тура: Seaquest
Игры отборочного тура: Tutankhamon

More Related Content

PPTX
Analytics: use it or lose it!
PPTX
DeepHack.Game Life Propagation team
PDF
Intro to Deep Reinforcement Learning
PPTX
DeepHack.Game 5vision team
PPTX
DeepHack.Game Skynet team
PDF
Experiential Marketing and Deep Learning
PDF
Presentation dl beyond-the_hype-v0.3
PDF
Deep learning beyond_the_hype-franceia@lapaillasse
Analytics: use it or lose it!
DeepHack.Game Life Propagation team
Intro to Deep Reinforcement Learning
DeepHack.Game 5vision team
DeepHack.Game Skynet team
Experiential Marketing and Deep Learning
Presentation dl beyond-the_hype-v0.3
Deep learning beyond_the_hype-franceia@lapaillasse

DeepHack.Game Rock band team