DeepHack.Game Rock band team

Команда Rock Band
Rock Band

Reinforcement Learning – что это?
Данные
Алгоритм
Profit
Данные
Алгоритм
…………….Profit
SupervisedLearning
ReinforcementLearning

Настольные игры
Компьютерные игры
Аналитика динамический процессов
Обучение роботов простым действиям
Reinforcement Learning – зачем это нужно?

Q-learning – пытаемся предсказать будущее
Картинка с экрана
(как её видит человек)
Нейронная сеть
Предсказание действия, которое
принесет больше очков

Prioritized Sampling
Random Sampling (by Google DeepMind) Prioritized Sampling (based on Prioritized Sweeping 1993)
Для обучения выбираются
случайные игры в прошлом
Выбираются самые «интересные
игры» - те, в которых результат был
неожиданным для алгоритма

Игры отборочного тура: Gopher

Игры отборочного тура: Seaquest

Игры отборочного тура: Tutankhamon

DeepHack.Game Rock band team

More Related Content

Featured (20)

DeepHack.Game Rock band team