29 августа | 20:00 МСК
Открытый урок курса
Reinforcement Learning

Основные алгоритмы обучения с подкреплением SARSA и Q-learning

На Python "с нуля" реализуем два алгоритма обучения с подкреплением и убедимся, что наш агент успешно обучается.

  • уравнение Беллмана - основное уравнение в обучении с подкреплением;
  • метод SARSA - метод итеративного обучения агента;
  • метод Q-learning - метод итеративного оптимального обучения агента.
На вебинаре разберем:
Этот вебинар будет полезен:
начинающим специалиста по машинному обучению, которые стремятся расширить свой набор навыков и инструментов обучением с подкреплением
Узнаем, что такое обучение с подкреплением и чем оно принципиально отличается от других подходов машинного обучения; что такое функция ценности состояния и функция ценности действия-состояния, как они связаны между собой и как помогают нашему агенту учиться.
В результате вебинара:
Спикер
Более 15 лет занимался прикладной математикой и мат. моделированием в НИИгазэкономика ПАО Газпром.

Руководил командой 20+ человек, решающей прикладные задачи, вывод готовых моделей в продакшн и поддержку решений у клиента.

Разрабатывал модель развития и прогнозирования технического состояния газотранспортной системы ПАО Газпром.

Образование: кандидат наук физико-математических наук, Теоретическая физика, Московский государственный университет (МГУ)
Игорь Стурейко
Все участники вебинара получат
Запись открытого вебинара
Бесплатный урок
курса
Сертификат со скидкой на покупку курса
Запишитесь на мероприятие
И мы пришлем вам напоминание перед стартом вебинара, чтобы ничего не пропустить
Открытый урок курса
Reinforcement Learning
Основные алгоритмы обучения
с подкреплением SARSA и Q-learning
29 августа 20:00 МСК
Спикер:
Игорь Стурейко
Поздравляем, вы записаны на мероприятие
Выберите удобный способ получить бонусы и напоминание о предстоящем вебинаре
Открытый урок курса
Reinforcement Learning
Основные алгоритмы обучения
с подкреплением SARSA и Q-learning
29 августа 20:00 МСК
Спикер:
Игорь Стурейко