Доска объявлений - Услуги, работа - Образование для детей и взрослых - Мастер-классы и курсы

Игорь Стурейко, Андрей Канашов OTUS Reinforcement Learning 2023 год

2000₴

Заказать *

В корзину

* оплата после согласования с продавцом

+380976 ****

добавить в избранное

Характеристики товара:

Состояние	Новое
Для	взрослых
Вид	Курс, Лекции
Язык	Русский

Доставка: в любую страну, указано в объявлении | Днепр | Наложенного платежа нет | Актуально на: 11 июня 2026

Информация о продавце
Premium магазин
"Планета Курсов | Курсы, тренинги, мастер-классы"

Вoлoдимир

Рейтинг 9.70 (100%)

среднее время ответа 20 минут

Статус: Вайбер 0976447425 ТГ @planeta_kurs

+380976 ****
Витрина магазина
Все товары
Оценки по сделкам
Отзывы (гостевая)

Регистрация: 05.11.2012
Заходил(а): 14.06.2026 (22:42)

Откуда: Днепропетровск

Разделы Premium магазина:

Программирование Психология Бизнес, маркетинг Здоровье и Красота Спорт и Фитнес Эзотерика Фото и Видео Графика и Дизайн SEO и SMM Курсы по трейдингу Кулинария Нейросети Пикап и Отношения Финансы и Инвестиции Дети и Родители Строительство и Ремонт YouTube Курсы по музыке Имидж и Стиль Арбитраж и Реклама Отдых и Путешествия TikTok Telegram Саморазвитие Instagram Копирайтинг Иностранные языки Сад и Огород Создание Сайтов

показать все ...

Подробное описание: Игорь Стурейко, Андрей Канашов OTUS Reinforcement Learning 2023 год

------------------------------------------------------
Для заказа пишите на Viber +380976447425
------------------------------------------------------
[Игорь Стурейко, Андрей Канашов] [OTUS] Reinforcement Learning (2023)

Для кого этот курс?
Для ML-инженеров, которые хотят научиться внедрять RL в продакшн: оптимизация систем, алгоритмический трейдинг, управление ресурсами. А также стремятся к эффективному развертыванию и масштабированию RL-моделей
Для специалистов по Data Science, которые используют RL для задач, где классический ML неэффективен — адаптивные системы, динамические среды. А также интересуются комбинацией RL с NLP, рекомендательными системами
Для Fullstack-разработчиков, которые хотят освоить RL для создания интеллектуальных приложений — от игровых AI до автоматизации процессов или перейти в ML-направление
Для системных аналитиков, которые изучают RL, чтобы проектировать AI-решения для бизнеса: автоматизация процессов, логистика, финансы. А также хотят понимать возможности и ограничения RL для принятия решений
Для Deep Learning инженеров, которые работают с Deep RL в сложных доменах — робототехника, игровые AI, компьютерное зрение, и нацелены на research и передовые гибридные архитектуры

Необходимые знания:
базовое знакомство с Python
базовые знания линейной алгебры (матрицы, векторы, градиентный спуск)
базовые навыки работы с ML (pandas, sklearn, линейная регрессия, логистическая регрессия)

Что такое Reinforcement Learning?
Reinforcement Learning — это одна из трех основных парадигм машинного обучения, в котором агент учится взаимодействовать с окружающей средой методом проб и ошибок.
Reinforcement Learning можно использовать в разных областях:
В играх, чтобы создавать ботов, которые могут победить даже лучших игроков.
В робототехнике, чтобы роботы могли учиться и улучшать свои навыки без постоянного программирования.
В финансах, чтобы создавать алгоритмы, которые могут сами покупать и продавать активы и приносить прибыль.
В электронной коммерции, чтобы создавать системы, которые предлагают товары, которые нравятся покупателям.
В промышленности, чтобы оптимизировать работу заводов и снизить расход энергии.

Вы научитесь:
Понимать, как работает обучение с подкреплением, и применять классические алгоритмы типа Q-learning, SARSA и Monte Carlo.
Создавать модели окружения и обучать агентов RL для решения задач в ваших условиях.
Использовать нейронные сети в RL и применять алгоритмы Deep RL, от самых простых, таких как DeepQ-Network (DQN) до самых сложных, таких как Proximal policy optimization (PPO).
Использовать продвинутые методы RL, такие как оптимальное управление, обучение со скользящим горизонтом и Model-based RL, для сложных задач.
Решать конкретные задачи с помощью RL и понимать, как это работает на практике.

Вы сможете:
Создавать ботов и NPC для игр, которые будут обучаться и подстраиваться под игрока, делая игру интереснее и неожиданнее.
Делать роботов, которые смогут сами ориентироваться в пространстве, двигать предметы и выполнять задачи в разных условиях.
Создавать алгоритмы, которые будут автоматически торговать на финансовых рынках, анализируя данные и принимая решения о покупке и продаже, чтобы заработать побольше и не рисковать.
Делать персонализированные рекомендации, которые будут учитывать вкусы пользователей и предлагать им подходящие товары, услуги или контент.
Решать разные задачи по оптимизации и управлению в разных сферах: от производства до энергопотребления. RL поможет автоматизировать процессы и сделать их эффективнее.

Программа

Введение в Reinforcement Learning
Модуль начинается с общего введения, охватывает ключевые особенности обучения с подкреплением, основные алгоритмы. Вы рассмотрите, как построить модель окружения и агента, и примените свои знания на простых сценариях.
Тема 1: Знакомство с Reinforcement Learning
Тема 2: Ключевые понятия RL: агент, среда, награда, политика. Построение среды
Тема 3: Основные алгоритмы RL: Value based
Тема 4: Основные алгоритмы RL: Policy based

Deep Reinforcement Learning
В этом модуле вы рассмотрите введение в глубокое обучение с подкреплением, которое объясняет значимость глубоких Q-сетей, представляет алгоритмы на основе политик. Затем объединяет методы на основе политик и значений с использованием алгоритма Actor-Critic. И, наконец, охватывает то, как нейронные сети могут использоваться для аппроксимации функций вознаграждения и политик.
Тема 1: Введение в Deep Reinforcement Learning
Тема 2: Deep Q-Network (DQN) алгоритм
Тема 3: Deep Policy Gradient (PG) алгоритм
Тема 4: Actor-Critic алгоритм
Тема 5: TRPO - PPO
Тема 6: DDPG - TD3 - LSTM-TD3

Advanced Reinforcement Learning
Модуль содержит более сложные темы и глубже раскрывает пройденный материал. Здесь рассматривается применение алгоритмов к более сложным ситуациям, например наличие фиксированных правил (model-based) или взаимодействие нескольких агентов между собой для достижения общей темы.
Тема 1: Обучение с использованием модели среды (model-based rl)
Тема 2: Model-based, часть 2
Тема 3: Иерархическое обучение с подкреплением
Тема 4: Выбор темы и организация проектной работы
Тема 5: Многоагентное обучение и кооперация агентов
Тема 6: Трансформеры в RL: decision transformers и action transformers

Применение RL в реальных задачах
Модуль посвящен обзору практических примеров применения RL. Вы познакомитесь с игровой индустрией и рассмотрите какие задачи здесь можно решать с помощью RL. Поговорите о робототехнике, поймете какое применение RL находит в рекомендательных системах и более подробно рассмотрите финансовые модели на примере задачи балансировки портфеля активов и задачи кредитного скоринга.
Тема 1: Применение RL в игровой индустрии
Тема 2: Применение RL в робототехнике
Тема 3: RL в рекомендательных системах
Тема 4: RL в задаче скоринга
Тема 5: Применение RL в управлении финансовым портфелем

Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Консультация по проектам и домашним заданиям
Тема 2: Предзащита
Тема 3: Защита проектных работ. Подведение итогов курса

Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Игорь Стурейко. (к.ф.-м.н.) Teamlead, главный инженер. FinTech
Андрей Канашов. Senior Data Scientist. Самолет
Сергей Доронин. Ведущий инженер-программист. ЗАО Астраханские Цифровые Технологии
Анастасия Капралова. CEO и соотнователь IT компании
Анатолий Чудаков. Team Lead. Онлайн-кинотеатр Wink

✅ Помогу найти любой курс, марафон, книгу, аудиокнигу
✅ Другие мои объявления здесь: https://www.kidstaff.com.ua/user-anno-417698
✅ Постоянным клиентам скидки

Предложения от магазина

BLNDR 6.0 Новая эра. Андрей Шкиль Вольница 2024

500₴

Курс по запуску Tik tok shop в 2025 Андрей Василенко

1499₴

Игорь Стурейко proglib. academy Разработка AI-агентов 2025 год

1200₴

Сергей Сергин, Артём Бражников OTUS Электроника и электротехника 2025 год

450₴

Вы не авторизованы на сайте Kidstaff, но можете связаться с продавцом.

+380976 **** +380976 ****

Рекомендуем Вам пройти регистрацию или войти в Ваш аккаунт, чтобы полноценно использовать все доступные инструменты для покупки, продаж и общения на сайте.

Зарегистрироваться Войти