Описание RUSMARC Карточка
Книга

Обучение с подкреплением для реальных задач : инженерный подход / Фил Уиндер ; перевод с английского Екатерины Черских

Автор: Уиндер, ФилЯзык: русский ; оригинала, английский.Выходные данные: Санкт-Петербург : БХВ-Петербург, 2023 [т. е. 2022]Физическая характеристика: 400 с. : ил. ; 24 см.ISBN: 978-5-9775-6885-2 Примечания: Кн. фактически изд. в 2022 г..Резюме или реферат: Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту.Библиография: Библиогр. в конце гл.; Предм. указ.: с. 395-400.Предметная рубрика - Тема: Машинное обучение Другие классификации: ( ) 16.4 ; З973.2-018Коллекция: Национальная библиография Тип экземпляра: Книга
Параметры
    Средний рейтинг: 0.0 (0 голосов)
Экземпляры
Тип экземпляра Текущая библиотека Шифр хранения Кол-во копий Статус Срок возврата Штрих-код
Книга РНБ (Московский) Русский книжный фонд: издания с 1957 года 2022-7/8386 (Просмотр полки(Открывается ниже)) КН-П-5995 Доступно 1-4043275
Книга РНБ (Московский) Русский книжный фонд: издания с 1957 года 2022-7/8386 (Просмотр полки(Открывается ниже)) КН-П-5995 Доступно 1-4043276

Кн. фактически изд. в 2022 г.

Библиогр. в конце гл.

Предм. указ.: с. 395-400

Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту