Обучение с подкреплением для реальных задач : инженерный подход / Фил Уиндер ; перевод с английского Екатерины Черских
Язык: русский ; оригинала, английский.Выходные данные: Санкт-Петербург : БХВ-Петербург, 2023 [т. е. 2022]Физическая характеристика: 400 с. : ил. ; 24 см.ISBN: 978-5-9775-6885-2 Примечания: Кн. фактически изд. в 2022 г..Резюме или реферат: Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту.Библиография: Библиогр. в конце гл.; Предм. указ.: с. 395-400.Предметная рубрика - Тема: Машинное обучение Другие классификации: ( ) 16.4 ; З973.2-018Коллекция: Национальная библиография Тип экземпляра: Книга| Тип экземпляра | Текущая библиотека | Шифр хранения | Кол-во копий | Статус | Срок возврата | Штрих-код | |
|---|---|---|---|---|---|---|---|
| Книга | РНБ (Московский) Русский книжный фонд: издания с 1957 года | 2022-7/8386 (Просмотр полки(Открывается ниже)) | КН-П-5995 | Доступно | 1-4043275 | ||
| Книга | РНБ (Московский) Русский книжный фонд: издания с 1957 года | 2022-7/8386 (Просмотр полки(Открывается ниже)) | КН-П-5995 | Доступно | 1-4043276 |
Кн. фактически изд. в 2022 г.
Библиогр. в конце гл.
Предм. указ.: с. 395-400
Книга посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту