000 02598nam0a2200373 4500
001 RU\NLR\BIBL_A\016206286
005 20230616173156.0
010 _a978-5-9775-6885-2
_91300
021 _aRU
_bКН-П-22-068822
_9КН-П-22-5995
035 _a(NLR Aleph) 016206286
035 _a(RuMoRGB)011273533
090 _a12692920
_c12692920
100 _a20221114d2023 u y0rusy50 ca
101 1 _arus
_ceng
102 _aRU
105 _aa|||z|||001zy
181 0 _ai
_baxxe
182 0 _an
200 1 _aОбучение с подкреплением для реальных задач
_eинженерный подход
_fФил Уиндер
_gперевод с английского Екатерины Черских
203 _aТекст
_bвизуальный
_cнепосредственный
210 _aСанкт-Петербург
_cБХВ-Петербург
_d2023 [т. е. 2022]
215 _a400 с.
_cил.
_d24
300 _aКн. фактически изд. в 2022 г.
320 _aБиблиогр. в конце гл.
320 _aПредм. указ.: с. 395-400
330 _aКнига посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту
606 1 _aМашинное обучение
_92605494
_3RU\NLR\AUTH\661542052
686 _a16.4
_2rubbks
686 1 _aЗ973.2-018
700 1 _aУиндер
_bФ.
_gФил
942 _cBOOK
980 _aNB