RUSMARC

000			02598nam0a2200373 4500
001			RU\NLR\BIBL_A\016206286
005			20230616173156.0
010			_a978-5-9775-6885-2 _91300
021			_aRU _bКН-П-22-068822 _9КН-П-22-5995
035			_a(NLR Aleph) 016206286
035			_a(RuMoRGB)011273533
090			_a12692920 _c12692920
100			_a20221114d2023 u y0rusy50 ca
101	1		_arus _ceng
102			_aRU
105			_aa\|\|\|z\|\|\|001zy
181		0	_ai _baxxe
182		0	_an
200	1		_aОбучение с подкреплением для реальных задач _eинженерный подход _fФил Уиндер _gперевод с английского Екатерины Черских
203			_aТекст _bвизуальный _cнепосредственный
210			_aСанкт-Петербург _cБХВ-Петербург _d2023 [т. е. 2022]
215			_a400 с. _cил. _d24
300			_aКн. фактически изд. в 2022 г.
320			_aБиблиогр. в конце гл.
320			_aПредм. указ.: с. 395-400
330			_aКнига посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту
606	1		_aМашинное обучение _92605494 _3RU\NLR\AUTH\661542052
686			_a16.4 _2rubbks
686	1		_aЗ973.2-018
700		1	_aУиндер _bФ. _gФил
942			_cBOOK
980			_aNB