| 000 | 02598nam0a2200373 4500 | ||
|---|---|---|---|
| 001 | RU\NLR\BIBL_A\016206286 | ||
| 005 | 20230616173156.0 | ||
| 010 |
_a978-5-9775-6885-2 _91300 |
||
| 021 |
_aRU _bКН-П-22-068822 _9КН-П-22-5995 |
||
| 035 | _a(NLR Aleph) 016206286 | ||
| 035 | _a(RuMoRGB)011273533 | ||
| 090 |
_a12692920 _c12692920 |
||
| 100 | _a20221114d2023 u y0rusy50 ca | ||
| 101 | 1 |
_arus _ceng |
|
| 102 | _aRU | ||
| 105 | _aa|||z|||001zy | ||
| 181 | 0 |
_ai _baxxe |
|
| 182 | 0 | _an | |
| 200 | 1 |
_aОбучение с подкреплением для реальных задач _eинженерный подход _fФил Уиндер _gперевод с английского Екатерины Черских |
|
| 203 |
_aТекст _bвизуальный _cнепосредственный |
||
| 210 |
_aСанкт-Петербург _cБХВ-Петербург _d2023 [т. е. 2022] |
||
| 215 |
_a400 с. _cил. _d24 |
||
| 300 | _aКн. фактически изд. в 2022 г. | ||
| 320 | _aБиблиогр. в конце гл. | ||
| 320 | _aПредм. указ.: с. 395-400 | ||
| 330 | _aКнига посвящена промышленно-ориентированному применению обучения с подкреплением (Reinforcement Learning, RL). Объяснено, как обучать промышленные и научные системы решению любых пошаговых задач методом проб и ошибок - без подготовки узкоспециализированных учебных множеств данных и без риска переобучить или переусложнить алгоритм. Рассмотрены марковские процессы принятия решений, глубокие Q-сети, градиенты политик и их вычисление, методы устранения энтропии и многое другое. Данная книга - первая на русском языке, где теоретический базис RL и алгоритмы даны в прикладном, отрасле- вом ключе. Для аналитиков данных и специалистов по искусственному интеллекту | ||
| 606 | 1 |
_aМашинное обучение _92605494 _3RU\NLR\AUTH\661542052 |
|
| 686 |
_a16.4 _2rubbks |
||
| 686 | 1 | _aЗ973.2-018 | |
| 700 | 1 |
_aУиндер _bФ. _gФил |
|
| 942 | _cBOOK | ||
| 980 | _aNB | ||