Алгоритми навчання з підкріпленням на Python. Лонца Андреа
- Видавництво: ДМК Пресс
- Артикул: BC-061163
- Наявність: Є в наявності
780.00 грн.
Ця книжка допоможе читачеві оволодіти алгоритмами навчання з підкріпленням (ОП) і навчитися реалізовувати їх при створенні агентів, що самонавчаються.
У першій частині розглядаються різні елементи ОП, сфера його застосування, інструменти, необхідні для роботи в середовищі ОП. Друга і третя частини присвячені безпосередньо алгоритмам. Серед іншого автор показує, як поєднувати Q-навчання з нейронними мережами для вирішення складних завдань, описує методи градієнта стратегії, TRPO і PPO, що дають змогу підвищити продуктивність і стійкість, а також детерміновані алгоритми DDPG і TD3. Читач дізнається про те, як працює техніка наслідувального навчання, познайомиться з алгоритмами дослідження на базі верхньої довірчої межі (UCB і UCB1) і мета-алгоритмом ESBAS.
Видання призначене для тих, хто цікавиться дослідженнями в галузі штучного інтелекту, застосовує в роботі глибоке навчання або хоче опанувати навчання з підкріпленням з нуля. Обов'язкова умова - володіння мовою Python на робочому рівні.
Інформація про книгу | |
Автор | Лонца Андреа |
Кількість сторінок | 286 |
Мова видання | російська |
Видавництво | PRINT2PRINT |
Рік видання | 2020 |
ISBN | 978-5-97060-855-5 |
Вид палітурки | Тверда |
Оригінальна назва | "Reinforcement Learning Algorithms with Python" |