Публикации по теме 'reinforcement-learning'


Будущее с обучением с подкреплением
Часть 2: Сравнения и приложения Если вы еще не прочитали Учебник по обучению с подкреплением , вернитесь и сначала ознакомьтесь с ним здесь . Эта статья познакомит вас с ключевыми концепциями обучения с подкреплением. Тогда вы будете готовы полностью сравнить разные типы машинного обучения. Сравнение обучения с подкреплением с другими типами машинного обучения Возможно, вы слышали о других типах машинного обучения, например: обучение с учителем, обучение без учителя и т. Д...

6 лучших реальных приложений обучения с подкреплением
Обучение с подкреплением (RL) основано на механизмах вознаграждения и наказания. Агент получает вознаграждение за правильные ходы и наказание за неправильные. Поступая таким образом, агент минимизирует неправильные ходы и максимизирует количество правильных. Цель этой статьи — изучить некоторые из реальных приложений обучения с подкреплением. 1. Самоуправляемые автомобили Использование Глубокого обучения с подкреплением для автономного вождения было предложено в нескольких статьях...

Преобразование здравоохранения с помощью обучения с подкреплением
Загрузить технический документ Как общество, мы более разнообразны, чем когда-либо, мы более информированы, чем когда-либо, мы осознаем свою индивидуальность и гордимся ею. Сейчас, более чем когда-либо, потребители ищут возможности, которые отражают их предпочтения, стиль и потребности. Универсальный подход для всех больше не работает. Во многих потребительских предложениях уже происходит переход от универсального подхода к персонализации. Ежедневно мы получаем персональные..

АННА. - Агент искусственной нейронной сети для MotoGP ™ 19
«Опыт игры с искусственным интеллектом» 8 июля 2019 года в Mikamai, Data Science Milan организовал встречу на тему видеоигр. Был представлен новый инструмент «A.N.N.A.» которые превосходят традиционную систему искусственного интеллекта, где каждое действие планируется заранее. «A.N.N.A. - Агент искусственной нейронной сети для MotoGP ™ 19 », Лука Антига и Даниэле Кортиновис, Orobix S.r.l. После объяснения Лукой об Orobix, Даниэле обрадовал присутствующих на встрече,..

Введение в глубокое обучение с подкреплением
Глубокое обучение с подкреплением (DRL) — это мощный подход, сочетающий в себе глубокое обучение и обучение с подкреплением для решения сложных задач принятия решений. В последние годы он привлек значительное внимание благодаря своей способности достигать сверхчеловеческих характеристик в различных областях, включая игры, робототехнику и автономное вождение. Что такое обучение с подкреплением? Обучение с подкреплением (RL) — это подобласть машинного обучения, которая фокусируется на..

Udacity Robotics ND Project 8 - Глубокая манипуляция рукой с RL
Введение В этой статье я рассмотрю свою заявку на участие в Udacity Robotics ND Project 8 - Deep RL Arm Manipulation. Цель этого проекта - создать агента DQN и определить функции вознаграждения, чтобы научить роботизированную руку выполнять две основные задачи в моделируемой среде: Прикоснитесь любой частью руки робота к интересующему объекту с точностью не менее 90%. Только основание захвата манипулятора должно касаться объекта с точностью не менее 80%. Я рассмотрю детали..

Нейронная сеть с расширенной памятью для метаобучения - пример из практики
Метаобучение простыми словами «Обучение обучению» - одна из быстрорастущих областей исследований в области искусственного интеллекта, в частности обучения с подкреплением. Традиционные архитектуры глубокого обучения, такие как DNN, CNN и RNN, определены или построены так, чтобы хорошо работать для конкретной задачи. Другими словами, они необходимы для оптимизации параметров (весов и смещений), учитывая, что обучающие данные установлены для конкретной задачи. Идея метаобучения состоит в..