Создаем собственные окружения в Reinforcement Learning

02.07.2026 19:40:03 | Хабр

Хабы: Блог компании OTUS, Машинное обучение, Искусственный интеллект, Python

Готовые RL‑окружения удобны для старта, но в реальных задачах редко хватает чужих правил и бенчмарков. В статье разбираем, как создать собственную среду для обучения с подкреплением: задать действия и наблюдения, продумать функцию награды и не сломать обучение на базовых ошибках.

Подробнее

Читайте также

В России ускорили моделирование дорожного трафика в десятки раз
02.07.2026 19:22:19 | ferra.ru

Китайская UBTech выпустила «ультрабионических» роботов с «кожей» и мимикой — они реагируют на прикосновения, сами начинают диалог и стоят от 1,3 млн рублей
02.07.2026 19:15:33 | vc.ru

Почему российский бизнес проигрывает битву за информацию и как это исправить. Часть 3
02.07.2026 19:08:59 | Хабр

Росатом разработал плазменную технологию переработки ядерных отходов
02.07.2026 19:05:00 | ferra.ru

Часть II. Начала дискретной математики. SQL, Комбинаторика, Тервер за 15 минут. SQL, EBNF, XPATH в 480 LOC
02.07.2026 19:02:30 | Хабр

iPhone 18 Pro выйдет в трёх цветах. И чёрного не будет
02.07.2026 18:52:15 | ferra.ru

Samsung намекнула на дату презентации Galaxy Z Fold8, Z Fold8 Ultra и Z Flip8
02.07.2026 18:30:06 | ferra.ru

Росатом создал первый в России чип для квантового сжатого света
02.07.2026 18:20:00 | ferra.ru

Microsoft уволит почти 6000 человек
02.07.2026 18:13:08 | ferra.ru

Кто кого заборет: тонкий смартфон на 8000 мАч против архаичного «броневика» на 10600
02.07.2026 18:05:20 | ferra.ru

Российскую систему мониторинга глюкозы включили в реестр промышленной продукции
02.07.2026 17:52:17 | ferra.ru

Код я написал за две недели. Продавать его боюсь до сих пор
02.07.2026 17:49:31 | Хабр

Учёные УрФУ: малые дозы рентгена ускоряют созревание йогурта на час
02.07.2026 17:35:00 | ferra.ru

Я адаптировал geo файлы v2ray для OpenWrt: теперь работают все сайты, а размер файлов уменьшен в 1000 раз
02.07.2026 17:34:00 | Хабр

Как растить мышцы одной тренировкой в неделю? Подход для ну очень занятых людей
02.07.2026 17:21:41 | Хабр

Мой первый вайб-кодинг
02.07.2026 17:16:51 | Хабр

10 небанальных признаков, что запускать рекламу на текущий сайт рано
02.07.2026 17:03:59 | Хабр

Илон Маск опроверг слухи об испытаниях карманного ИИ-устройства
02.07.2026 17:01:19 | ferra.ru

Как C-level команда за три дня собрала мультиагентного AI-аналитика и выиграла хакатон
02.07.2026 16:59:31 | Хабр

Хроники занятий микросхемами с русскими школьниками не в замке во Франции, а в хакерском клубе в Калифорнии
02.07.2026 16:57:18 | Хабр

Вступление в силу закона о криптовалютах перенесли на 1 сентября 2026 года
02.07.2026 16:50:00 | ferra.ru

«Отец интернета» Винтон Серф уйдет на пенсию
02.07.2026 16:30:09 | ferra.ru

В России создали учебный дрон УН‑001, выдерживающий 150 жёстких посадок
02.07.2026 16:05:00 | ferra.ru

Сжатие декодерных эмбеддеров: как ужать 8B до продакшена без потери recall
02.07.2026 15:48:48 | Хабр

В Арктике впервые изучат фагоцитарную активность клеток крови
02.07.2026 15:47:29 | ferra.ru

Почему сейчас самое удачное время для создания новых карьерных порталов
02.07.2026 15:42:28 | Хабр

Google проиграла в ЕС апелляцию по делу о штрафе на €4,1 млрд за неконкурентные практики на Android-смартфонах
02.07.2026 15:40:56 | vc.ru

Сочинский институт РУДН отказался от дипломных работ бакалавров-юристов
02.07.2026 15:20:00 | ferra.ru

Декодирование в LLM как эволюция стратегий
02.07.2026 15:10:46 | Хабр

Управление контентом от одной базы до целой системы
02.07.2026 15:08:14 | Хабр

DDoS: от алерта до выбора модели: диагностика DDoS и Always-On vs On-Demand
02.07.2026 14:39:35 | Хабр

В России банки, операторы связи и ведомства объединят для защиты от киберпреступников
02.07.2026 14:35:00 | ferra.ru

Запитать чайник или дрель: представлен пауэрбанк Xiaomi Cuktech Power Bank 600
02.07.2026 14:30:19 | ferra.ru

Ускоренное построение KNN-индексов в Manticore
02.07.2026 14:22:07 | Хабр

В России ИИ научили анализировать цифровые связи пользователей
02.07.2026 14:20:22 | ferra.ru

Смотреть все

НОВОСТИ

Российские военные уничтожили наёмника из Колумбии под Купянском
03.08.2026 01:28:30 | Life.ru

Кулеба заявил об отсутствии защиты от баллистических ракет на Украине
03.08.2026 01:25:53 | Life.ru

Мендель раскрыла новые факты о выгоде Зеленского от конфликта
03.08.2026 01:25:00 | Lenta.ru

Трамп не назвал крайних сроков заключения соглашения между США и Ираном
03.08.2026 01:22:59 | ТАСС

«Очень-очень трудно». В конгрессе США сообщили о сложных переговорах с Украиной по Patriot
03.08.2026 01:21:26 | Lenta.ru

В ГД рассказали, кто может заменить газовую плиту в квартире
03.08.2026 01:20:00 | ТАСС

В Дагестане в ДТП погибли три человека
03.08.2026 01:16:04 | ТАСС

Мендель объяснила, почему Макрон продолжает поддерживать Зеленского
03.08.2026 01:13:00 | Российская Газета

Bild: рекордное обмеление Рейна поставило под угрозу грузовые перевозки в ФРГ
03.08.2026 01:11:24 | ТАСС

Львова-Белова сообщила о состоянии пострадавших при атаке ВСУ на Принцевку детей
03.08.2026 01:11:07 | ТАСС

Цена нефти Brent на ICE опустилась ниже $82 за баррель впервые с 13 июля
03.08.2026 01:08:40 | ТАСС

Трамп рассказал, почему США не стали наносить удар по Ирану
03.08.2026 01:06:25 | Life.ru

В Московском регионе началась гроза с дождем
03.08.2026 01:05:02 | ТАСС

Офицер Поле рассказал о разведке на глубину до 30 км перед штурмом Светлого
03.08.2026 01:01:52 | ТАСС

Сомнолог предупредил о причинах проблем со сном летом
03.08.2026 01:01:29 | Lenta.ru

«Самая сексуальная в мире хоккеистка» вызвала ажиотаж в сети фото в крошечном бикини
03.08.2026 01:01:16 | Lenta.ru

Трамп назвал дату переговоров США и Ирана
03.08.2026 01:00:00 | Lenta.ru

Россия пригрозила Ирландии серьезными последствиями за морское пиратство
03.08.2026 01:00:00 | Lenta.ru

Метеорит, роботы и мода в селе Париж: большое интервью Алексея Текслера
03.08.2026 01:00:00 | Life.ru

В Марокко требуют расследовать случаи насилия над мигрантами в Сеуте
03.08.2026 00:58:00 | ТАСС

Трамп объявил о переговорах с Ираном в понедельник
03.08.2026 00:57:18 | Life.ru

WSJ узнала об отказе крупных спонсоров Демпартии США от новой поддержки
03.08.2026 00:55:21 | РБК

1 сентября 2026 — День знаний: история и традиции праздника
03.08.2026 00:55:00 | Life.ru

Трамп анонсировал начало новых переговоров с Ираном
03.08.2026 00:54:03 | РБК

Финский политик Мема рассказал, как санкции против РФ ударили по Финляндии
03.08.2026 00:54:00 | Российская Газета

Трамп утверждает, что США и Иран договорились по Ормузскому проливу
03.08.2026 00:51:30 | ТАСС

Трамп утверждает, что США и Иран достигли договоренностей по Ормузскому проливу
03.08.2026 00:51:30 | ТАСС

Популярный молодой музыкант попал в Книгу рекордов России
03.08.2026 00:51:00 | Lenta.ru

МВД Марокко: Решения судов Испании создали новую модель миграции
03.08.2026 00:49:51 | Life.ru

Артиллеристам ВСУ запретили носить военную форму под Черниговом
03.08.2026 00:47:13 | Life.ru

Трамп заявил, что США и Иран 3 августа перейдут к переговорам
03.08.2026 00:46:57 | ТАСС

ВСУ более чем вдвое увеличили число атак на Белгородскую область за 2 месяца
03.08.2026 00:44:26 | Life.ru

Трамп отменил удары по просьбе Катара, ОАЭ, Саудовской Аравии и Ирана
03.08.2026 00:43:39 | ТАСС

Трамп отменил удар по Ирану по просьбе Катара, ОАЭ, Саудовской Аравии и Ирана
03.08.2026 00:43:39 | ТАСС

В зоне СВО ликвидировали колумбийского наемника
03.08.2026 00:42:04 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro