DeepSeek-R1 для чайников

info@vsetut.pro

Стать автором

Вернуться

03.02.2025 19:30:43 | Хабр

Хабы: Машинное обучение, Математика, Natural Language Processing, Искусственный интеллект

В последние месяцы всё чаще слышим про «reasoning-модели», способные не просто продолжать текст, а действительно шаг за шагом решать сложнейшие задачи цепочкой рассуждений (chain-of-thought). Впервые такой подход эффектно показали в OpenAI o1, но, к сожалению, подробности там остаются секретными. Недавно же команда DeepSeek наделала шуму с открытыми вариантами R1 и R1-Zero, созданными поверх их собственной большой MoE-модели DeepSeek-V3. В этом посте я не стану углубляться в вопрос «чья модель лучше — o1 или R1». Зато разберу, какие главные технические детали стоят за R1, почему Zero-версия выглядит особо захватывающе, и как именно авторам удалось обучить модель мыслить.

Подробнее

Читайте также

Технологии и экстремальная форма веганства: в США зародился странный технокульт
03.02.2025 19:30:39 | ferra.ru

Стоящие за мемкоином $TRUMP компании выручили $86-94 млн на комиссиях за торговлю монетой — Reuters
03.02.2025 18:53:39 | vc.ru

Судья отклонил улики в деле об убийстве из-за использования ПО распознавания лиц
03.02.2025 18:45:37 | ferra.ru

ИИ поможет в защите памятников от вандалов
03.02.2025 18:44:14 | ferra.ru

В России поступил в продажу биопринтер для печати органов
03.02.2025 18:34:56 | ferra.ru

Wildberries позволит оплачивать пошлину на товары из-за рубежа прямо на маркетплейсе
03.02.2025 18:28:53 | ferra.ru

Apple Vision Pro получит поддержку контроллеров PlayStation VR
03.02.2025 18:23:15 | ferra.ru

Шизофрения как атавизм, бикамеральная теория часть 3
03.02.2025 18:01:39 | Хабр

Илон Маск пообещал собрать в этом году 10000 роботов Tesla Optimus
03.02.2025 18:00:35 | ferra.ru

Что пошло не так, при переходе в промышленную эксплуатацию SAP? Суд Bearing Point vs Segezha group
03.02.2025 17:43:11 | Хабр

OpenAI представила новый инструмент для ускорения исследований
03.02.2025 17:42:46 | ferra.ru

TCP: Что делать, когда окно равно нулю
03.02.2025 17:34:08 | Хабр

Security Week 2506: атака по сторонним каналам на процессоры Apple
03.02.2025 17:32:35 | Хабр

Huawei MatePad Pro PaperMatte Edition: как бумага, только лучше
03.02.2025 17:31:07 | it-world

Rapoo MT760L: полный размер
03.02.2025 17:18:01 | it-world

Западные эксперты засомневались в дешевизне нашумевшей модели DeepSeek
03.02.2025 17:15:34 | ferra.ru

Apple Pro Weekly News (27.01 – 02.02.25)
03.02.2025 16:51:34 | Хабр

Среднеразмерная умная колонка для всего: VK Капсула Про
03.02.2025 16:40:51 | ferra.ru

«Не благодаря, а вопреки», или три околотурецкие истории о том, как трудности помогают разрабатывать классные продукты
03.02.2025 16:37:45 | Хабр

Ветеран разведки предсказал поражение США в «СВО в Мексике»
03.02.2025 16:30:32 | ferra.ru

Звездолёты и Драконы
03.02.2025 16:21:05 | Хабр

Docker Compose: Фичи, которые ускорят вашу разработку
03.02.2025 16:18:35 | Хабр

Что, если бы Аль Капоне управлял мафией как IT-компанией?
03.02.2025 15:48:17 | Хабр

[Перевод] Интерактивные компьютеры: контркультура
03.02.2025 15:46:39 | Хабр

Созданы искусственные жабры для питания подводных роботов кислородом из воды
03.02.2025 15:45:31 | ferra.ru

«Аэрофлот» делает ставку на ИИ: искусственный интеллект возьмет под контроль ключевые процессы авиакомпании
03.02.2025 15:44:28 | it-world

Петля обратной связи в процессах
03.02.2025 15:38:08 | Хабр

[Перевод] Все встревожены взлетом DeepSeek — кроме Nvidia, которая этому способствовала
03.02.2025 15:17:05 | Хабр

BM YOLO: что, если вам не нужно умножать, чтобы распознавать?
03.02.2025 15:05:40 | Хабр

Тест на прочность выявил проблемы с камерой и дизайном Galaxy S25 Ultra
03.02.2025 15:00:29 | ferra.ru

realme рассказала о скором начале продаж C75 в России
03.02.2025 14:49:12 | it-world

Рассказываю про конструкцию конденсаторов КБГ-И
03.02.2025 14:45:37 | Хабр

Крупнейшую в мире солнечную электростанцию захотели закрыть
03.02.2025 14:15:28 | ferra.ru

Солнечный коллектор для умеренного климата
03.02.2025 14:15:14 | Хабр

Scala Digest. Выпуск 25
03.02.2025 14:06:26 | Хабр

Смотреть все

НОВОСТИ

Вербное воскресенье в 2026 году: смысл и традиции православного праздника
13.04.2026 00:10:00 | Lenta.ru

Дочь президента Узбекистана приехала в гости к Трампу
06.04.2026 11:18:32 | Lenta.ru

55-летняя телеведущая сделала популярную процедуру на ягодицах вместо лица и пожалела
06.04.2026 11:17:45 | Lenta.ru

Шоу «Маска 7»: кто же скрывался за маской Снегиря и почему жюри пожалело о своём решении
06.04.2026 11:15:46 | Life.ru

Горняков шахты «Белореченская» вывели на поверхность после атаки БПЛА
06.04.2026 11:15:15 | Life.ru

Сенсация XXI века? В Будапеште нашли неизвестную картину, предположительно, Ван Гога
06.04.2026 11:13:38 | Life.ru

Путин поручил АСИ обеспечить ежегодное проведение конкурса технологических компаний
06.04.2026 11:11:20 | ТАСС

Свириденко пыталась уговорить депутатов Рады принять законы по требованию МВФ
06.04.2026 11:11:19 | ТАСС

Поступившая в зону СВО «Скорлупа» России оказалась серийной
06.04.2026 11:10:20 | Lenta.ru

Конгрессмен Тернер: США не потребуется наземная операция для открытия Ормуза
06.04.2026 11:10:16 | ТАСС

NetBlocks: в Иране отключение интернета длится более 888 часов
06.04.2026 11:09:55 | ТАСС

Планировавший сбить самолет бывший мэр потребовал комфорта в колонии «Черный дельфин»
06.04.2026 11:09:23 | Lenta.ru

Семь футболистов сборной Эритреи пропали после выездного матча Кубка Африки в ЮАР
06.04.2026 11:08:31 | Lenta.ru

Глава разведки КСИР погиб при ударах США и Израиля
06.04.2026 11:08:00 | Российская Газета

В Хабаровском крае осудили бывшего полицейского за взятку мебелью
06.04.2026 11:07:10 | ТАСС

Омбудсмен Украины: в ВСУ есть подразделения, которые числятся на фронте, но сидят в тылу
06.04.2026 11:06:29 | ТАСС

Мостовой назвал ключевой момент матча РПЛ "Спартак" - "Локомотив"
06.04.2026 11:06:20 | ТАСС

Поклонская объяснила свой уход от христианства к язычеству
06.04.2026 11:06:17 | Lenta.ru

Путин поручил доработать запись к врачу через «Госуслуги» с новыми функциями
06.04.2026 11:06:12 | Life.ru

"Калашников" отгрузил партию зенитных управляемых ракет 9М333
06.04.2026 11:05:46 | ТАСС

РКН: наибольшее число атак в феврале-марте пришлось на телекоммуникационные компании
06.04.2026 11:05:31 | ТАСС

Премьер Таиланда призвал работать из дома и пересесть на общественный транспорт
06.04.2026 11:05:24 | ТАСС

Орбан срочно поехал к «Турецкому потоку», который находится под охраной армии
06.04.2026 11:05:10 | Life.ru

В России призвали ограничить доступ Украины к морю
06.04.2026 11:05:10 | Lenta.ru

Путин поручил сохранить доступность женских консультаций в регионах
06.04.2026 11:04:44 | Life.ru

В Москве работник алкомаркета избил покупателя и прострелил ему бедро
06.04.2026 11:04:30 | ТАСС

После сообщений о блокировке Telegram нагрузка на ресурсы РКН выросла
06.04.2026 11:04:28 | ТАСС

РКН: самая продолжительная DDoS-атака в феврале-марте длилась более 4,5 суток
06.04.2026 11:03:57 | ТАСС

Трагедия в Дагестане: 5-летняя девочка погибла при наводнении, поиски её бабушки продолжаются
06.04.2026 11:03:03 | Life.ru

Национальная система противодействия DDoS-атакам отразила свыше 38 тыс. кибератак
06.04.2026 11:02:58 | ТАСС

Россиянка надругалась над девушкой-инвалидом
06.04.2026 11:02:23 | Lenta.ru

Баканов: более 10 стран готовы отправить в космос своих космонавтов с помощью РФ
06.04.2026 11:02:03 | ТАСС

Роскомнадзор назвал США основным источником киберагрессии
06.04.2026 11:02:00 | ТАСС

ШОС, СНГ и ОДКБ планируют провести конференцию по безопасности в Центральной Азии
06.04.2026 11:01:57 | ТАСС

Российские юниорки вышли в финал волейбольного турнира в Италии
06.04.2026 11:01:32 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro