[Перевод] Без тренировки, но с обучением: имплицитная динамика in-context learning

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Без тренировки, но с обучением: имплицитная динамика in-context learning

25.09.2025 11:00:36 | Хабр

Хабы: Data Mining, Искусственный интеллект, Машинное обучение, Big Data, Data Engineering

Одной из наиболее примечательных особенностей Large Language Models (LLM) является их способность к in-context learning — обучению в контексте. В частности, на этапе инференса LLM может усваивать новые паттерны без какого-либо дополнительного обновления весов, если эти паттерны представлены в виде примеров в промпте, даже если эти паттерны не встречались во время обучения. Механизмы, за счёт которых это возможно, всё ещё во многом остаются неизвестными.

В данной работе мы показываем, что комбинация слоя self-attention с MLP позволяет трансформер-блоку неявно модифицировать веса MLP-слоя в зависимости от контекста. Мы утверждаем на основе теоретического анализа и экспериментов, что этот простой механизм может объяснять, почему LLM способны обучаться в контексте, а не только во время тренировки модели. В частности, мы демонстрируем, что при ряде упрощающих допущений трансформер-блок неявно преобразует контекст в low-rank обновление весов MLP-слоя.

Читать далее

Подробнее

Читайте также

«Workslop»: всё о новом вызове продуктивности
25.09.2025 10:49:14 | Хабр

BI в условиях неопределённости: устойчивость бизнеса, антикризисное управление и роль real-time аналитики
25.09.2025 10:44:30 | Хабр

Как не ошибиться при выборе метода замены ERP: Большой взрыв vs Parallel running
25.09.2025 10:44:10 | Хабр

Марк Цукерберг и Сэм Альтман попытались сблизиться с президентом США Дональдом Трампом после его конфликта с Илоном Маском — FT
25.09.2025 10:38:28 | vc.ru

В России предложили фиксировать нарушения ПДД с помощью дронов
25.09.2025 10:30:00 | ferra.ru

Алгоритм поиска аномалий Isolation Forest
25.09.2025 10:23:17 | Хабр

[Перевод] Почему игнорирование божественного в коде приводит к пространственному коллапсу
25.09.2025 10:17:01 | Хабр

Немного об LTE. Разбираемся с S1 интерфейсом
25.09.2025 10:04:12 | Хабр

В России стартовали продажи Xiaomi Redmi 15 с аккумулятором на 7000 мАч и экраном 144 Гц
25.09.2025 10:00:54 | ferra.ru

Banking-as-a-Service на практике: как встроить финансы в свой продукт без лицензии ЦБ
25.09.2025 09:54:27 | Хабр

Философия Kaizen на производстве: как идеи инженеров экономят миллионы
25.09.2025 09:50:39 | Хабр

Новая реальность найма: вы не прошли первый этап отбора из-за AI-галлюцинаций
25.09.2025 09:48:29 | Хабр

Logitech представила заряжающуюся от солнечного и искусственного света клавиатуру
25.09.2025 09:45:00 | ferra.ru

«Индустрия уйдёт в тень»: РБК — о том, как новые налоги повлияют на букмекерский рынок
25.09.2025 09:44:49 | vc.ru

Kubernetes упрощает жизнь. Но какой ценой? Helm, KaaS и выводы из практики
25.09.2025 09:30:29 | Хабр

Что делать после того, как Microsoft прекратит поддержку Windows 10. Ждать осталось совсем недолго
25.09.2025 09:29:41 | Хабр

Вы встретили разработчика. Ваши действия?
25.09.2025 09:14:58 | Хабр

Ваш грейд, стек и немного боли: опрос для data-специалистов
25.09.2025 09:10:06 | Хабр

Автоматизация установки Ubuntu Server: прощай, PXE
25.09.2025 09:07:44 | Хабр

О пакетах в экосистеме Apple (часть 1)
25.09.2025 09:05:45 | Хабр

Собственные бренды торговых сетей — зло
25.09.2025 09:01:24 | Хабр

MutationObserver + React: меняем ошибки UI Kit без патча библиотеки
25.09.2025 09:00:24 | Хабр

Как работает CoW DAO: обмен без посредников, свой AMM и защита от MEV
25.09.2025 09:00:13 | Хабр

[Перевод] Parrot Game Sample: референс-проект для перехода на Unreal Engine
25.09.2025 09:00:09 | Хабр

Учёные нашли в Антарктиде 85 ранее неизвестных подлёдных озёр
25.09.2025 09:00:00 | ferra.ru

От анонимного FTP до RCE: как мы скомпрометировали сервер из-за конфигурационных ошибок
25.09.2025 08:58:24 | Хабр

Как нейросети могут помогать делать игры
25.09.2025 08:58:05 | Хабр

«Сбер» возглавил рейтинг крупнейших компаний Forbes по размеру чистой прибыли
25.09.2025 08:51:31 | vc.ru

«Мы вам отказываем, потому что так нельзя. И вообще многие так уже сделали»
25.09.2025 08:48:22 | Хабр

Трудовой путь программиста 1С и увольнения
25.09.2025 08:46:41 | Хабр

Neuro Scale 2025: как Яндекс собирает облако будущего
25.09.2025 08:32:44 | Хабр

Российские Java/Spring-разработчики: какие IDE выбирают сегодня
25.09.2025 08:30:18 | Хабр

[Перевод] Когда чат-боты становятся опасны: цена прогресса
25.09.2025 08:26:08 | Хабр

Достоин доплаты: iPhone 17 сравнили с iPhone 16
25.09.2025 08:15:17 | ferra.ru

День 1310: Мосбиржа планирует полностью импортозаместить ИТ-инфраструктуру к 2027 году
25.09.2025 08:02:15 | vc.ru

Смотреть все

СТАТЬ АВТОРОМ

НОВОСТИ

Захарова прокомментировала запуск Британией шпионской программы Silent Courier
25.09.2025 15:18:00 | Российская Газета

Турецкий антимонопольный регулятор начал расследование по Spotify
25.09.2025 15:17:43 | ТАСС

Москвичей призвали готовиться к переменам
25.09.2025 15:17:22 | Lenta.ru

В Молдавии патриотический блок могут снять с парламентских выборов
25.09.2025 15:16:48 | ТАСС

ГД одобрила расширение полномочий ЦБ по верификации данных из кредитных историй
25.09.2025 15:15:52 | ТАСС

Григоренко назвал сотрудничество в сфере ИИ главной перспективой России и КНР
25.09.2025 15:15:32 | ТАСС

Победитель "Интервидения" хочет вновь стать участником конкурса в 2026 году
25.09.2025 15:14:56 | ТАСС

Пасечник: ВСУ ударами попытались вывести из строя Луганскую ТЭС в ЛНР
25.09.2025 15:14:14 | ТАСС

Премьер Польши раскритиковал резкое заявление Трампа в адрес России
25.09.2025 15:13:25 | Lenta.ru

Известная стилистка назвала самую трендовую одежду на осень
25.09.2025 15:13:19 | Lenta.ru

Porsche исключили из главного биржевого индекса Германии
25.09.2025 15:12:20 | РЕН ТВ

Алсу и Filatov & Karas сразятся в шоу "Битва поколений" на МУЗ-ТВ
25.09.2025 15:12:19 | РЕН ТВ

CNN: в НАТО нет консенсуса по идее сбивать российские самолеты
25.09.2025 15:12:18 | ТАСС

Более 280 населенных пунктов России вошли в перечень для разработки мастер-планов
25.09.2025 15:11:54 | ТАСС

Беспилотник повредил строение на территории Курской АЭС
25.09.2025 15:11:24 | Коммерсантъ

Фицо считает безопасными поставки в Словакию газа из России
25.09.2025 15:10:41 | ТАСС

В Крыму выделят свыше 83 млн рублей на реализацию школьных бюджетных инициатив
25.09.2025 15:10:06 | ТАСС

Создан самый мощный процессор для Android-смартфонов
25.09.2025 15:09:00 | Lenta.ru

Заявивший о пытках клиента адвокат навлек на себя проблемы от ФСБ
25.09.2025 15:08:58 | Lenta.ru

Въездной турпоток в Петербург вырос почти на 10% с начала 2025 года
25.09.2025 15:08:55 | ТАСС

ЕЦБ: цены на продукты питания в еврозоне выросли на треть с 2019 года
25.09.2025 15:08:34 | ТАСС

Саркози намерен обжаловать приговор суда по делу о получении денег от Каддафи
25.09.2025 15:08:00 | Российская Газета

Семь регионов России заменили сенаторов в Совете Федерации
25.09.2025 15:07:50 | Life.ru

В Таиланде задержали российского треш-блогера
25.09.2025 15:07:23 | Коммерсантъ

Лидеров ЕС назвали бесхребетными посредственностями
25.09.2025 15:07:00 | Lenta.ru

Водитель минивэна врезался в пару туристов в США и оставил их лежать в луже крови
25.09.2025 15:06:48 | Lenta.ru

Два бандита похитили россиянина ради полумиллиона рублей
25.09.2025 15:06:26 | Lenta.ru

ГД приняла в I чтении законопроект о медосмотрах в экспериментальной авиации
25.09.2025 15:05:58 | ТАСС

Сикорский в ООН рассказал о "более древней", чем у России, истории Украины
25.09.2025 15:05:00 | Российская Газета

News Media Holding вошёл в топ-5 рейтинга медиахолдингов платформы Дзен
25.09.2025 15:04:52 | Life.ru

Дерзкие слова Трампа о России не впечатлили Украину
25.09.2025 15:04:07 | Lenta.ru

Хоккеист Хмелевский договорился с "Ак Барсом" о двухлетнем контракте
25.09.2025 15:04:02 | ТАСС

Госдума назначила Изотову зампредом Счетной палаты
25.09.2025 15:03:06 | РЕН ТВ

Белорусская певица Кравченко предложила победителю "Интервидения" сотрудничество
25.09.2025 15:02:12 | ТАСС

Захарова: территории, о которых говорит Зеленский в интервью, нужны натовцам
25.09.2025 15:01:25 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2025 - vsetut.pro