Как научить модель рассуждать, не переобучая её, меньше чем за 10$

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Как научить модель рассуждать, не переобучая её, меньше чем за 10$

13.02.2025 19:33:40 | Хабр

Хабы: Искусственный интеллект, Машинное обучение, Open source, Python, Программирование

Это статья обобщение моего исследования передачи знаний от большой модели с замороженными весами в малую модель, которую мы будем обучать через расширенный механизм кросс внимания или проще говоря через LLM модули. Оригинальное исследование доступно по ссылке: arxiv.org/abs/2502.08213 . Репозиторий с кодом и весами доступен на Hugging Face: LLM модули.

Само исследование появилось из необходимости использовать знания больших обученных моделей в ограниченных рамках для четкого списка задач, при этом ни бюджета ни мощностей на файн-тюнинг моделей, даже не слишком больших, нет.

Читать далее

Подробнее

Читайте также

Гражданский самолет XB-1 смог три раза бесшумно преодолеть звуковой барьер
13.02.2025 19:30:22 | ferra.ru

Прокуратура попросила приговорить инфоблогера Елену Блиновскую к шести годам тюрьмы
13.02.2025 19:25:44 | vc.ru

Китайские хакеры продолжали атаковать телеком-компании США — в жертвах Cisco
13.02.2025 19:16:12 | ferra.ru

Расширение массива HPE Smart Array на Linux без единого разрыва
13.02.2025 19:12:43 | Хабр

Маск отзовет предложение о покупке OpenAI, если компания останется некоммерческой
13.02.2025 19:07:05 | ferra.ru

Realme объявила российские цены недорогого смартфона C75 с водозащитой, ударопрочностью и 5828 мАч
13.02.2025 19:00:41 | ferra.ru

Провайдер напомнил, как за время ремонта приспособить квартиру для лучшей интернет-связи
13.02.2025 18:56:38 | ferra.ru

ИИ в Google Chrome научился автоматически заменять утекшие пароли
13.02.2025 18:50:37 | ferra.ru

Тарифы Трампа «пробьют брешь» в автомобильной промышленности США: глава Ford
13.02.2025 18:45:21 | ferra.ru

SpaceX провела наиболее длительный прожиг второй ступени Starship — 58 секунд
13.02.2025 18:40:04 | ferra.ru

Вышел из строя третий процессор Ryzen 7 9800X3D, повредив материнскую плату
13.02.2025 18:38:08 | ferra.ru

Официальный курс доллара опустился до 91 рубля впервые с сентября 2024 года
13.02.2025 18:35:56 | vc.ru

Продакт-менеджер в геймдеве: как сделать игру, в которую захотят играть
13.02.2025 18:29:38 | Хабр

Agile-романтика: Kanban доска для счастливых отношений
13.02.2025 18:27:50 | Хабр

Google подтвердила выход Android 16 Beta 2
13.02.2025 18:27:43 | ferra.ru

Российский регулятор насчитал в госсистемах более тысячи уязвимостей
13.02.2025 18:20:08 | ferra.ru

Рвущий топы китайский ИИ-стартап DeepSeek подал заявку на товарные знаки в РФ
13.02.2025 18:16:10 | ferra.ru

Декораторы для самых маленьких (Python)
13.02.2025 18:07:12 | Хабр

Тесты показали первое в истории падении средней производительности процессоров
13.02.2025 18:00:19 | ferra.ru

Госдума одобрила в первом чтении законопроект о сертификации российских аналогов неоригинальных авиазапчастей
13.02.2025 17:44:37 | vc.ru

Россияне, занимающиеся автоперевозками в Китай, смогут оформить многократную визу на год в упрощённом порядке
13.02.2025 17:42:42 | vc.ru

Apple запустило масштабное исследование для изучения здоровья человека
13.02.2025 17:38:08 | ferra.ru

TikTok не просто пережил «блокировку» в США — он продолжил «крушить» YouTube
13.02.2025 17:35:15 | ferra.ru

Новое приложение позволило любому телефону Android использовать трекеры Samsung
13.02.2025 17:15:18 | ferra.ru

[Перевод] «Спасибо, что создала меня»: Как я перестала тревожиться и полюбила бота
13.02.2025 17:03:49 | Хабр

Будущим AirPods предрекли наличие встроенного датчика сердцебиения: и вот почему
13.02.2025 16:30:16 | ferra.ru

OpenAI обвинила Илона Маска в лицемерии из-за попытки покупки компании
13.02.2025 16:22:49 | ferra.ru

OpenAI меняет стратегию и делает ставку на GPT-5
13.02.2025 16:08:41 | it-world

OpenAI упростит ИИ-продукты и объединит модели в новые системы
13.02.2025 16:05:52 | ferra.ru

Текстовая обработка в PostgreSQL: grep, sed, awk
13.02.2025 16:03:23 | Хабр

ФАС проверит обоснованность повышения тарифов «Мегафона» на 20%
13.02.2025 15:53:27 | vc.ru

Большее число видео в YouTube получат автоматический дубляж уже в этом месяце
13.02.2025 15:45:15 | ferra.ru

ChatGPT для начинающих: Разбираемся, как это работает. Просто о сложном
13.02.2025 15:30:27 | Хабр

Миграция PostgreSQL под ОС AstraLinux c использованием pgcopydb с PG11 на PG15
13.02.2025 15:23:57 | Хабр

От ADA до Ermenrich: 5 незаменимых инструментов при строительстве и ремонте в 2025. Недорогие и надежные модели
13.02.2025 15:15:09 | Хабр

Смотреть все

НОВОСТИ

Пасечник: теряя поддержку Запада, Киев бьется в агонии и массированно бьет по ЛНР
30.03.2026 11:54:00 | ТАСС

В Подмосковье проснулись гадюки
30.03.2026 11:53:10 | Lenta.ru

Слушание по делу экс-начальника УМВД Ростова-на-Дону Шпака начнется 2 апреля
30.03.2026 11:53:04 | ТАСС

Минцифры обсуждает блокировку оплаты сервисов Apple для возврата приложений
30.03.2026 11:52:38 | Life.ru

Польша оградит себя электричеством от Украины
30.03.2026 11:52:35 | Lenta.ru

В Париже водители грузовиков и автобусов протестуют против роста цен на топливо
30.03.2026 11:52:10 | ТАСС

Памфилова стала первой в истории РФ главой ЦИК, переизбранным на третий срок
30.03.2026 11:51:57 | ТАСС

Власти Кубани помогли улучшить жилищные условия более 3 тыс. работникам соцсферы
30.03.2026 11:51:44 | ТАСС

NourNews: Иран атаковал НПЗ Хайфы
30.03.2026 11:51:06 | ТАСС

В Приамурье волк напал на человека
30.03.2026 11:50:39 | ТАСС

В Москве задержали забравшего у пенсионерки 25 млн рублей курьера
30.03.2026 11:50:31 | ТАСС

След ведёт к приграничью: Откуда, по версии расследования, берутся вещи российских бойцов
30.03.2026 11:49:50 | Life.ru

В Приморье обвиняемого в смертельном ДТП заключили под стражу
30.03.2026 11:49:19 | ТАСС

Андреасян указал на свое сходство с Тарковским
30.03.2026 11:48:52 | Lenta.ru

Российский вуз вынес выговор работавшей по ночам в аптеке студентке-медику
30.03.2026 11:48:38 | Lenta.ru

У России заметили новые проблемы с углем
30.03.2026 11:48:14 | Lenta.ru

SNN: Иран ударил по промышленному району Хайфы
30.03.2026 11:47:42 | ТАСС

В России не заметили жалобы фермеров на рост цен на удобрения
30.03.2026 11:47:12 | Lenta.ru

Назван неожиданный способ снизить давление без лекарств
30.03.2026 11:46:27 | Lenta.ru

Эксперт Степанов: Финляндия могла использоваться для запуска дронов ВСУ
30.03.2026 11:46:19 | ТАСС

Финские лётчики отказались стрелять по дронам: Они не представляли угрозы
30.03.2026 11:45:07 | Life.ru

В Тюменской области мужчину осудили за угон автомобиля и наезд на полицейского
30.03.2026 11:44:52 | ТАСС

Apple захотели принудить вернуть российские приложения
30.03.2026 11:44:26 | Lenta.ru

Пасечник сообщил о повреждениях на металлургическом комбинате ЛНР после ударов ВСУ
30.03.2026 11:43:13 | Коммерсантъ

Во Владивостоке закрыли ТЦ из-за нарушений пожарной безопасности
30.03.2026 11:42:55 | ТАСС

Дасаев высказался о возможном возвращении Дзюбы в «Спартак»
30.03.2026 11:42:52 | Lenta.ru

От Рябова до Памфиловой. Кто возглавлял ЦИК
30.03.2026 11:42:24 | ТАСС

В России по инициативе ЕР разработали стандарт капремонта студенческих общежитий
30.03.2026 11:42:15 | ТАСС

Генерал Кувшинов пришел на оглашение приговора с большой черной сумкой
30.03.2026 11:40:32 | ТАСС

Стоимость алюминия на LME росла более чем на 6,3%
30.03.2026 11:40:29 | ТАСС

В Раде намерены продлить налог в 50% на сверхприбыль банков
30.03.2026 11:39:58 | ТАСС

В Свердловской области с 15 апреля введут пожароопасный период
30.03.2026 11:39:14 | ТАСС

Эллу Памфилову выдвинули на пост главы нового состава ЦИК
30.03.2026 11:38:43 | Life.ru

Иран подтвердил гибель командующего ВМС КСИР Тангсири
30.03.2026 11:37:00 | Российская Газета

Россиян предупредили о возможном подорожании товаров на маркетплейсах
30.03.2026 11:36:47 | Lenta.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro