Стресс-тест функций активации: GELU vs Tanh

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

Стресс-тест функций активации: GELU vs Tanh

25.01.2026 09:17:55 | Хабр

Хабы: Искусственный интеллект, Машинное обучение

В современных нейросетях, включая LLM на базе Transformer, стандартом стали неограниченные функции активации — ReLU и GELU. Их основное преимущество, хорошая проходимость градиентов и быстрое обучение глубоких моделей.

Однако на практике наблюдается проблема: при появлении доминирующих паттернов или высокочастотного шума во входном контексте (длинные диалоги, шумные данные, повторяющиеся или доминирующие токены) модели становятся нестабильными и склонными к деградации генерации и галлюцинациям.

В этой статье я попытался выяснить, связан ли принципиально выбор функции активации с галлюцинациями LLM.

Читать далее

Подробнее

Читайте также

За пределами LLM: детерминированный движок рассуждения на конечном алфавите
25.01.2026 09:15:50 | Хабр

Оптимизация рендера 2D-персонажей в MonoGame: Прагматичный подход слоёв и инстансинга
25.01.2026 09:15:17 | Хабр

На стыке AI и науки: Летняя школа Veai для студентов
25.01.2026 09:07:47 | Хабр

[Перевод] Второй отец MP3
25.01.2026 09:01:46 | Хабр

Второй уровень автономности ИИ: агент сам управляет облаком и администрирует ВМ по SSH
25.01.2026 08:58:44 | Хабр

[Перевод] OpenCode + Docker Model Runner для локальной разработки с ИИ
25.01.2026 08:49:09 | Хабр

Make DLL Hijacking Great Again
25.01.2026 08:32:39 | Хабр

Мобильная разработка за неделю #616 (19 — 25 января)
25.01.2026 08:31:00 | Хабр

Ред флаги, но не в тиндере: что важно понять data-специалисту ещё до офера
25.01.2026 08:22:20 | Хабр

Скрипты и алиасы для вашего линукса
25.01.2026 08:05:34 | Хабр

Умное освещение в доме на базе Philips Hue. Личный опыт
25.01.2026 08:05:32 | Хабр

История о том, как я пытался подключиться к Starlink в России. История полная приключений
25.01.2026 07:49:23 | Хабр

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия
25.01.2026 07:33:49 | Хабр

Нестандартные ПК 2026 года: мини-ПК-шайба, компьютер в клавиатуре и модульный ноутбук
25.01.2026 07:00:16 | Хабр

Немного о предсказаниях в ИИ
25.01.2026 06:44:38 | Хабр

Базы данных. Основа реляционных баз
25.01.2026 06:16:01 | Хабр

Как я на КПК оперативную память увеличивал [Длиннопост про железо]
25.01.2026 03:34:15 | Хабр

Как мы продавали компьютеры в 90-х. Часть #02
25.01.2026 02:00:41 | Хабр

Поиск статистически значимых подтверждений силы намерения
25.01.2026 00:43:05 | Хабр

Эволюционная проповедь
25.01.2026 00:04:51 | Хабр

MedGemma: разбираем медицинский AI от Google
24.01.2026 19:58:19 | Хабр

Учёный в одночасье потерял записи в ChatGPT за два года
24.01.2026 19:51:11 | ferra.ru

Sliding Gates Parus — Контроллер откатных ворот: ESPHome VS Hoermann
24.01.2026 18:49:22 | Хабр

Вакуумная удерживающая оснастка для металлообработки
24.01.2026 18:37:47 | Хабр

В 2025 г. впервые в истории объем продаж китайских автомобилей в мире вышел на 1 место, обогнав японские
24.01.2026 17:53:53 | Хабр

Цены пойдут вверх: вместе потребительских процессоров Intel переключится на серверные
24.01.2026 17:51:18 | ferra.ru

Цены пойдут вверх: вместо потребительских процессоров Intel переключится на серверные
24.01.2026 17:51:18 | ferra.ru

Алгоритм резолва зависимостей в Angular Ivy: Математика Блум-фильтров и битовые маски
24.01.2026 17:26:15 | Хабр

Разработали высоковольтный источник питания с возможностью управления по Ethernet
24.01.2026 17:23:33 | Хабр

Как я экономлю 10+ часов в неделю, заменив клавиатуру на умный голосовой ввод
24.01.2026 17:13:36 | Хабр

Как вихревая трубка Ранка-Хилша превращается в «Вихревой вакууматор»
24.01.2026 17:13:27 | Хабр

Байки математика: Эксель на фронте
24.01.2026 17:07:01 | Хабр

Как создать ИИ-консультанта для сайта интернет-магазина и поднять конверсию
24.01.2026 17:02:17 | Хабр

BareMetal CI Part 3: Ansible-коллекция для установки инструментов разработчика
24.01.2026 17:01:08 | Хабр

Самодельная опторазвязка для прошивки Zelio Logic
24.01.2026 16:21:54 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Балерина Нинель Петрова умерла на 102-м году жизни
07.03.2026 23:32:53 | ТАСС

Иран потребовал от Баку вывести израильских военных из Азербайджана
07.03.2026 23:31:53 | Life.ru

В Ленобласти в ДТП погибли двое
07.03.2026 23:31:47 | ТАСС

Дмитриев предупредил о начале масштабного "инфляционного ценового шока"
07.03.2026 23:31:00 | Российская Газета

В Израиле сообщили об обстреле со стороны Ирана
07.03.2026 23:28:59 | ТАСС

Автомобиль, с чьим участием произошло ДТП в Москве, принадлежал посольству Азербайджана
07.03.2026 23:28:55 | ТАСС

Иран нанёс удар по отелю Marina, где, по его данным, находились военные США
07.03.2026 23:28:14 | Life.ru

Цена транфера из Дубая в Оман выросла на фоне ситуации на Ближнем Востоке
07.03.2026 23:27:46 | ТАСС

ЦАХАЛ сообщил, что за четыре дня нанес удары по 600 целям "Хезболлах" в Ливане
07.03.2026 23:26:00 | ТАСС

ТАСС: Сирия еще на сутки продлила ограничения в воздушном пространстве
07.03.2026 23:24:04 | ТАСС

Иран объяснил удар по отелю в Дубае
07.03.2026 23:22:02 | Lenta.ru

ЦАХАЛ заявил о нанесении 3,4 тыс. ударов по территории Ирана
07.03.2026 23:21:26 | ТАСС

Аэропорты Волгограда и Краснодара временно закрыли на приём и выпуск самолётов
07.03.2026 23:20:56 | Life.ru

В Петербурге через взломанный аккаунт "Госуслуг" прописали в квартире двоих мигрантов
07.03.2026 23:19:07 | ТАСС

Совбез Ирана: США искусственно занижают свои потери в операции против Ирана
07.03.2026 23:18:20 | ТАСС

Востоковед раскрыла стратегию Ирана в конфликте с США и Израилем
07.03.2026 23:18:04 | Lenta.ru

Трамп высоко оценил работу переводчиков на переговорах с Путиным и Си Цзиньпином
07.03.2026 23:17:46 | Life.ru

Трамп унизил своего вице-президента
07.03.2026 23:16:37 | Lenta.ru

Трамп заявил о важности переводчиков на встречах с Путиным и Си Цзиньпином
07.03.2026 23:14:00 | Российская Газета

"Вашингтон" проиграл "Бостону" в матче НХЛ. Овечкин не набрал очков
07.03.2026 23:12:03 | ТАСС

Непомнящий считает, что российские шахматисты поборются за медали на Олимпиаде
07.03.2026 23:11:19 | ТАСС

Угрозу атаки БПЛА объявили в Краснодаре
07.03.2026 23:10:42 | ТАСС

В Краснодаре объявили угрозу атаки БПЛА
07.03.2026 23:10:42 | ТАСС

Замглавы администрации Кисловодска арестовали
07.03.2026 23:10:26 | ТАСС

Израиль впервые нанёс удар по нефтяным объектам в районе Тегерана
07.03.2026 23:07:03 | Life.ru

В Саратовской области ввели режим ракетной опасности
07.03.2026 23:06:27 | ТАСС

Нетаньяху предупредил Иран о «сюрпризах»
07.03.2026 23:02:29 | Lenta.ru

Новгородский чиновник стал опекуном дочери погибшего бойца СВО в обход её прабабушки
07.03.2026 23:01:55 | Life.ru

Минимум 8 человек погибли от серии торнадо, обрушившихся на Мичиган и Оклахому
07.03.2026 23:01:34 | Life.ru

Разработчики Cities: Skylines добавят бесплатные нововведения к релизу Race Day
07.03.2026 22:59:11 | PlayGround.ru

Иран заявил о нанесении ответного удара по НПЗ в Израиле
07.03.2026 22:58:43 | РБК

Президент ОАЭ заявил, что страна находится в состоянии войны
07.03.2026 22:55:27 | ТАСС

Иран заявил, что Трамп не так трактовал позицию Тегерана о деэскалации
07.03.2026 22:54:08 | РБК

Следующие переговоры России, Украины и США могут пройти на следующей неделе
07.03.2026 22:53:46 | Life.ru

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro