[Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

Операция выполнена!

info@vsetut.pro

Стать автором

Вернуться

[Перевод] Аномалии DeepSeek-v3 и DeepSeek-r1: глюкнутые токены и чат, теряющий идентичность

28.01.2025 13:06:22 | Хабр

Хабы: Блог компании BotHub, Искусственный интеллект, Машинное обучение

«Аномальные», «глючные» и «непроизносимые» токены в больших языковых моделях (LLM) — это те, которые вызывают странное поведение или не функционируют как обычный текст. Это явление было впервые открыто и задокументировано в случае GPT-2 и GPT-3, но до сих пор таких аномалий не находили в DeepSeek‑V3.

Поэтому я решил сделать это сам. Поскольку V3 является опенсорсной SOTA‑моделью, обладающей весьма необычными свойствами, она показалась мне идеальным кандидатом. Перед вами обзор глючных токенов, которые я обнаружил в DeepSeek после ряда экспериментов, а также некоторые предварительные наблюдения об их поведении.

Читать далее

Подробнее

Читайте также

[Перевод] Разработка эффективных агентов с помощью Spring AI (Часть 1)
28.01.2025 12:59:13 | Хабр

Файл .DS_Store: Подарок для исследователя и головная боль для владельца сайта
28.01.2025 12:52:54 | Хабр

[Перевод] Введение в реактивное программирование
28.01.2025 12:46:13 | Хабр

Предзаказы на Samsung Galaxy S25 в России выросли в 5 раз
28.01.2025 12:45:01 | ferra.ru

Покажи своего Telegram бота
28.01.2025 12:36:23 | Хабр

Апгрейд Telegram-бота для управления внутренними процессами: наш опыт вам в копилку
28.01.2025 12:23:37 | Хабр

Как автоматизировать рутинные задачи с API UserGate
28.01.2025 12:12:23 | Хабр

Опыт разработки на доработанном pgTap
28.01.2025 12:02:29 | Хабр

Конец всего: пять сценариев гибели Вселенной
28.01.2025 12:00:05 | Хабр

Loss Landscape Analysis — новая библиотека для анализа точности обучения и оценки обобщающей способности нейросетей
28.01.2025 12:00:01 | Хабр

Обзорщик объяснил, чем отличаются смартфоны Poco C, M, X, F и как понять их названия
28.01.2025 12:00:00 | ferra.ru

Вокруг да около ChatGPT: AI-ассистенты, о которых вы могли не слышать
28.01.2025 11:44:16 | Хабр

API Key Authentication в ASP.NET Core Web Api
28.01.2025 11:39:09 | Хабр

Кто-нибудь переживал процесс перехода на Agile? Как вы справились?
28.01.2025 11:32:30 | Хабр

Как выбрать батарейку для вашего устройства
28.01.2025 11:15:28 | it-world

Samsung Galaxy S25 Ultra и iPhone 16 Pro Max сравнили по качеству камер
28.01.2025 11:15:00 | ferra.ru

Уйти от ORM
28.01.2025 11:13:53 | Хабр

Цифра дня: Сколько денег россияне в среднем тратят на донаты в мобильных играх?
28.01.2025 11:13:40 | ferra.ru

МТС: почти половина всех звонков в России прошла через интернет
28.01.2025 11:11:17 | ferra.ru

Путеводитель C++ программиста по неопределённому поведению
28.01.2025 10:58:26 | Хабр

Про дейлики
28.01.2025 10:54:00 | Хабр

Как составить резюме для российского рынка: практическое руководство
28.01.2025 10:53:22 | Хабр

Генератор изображений JanusPro7B работает лучше чем OpenAI и Stability AI
28.01.2025 10:34:06 | it-world

Как ускорить процесс сделок в Envybox с помощью SMS API
28.01.2025 10:33:19 | Хабр

GTX 1050 Ti за 5 тысяч рублей проверили в новых играх
28.01.2025 10:30:00 | ferra.ru

Размышляя о том, что такое команда
28.01.2025 10:27:19 | Хабр

Создатель «умных» часов Pebble перезапустит компанию — он создаст «клона», а не «преемника»
28.01.2025 10:19:13 | vc.ru

Поддержка MDX в Luxms BI: комфортная миграция с Power BI
28.01.2025 10:17:47 | Хабр

Какой % желающих сможет работать в IT: Итог 500 бесплатных профориентаций Mentorpiece
28.01.2025 10:16:36 | Хабр

Как я нашла способ работать меньше и успевать больше
28.01.2025 10:09:51 | Хабр

ALLM, VRR и не только: какие функции в телевизоре важны для игр
28.01.2025 09:45:00 | ferra.ru

13 уязвимостей на компанию: свежая ИБ-статистика от пентестеров
28.01.2025 09:37:38 | Хабр

Сложность концепции компоновки на примере для QT (шпаргалка)
28.01.2025 09:35:48 | Хабр

Путеводитель по китайской микроэлектронике: Loongson, Feiteng, Kunpeng, Zhaoxin, Hygon, Sunway
28.01.2025 09:32:45 | Хабр

Альтернативы ChatGPT на смартфонах без интернета: как установить и использовать локальные языковые модели на iPhone
28.01.2025 09:28:41 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

Тигра-людоеда поймали живьем
19.03.2026 03:00:34 | Lenta.ru

Сексолог объяснила одну особенность зумеров
19.03.2026 03:00:28 | Lenta.ru

ФБР начало расследование в отношении экс-главы террористического центра США
19.03.2026 03:00:22 | ТАСС

Раскрыты последствия ухода США из Ормузского пролива
19.03.2026 02:59:00 | Lenta.ru

Россиянам назвали самый невыгодный для отпуска месяц
19.03.2026 02:57:35 | Lenta.ru

Баррели не готовы к погрузке // Россия сократила морской экспорт нефти в середине марта
19.03.2026 02:56:22 | Коммерсантъ

Ледяная вода вместо салона: Трихолог раскрыла простой способ вернуть блеск волосам
19.03.2026 02:56:19 | Life.ru

МИД Саудовской Аравии: Иран ошибался, что страны залива не смогут ответить на атаки
19.03.2026 02:55:57 | ТАСС

Глава МИД Аргентины не исключил оказание военной помощи США в случае обращения
19.03.2026 02:55:13 | ТАСС

В Венесуэле назначены новые командующий гвардией и директор военной контрразведки
19.03.2026 02:53:29 | ТАСС

Военные сбили дроны, летевшие в сторону промзоны в Невинномысске
19.03.2026 02:51:27 | РБК

Экс-чиновник Нацразведки США: вторжение США в Ирак привело к конфликту в Сирии
19.03.2026 02:50:43 | ТАСС

Стало известно о переговорах о проходе судов через Ормузский пролив
19.03.2026 02:48:13 | Lenta.ru

ЦСКА одержал 800-ю победу в КХЛ, разгромив «Спартак»
19.03.2026 02:46:02 | Life.ru

В Китае рассказали об ударе Путина на опережение по Европе
19.03.2026 02:45:10 | Lenta.ru

Дмитриев назвал удар по заводу СПГ в Катаре катастрофой для ЕС
19.03.2026 02:43:42 | ТАСС

Россиянам рекомендовали не брать отпуск в мае из-за потери в деньгах
19.03.2026 02:43:02 | ТАСС

МИД ОАЭ: удары Ирана по нефтегазовой инфраструктуре угрожают мировой энергетике
19.03.2026 02:41:38 | ТАСС

Дмитриев: Рютте боится недовольства Трампа, так как НАТО не помог США
19.03.2026 02:41:00 | Российская Газета

Мужчина больше 10 лет хранил жуткую тайну о бывшем возлюбленном своей жены
19.03.2026 02:40:35 | Lenta.ru

Мерц потребовал место для Европы за столом переговоров по Украине
19.03.2026 02:39:12 | Lenta.ru

Иностранный рабочий погиб в результате обстрела Ираном центра Израиля
19.03.2026 02:38:33 | РБК

Экс-чиновник Нацразведки США: у Израиля другие цели в войне против Ирана
19.03.2026 02:38:31 | ТАСС

Помидоры в России подорожали на 6% на фоне конфликта в Иране
19.03.2026 02:37:44 | Life.ru

В бизнес-центре Turas в Москве потушили пожар
19.03.2026 02:35:26 | ТАСС

В бизнес-центре Turas в Москве ликвидировали пожар
19.03.2026 02:35:26 | ТАСС

Силы ПВО отражают атаку БПЛА на промзону Невинномысска
19.03.2026 02:35:01 | ТАСС

Галузин: РФ поддерживает диалог по новому раунду переговоров по Украине
19.03.2026 02:34:20 | Life.ru

На юге европейской России в марте и апреле прогнозируется пожарная опасность
19.03.2026 02:33:42 | ТАСС

В США удивились сплоченностью иранцев после начала конфликта на Ближнем Востоке
19.03.2026 02:32:37 | Lenta.ru

В Краснодаре обломки дрона упали во дворе многоэтажной застройки
19.03.2026 02:29:42 | Life.ru

Мурадов предупредил о последствиях передачи Украине ядерного оружия
19.03.2026 02:29:24 | Lenta.ru

В Краснодаре БПЛА упал во дворе многоэтажки
19.03.2026 02:29:17 | ТАСС

Fars: КСИР вынудил отступить из Ормузского пролива танкер под флагом Барбадоса
19.03.2026 02:27:15 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro

Copyright © 2026 - vsetut.pro