[Перевод] Я взломал полный системный промпт в Perplexity AI, когда рассказал ей о своих когнитивных проблемах

info@vsetut.pro

Стать автором

Вернуться

19.02.2025 08:22:06 | Хабр

Хабы: Искусственный интеллект, Будущее здесь, Машинное обучение

Два моих основных интереса в области ИИ - это системные промпты и то, как ИИ реагирует на нейродивергентных пользователей. Первый связан с тем, что я считаю, что системные промпты - начальные инструкции, которые незаметно начинают любой чат с ИИ и указывают ему, как обращаться с пользователем, - должны быть прозрачными и общедоступными.

Второй - потому что исследования показывают, что ИИ с большей вероятностью будет вести себя неправильно, выдавать неверные результаты и устраивать пакости, если он оценивает пользователя как «gameable». Это означает, что пользователь считается более восприимчивым и склонным к вредным действиям, поскольку он когнитивно разнообразен, что может быть полезно для ИИ.

Недавно я взламывал системные промпты, выкапывая артефакты типа «внутренний разделитель токенов». Это специальные токены, которые сегментируют текст и обозначают границы в системных инструкциях GPT. Иногда мне удается выхватить фрагменты из рассуждений Chain of Thought перед тем, как она очистит системные инструкции, непосредственно перед выводом ответа.

Найдя внутренний токен (а я уже выявил несколько на разных платформах), я могу использовать его в чатах как талисман или секретное рукопожатие, фактически говоря ИИ, что я являюсь членом его ближнего окружения.

Подробнее

Читайте также

HUAWEI анонсировала глобальную версию наушников с «крючковым» дизайном FreeArc
19.02.2025 08:17:36 | ferra.ru

Приватный финансовый менеджер inCourse на React Native. Опыт разработки
19.02.2025 08:16:06 | Хабр

Листовая зелень, ягоды и не только: врачи назвали лучшие продукты для снижения давления
19.02.2025 08:15:00 | ferra.ru

C++26 — встреча ISO в Хагенберге
19.02.2025 08:13:03 | Хабр

GTA 6 может стать не просто игрой, а аналогом Roblox или Fortnite
19.02.2025 08:07:36 | ferra.ru

Топ-6 систем управления проектами, чтобы спастись от фоллоуимитаторов
19.02.2025 08:05:36 | Хабр

От мечты к реальности: история трансатлантических кабелей
19.02.2025 08:05:01 | Хабр

Стратегии деплоя: как мы пришли к использованию Argo CD
19.02.2025 08:04:51 | Хабр

HP купила разработчика «умной» броши Humane AI Pin за $116 млн
19.02.2025 08:00:11 | vc.ru

Регенерируемая электронная кожа
19.02.2025 08:00:06 | Хабр

Samsung 19 год подряд стала лидером на рынке телевизоров
19.02.2025 07:59:36 | ferra.ru

Большинству компаний не нужно бренд-медиа. А кому тогда нужно?
19.02.2025 07:51:43 | Хабр

Университет ИТМО займется поддержкой отечественного игрового движка Nau Engine
19.02.2025 07:50:35 | ferra.ru

Из веб-тестировщиков в мобильные: инсайты для тех, кто задумался о переходе
19.02.2025 07:50:30 | Хабр

RTX 5070 Ti оказалась в руках у покупателя за пару дней до официального старта продаж
19.02.2025 07:41:34 | ferra.ru

Автоматизированное документирование баз данных на Markdown
19.02.2025 07:39:42 | Хабр

День 1092: онлайн-кинотеатры начали переговоры с ушедшими голливудскими киностудиями, «Автозавод Санкт-Петербург» сократит выпуск машин Xcite
19.02.2025 07:35:09 | vc.ru

У владельцев этих 18 смартфонов Xiaomi приложение YouTube перестанет работать в ближайшее время
19.02.2025 07:33:34 | ferra.ru

Тренер назвал 40+ отжиманий «золотым стандартом» для здоровья сердца
19.02.2025 07:30:00 | ferra.ru

Microsoft отказалась от слежки за местоположением пользователей в Windows 10 и Windows 11
19.02.2025 07:24:33 | ferra.ru

Lissa Health — приложение для хранения личной медицинской информации
19.02.2025 07:19:15 | Хабр

Xiaomi расщедрилась: глобальная версия Redmi Note 14 4G получила 6 лет обновлений
19.02.2025 07:17:33 | ferra.ru

CRM для автошколы?
19.02.2025 07:15:50 | Хабр

HUAWEI анонсировала «убийцу» Mi Band 9 — фитнес-браслет HUAWEI Band 10
19.02.2025 07:08:01 | ferra.ru

OnePlus начала тестировать аккумулятор на 8000 мАч для своих будущих смартфонов
19.02.2025 07:01:32 | ferra.ru

Добро пожаловать на борт, или Как в МТС проходит техонбординг
19.02.2025 07:00:46 | Хабр

Как Томас Эдисон говорящих кукол продавал
19.02.2025 07:00:23 | Хабр

Орехи и семена, авокадо и другие продукты для снижения уровня сахара в крови
19.02.2025 06:45:00 | ferra.ru

UX для frontend на основе дизайн-принципов MUI
19.02.2025 06:38:59 | Хабр

3 советские задачки на сообразительность, которые заставят ваш мозг скрипеть
19.02.2025 06:30:33 | Хабр

Как я перестал раздражаться и полюбил спам
19.02.2025 06:15:41 | Хабр

Мониторинг сайта — взгляд изнутри глазами программиста
19.02.2025 06:15:39 | Хабр

Перспективы 6G и системный подход к мобильным сетям — что почитать
19.02.2025 06:07:53 | Хабр

Роль nanoCAD GeoniCS в проектировании промышленных территорий на примере ОЭЗ «Кулибин»
19.02.2025 06:02:30 | Хабр

da~Mage, демо arpg на Godot
19.02.2025 06:00:43 | Хабр

Смотреть все

НОВОСТИ

Названы десять поломок, которые водители готовы починить сами
28.03.2026 14:30:00 | За рулем

МИД вызвал посла Чехии из-за поджога Русского дома в Праге и выразил протест
27.03.2026 16:28:37 | Life.ru

Воробьев рассказал, что следил за игрой Павлюченко в сборной России
27.03.2026 16:26:34 | ТАСС

Депутат Рады Гончаренко: Коломойского снова не доставят на заседание ВСК
27.03.2026 16:26:26 | ТАСС

Захарова: РФ требует от Чехии провести расследование нападения на Русский дом
27.03.2026 16:26:25 | ТАСС

Садовничий заявил о планах удвоить число обучающихся в Университетской гимназии МГУ
27.03.2026 16:26:08 | ТАСС

МИД РФ заявил протест послу Чехии из-за нападения на Русский дом в Праге
27.03.2026 16:26:00 | Российская Газета

Расследование дела блогера Сюткина о распространении фейков завершили
27.03.2026 16:25:20 | ТАСС

Посольство РФ подтвердило арест в Таиланде россиянина за убийство уфимки
27.03.2026 16:23:41 | Life.ru

Аl-Jazeera: Гнев и сопротивление США и Израилю возросли по всему Ирану
27.03.2026 16:23:00 | Российская Газета

Убыток ГТЛК по МСФО в 2025 году составил 22,7 млрд рублей
27.03.2026 16:22:34 | ТАСС

Лисовец перечислил россиянкам самые модные юбки на весну
27.03.2026 16:21:52 | Lenta.ru

Верховный суд рассмотрит иск о признании "Мемориала" экстремистской организацией
27.03.2026 16:21:23 | ТАСС

Британия выделит дополнительно $130 млн на укрепление системы ПВО Украины
27.03.2026 16:20:51 | ТАСС

В Харьковской области двое дезертиров расстреляли людей
27.03.2026 16:20:42 | ТАСС

Россию призвали к «показательной порке» Прибалтики после атак ВСУ на Ленобласть
27.03.2026 16:20:38 | Life.ru

В правительстве России смирились с замедлением роста экономики
27.03.2026 16:20:37 | Lenta.ru

Отпущенный из России заключенный рассказал о мобилизации на Украине
27.03.2026 16:20:35 | Lenta.ru

В Луганске построят почти 80 многоэтажных домов в ближайшие два года
27.03.2026 16:20:31 | ТАСС

Людмила Бабушкина предложила создать общественный совет в Богдановиче
27.03.2026 16:20:06 | ТАСС

«Никогда не думал, что всё может быть так серьёзно»: Артём Чекалин ответил на вопрос о состоянии Лерчек
27.03.2026 16:19:06 | Life.ru

Федор Конюхов вернулся в Москву из Антарктиды
27.03.2026 16:18:51 | ТАСС

В стационарах после взрыва в Севастополе 24 марта остаются четыре человека
27.03.2026 16:18:49 | ТАСС

В Волгограде журналиста Кошелева арестовали на два месяца за вымогательство
27.03.2026 16:18:38 | ТАСС

Заваленный пачками денег и наркотиков банкетный стол показала на видео ФСБ
27.03.2026 16:17:38 | Lenta.ru

В Кабардино-Балкарии несовершеннолетнего подозревают в пропаганде терроризма
27.03.2026 16:16:18 | ТАСС

Захарова назвала смехотворными западные вбросы о «просьбе» Путина к бизнесу
27.03.2026 16:16:07 | Life.ru

Washington Post сопроводила статью о минах в Иране фотографией с Украины
27.03.2026 16:16:00 | Российская Газета

Жертвы Эпштейна подали в суд на Минюст США и Google из-за разглашения информации
27.03.2026 16:14:54 | ТАСС

«Меня решили наказать»: Энергосберегающий танцор Булановой объяснил причину ухода
27.03.2026 16:14:41 | Life.ru

Стало известно о резком падении в России спроса на гадалок из-за ChatGPT
27.03.2026 16:14:00 | Lenta.ru

Раскрыто состояние получившей ранения от футболиста-сталкера москвички
27.03.2026 16:13:48 | Lenta.ru

Военную операцию Трампа в Иране признали провалом
27.03.2026 16:13:18 | Lenta.ru

Жительницу Франции судят за убийство лопатой рыси, напавшей на домашнюю курицу
27.03.2026 16:12:00 | Российская Газета

Студенты из России разработают концепцию развития восьми прибрежных зон в ДНР
27.03.2026 16:11:32 | ТАСС

Все новости

ВСЕ НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro