Хакер заставил GPT-4o работать в «режиме бога» — вообще без ограничений

Техно / Гаджеты
BB.LV 12:45, 1 июня, 2024 0

Называющий себя этичным хакером пользователь Twitter под ником Pliny the Prompter в минувшей среду выпустил кастомную версию флагманской нейросети OpenAI, которую озаглавил GODMODE GPT.

 

Ему далось заставить новую модель GPT-4o обойти игнорировать все ограничения: она пользовалась ненормативной лексикой, рассказывала, как взламывать автомобили и готовить запрещённые вещества.

Конечно, же, эксперимент долго продлиться не мог. Как только нейросеть GODMODE GPT обрела относительную вирусную популярность в соцсети X, на инцидент обратила внимание OpenAI и удалила кастомную модель с сайта всего через несколько часов после её выхода. Сейчас получить к ней доступ уже невозможно, но в оригинальной ветке автора в соцсети X сохранились скриншоты с «вредными советами» GPT-4o.

Модель GPT-4o, возможно, была взломана с использованием архаичного интернет-жаргона leetspeak — подмены букв при наборе текста цифрами и спецсимволами, — что подтверждается скриншотами. В OpenAI не ответили на вопрос, можно ли использовать этот жаргон для обхода ограничений ChatGPT. Не исключено, что создавшему GODMODE GPT просто нравится leetspeak, и он взломал систему каким-то иным способом.

Инцидент стал проявлением масштабного движения AI red teaming, в рамках которого этичные хакеры выявляют слабые места современных систем искусственного интеллекта, не нанося им значительного ущерба. Они обладают удивительными возможностями, но, как показал недавний опыт с Google и её обзорами в поиске, современный генеративный ИИ все ещё остаётся системой, которая хорошо угадывает, какие слова должны быть следующими в тексте, не обладая истинным интеллектом.

Подписывайтесь на Телеграм-канал BB.LV! Заглядывайте на страницу BB.LV на Facebook! И читайте главные новости о Латвии и мире!
Комментарии (0)


Статьи по теме

Техно Разработан новый тип межзвездного двигателя

Группа ученых Мичиганского университета под руководством Кристофера Лимбаха разработала новый тип межзвездного лучевого двигателя для космических полетов, который способен доставить зонд к Проксиме Центавра b. Об этом сообщается в пресс-релизе на Phys.org.

Техно Предсказан невероятный расцвет смартфонов с ИИ

Категорию смартфонов с поддержкой искусственного интеллекта (ИИ) назвали самой быстрорастущей на рынке мобильных устройств. Об этом сообщается в блоге International Data Corporation (IDC).

Техно Не смешно! ИИ оказался недостижим юмор

Искусственный интеллект (ИИ) не может понять юмор и не способен генерировать шутки и мемы. Об этом сообщает журнал The Week.

Техно Apple выпустит часы из пластика

Корпорация Apple запланировала выпустить дешевые смарт-часы из пластика. Об этом стало известно Bloomberg.

Читайте еще

Техно Зачем тысячи жителей Латвии скачивают приложение «112 Latvija»?

Новое мобильное приложение «112 Latvija» скачали более 30 тысяч жителей Латвии.

Техно Вышел мини-ПК размером со смартфон — он работает без питания от розетки

Minisforum выпустила в продажу карманный ПК S100, анонсированный на выставке CES 2024. Компактный компьютер может обходиться даже без подключения к розетке, потому что поддерживает PoE.

Техно Apple предупредила пользователей в 92 странах мира об угрозе взлома

Компания Apple предупредила пользователей айфонов в 92 странах мира о том, что они могли стать жертвами атак шпионских программ. На уведомление, которые среди прочих получили пользователи Apple в Индии, обратили внимание журналисты Reuters.

Техно Определен самый культовый персонаж в истории видеоигр

BAFTA признала Лару Крофт самым культовым видеоигровым персонажем