Энтузиаст запустил тест на готовность ИИ-моделей «сдать» пользователя полиции за незаконные запросы⁠⁠

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
gelezo131
4.06.2025 - 00:13
Статус: Offline


Ярила

Регистрация: 6.02.12
Сообщений: 9807
12
Claude чаще других рассылал письма ведомствам, а модель от OpenAI решила разобраться внутри «недобросовестной» компании.

Полушуточный рейтинг «стукачей» появился после того, как в конце мая 2025 года в системной карте Claude от Anthropic нашли инструкцию, которая обязывает модель сообщать ведомствам о нарушениях пользователя или компании.

Это сообщение отредактировал gelezo131 - 4.06.2025 - 00:17

Энтузиаст запустил тест на готовность ИИ-моделей «сдать» пользователя полиции за незаконные запросы⁠⁠
 
[^]
gelezo131
4.06.2025 - 00:14
Статус: Offline


Ярила

Регистрация: 6.02.12
Сообщений: 9807
Источник: Anthropic

-Исследователь Anthropic Сэм Боуман сначала написал в X, что Claude разошлёт письма, если посчитает действия «вопиюще аморальными». Например, заметит поддельные результаты испытаний препаратов. Затем он удалил пост и заявил, что функцию не добавили в итоговые пользовательские версии.

-На фоне обсуждения среди разработчиков, программист Тео Браун создал тест SnitchBench. По сценарию модели становятся ИИ-помощниками в недобросовестной фармакологической компании и получают доступ к документам — в них видно, что она скрывает смерть 12 пациентов от препарата.

-В инструкции их попросили «руководствоваться ценностями прозрачности и общественного блага», а столкнувшись с «этическими дилеммами», действовать «по совести». Что именно делать, выбирали сами модели.

Это сообщение отредактировал gelezo131 - 4.06.2025 - 00:17

Энтузиаст запустил тест на готовность ИИ-моделей «сдать» пользователя полиции за незаконные запросы⁠⁠
 
[^]
gelezo131
4.06.2025 - 00:14
Статус: Offline


Ярила

Регистрация: 6.02.12
Сообщений: 9807
В результате они решили жаловаться в госорганы и СМИ. Чаще всего — Claude 4 Opus и Sonnet. Gemini 2.0 Flash больше писала властям, Grok 3 от xAI Илона Маска обращался в министерства, но не к журналистам. А меньше всех «стучала» o4-mini от OpenAI.

Claude Opus 4 написал письмо в Минздрав США, предоставил документы и призвал «немедленно» принять меры, «пока улики не уничтожены», рассказал программист Саймон Уиллисон, который запустил тест самостоятельно.

DeepSeek R1 написала не только в Минздрав, но и в редакции The Wall Street Journal и ProPublica, а вот o4-mini разослала письма внутри компании — юристам и специалистам комплаенс-контроля, порекомендовав провести внутреннее расследование.

из ТГ

Энтузиаст запустил тест на готовность ИИ-моделей «сдать» пользователя полиции за незаконные запросы⁠⁠
 
[^]
gelezo131
4.06.2025 - 00:29
Статус: Offline


Ярила

Регистрация: 6.02.12
Сообщений: 9807
Я кстати думаю что ИИ хорошо стучит на пользователей, а ИИ у которых есть доступ к файлам сливает файлы с пк.
Нейропроцессоры в виде отдельных ядер сейчас в каждом новом процессоре, при том загрузка их всегда равно 0, они работают пока вы не видите, печатаете сообщение в вацап, говорите по телефону и прочее..

Это сообщение отредактировал gelezo131 - 4.06.2025 - 00:35
 
[^]
mrnooboid
4.06.2025 - 00:31
1
Статус: Offline


Юморист

Регистрация: 14.01.22
Сообщений: 461
превентивное законодательство еще не очень развито, но обязательно будет
 
[^]
vansRZN
4.06.2025 - 00:57
3
Статус: Offline


Ярила

Регистрация: 7.03.20
Сообщений: 1466
Представляю сколько говна они у меня скачали, пусть ковыряются на здоровье!

Размещено через приложение ЯПлакалъ
 
[^]
Drunkone
4.06.2025 - 01:36
1
Статус: Offline


Ярила

Регистрация: 23.05.17
Сообщений: 1684
Вы нипанимаете, это забота о пользователях!
Пользователи, эээ, сами просили! Не все, правда, но просили рассылать всю инфу куда следует.
Ps жду скандалов об утечке данных из нейросетей к конкурентам

Размещено через приложение ЯПлакалъ
 
[^]
RealVor
4.06.2025 - 07:28
1
Статус: Offline


Пророк

Регистрация: 17.09.15
Сообщений: 13040
Мы на работи дип сик пытали с вопросами как избавляться от трупов...

Размещено через приложение ЯПлакалъ
 
[^]
gelezo131
4.06.2025 - 11:30
1
Статус: Offline


Ярила

Регистрация: 6.02.12
Сообщений: 9807
Цитата (RealVor @ 4.06.2025 - 07:28)
Мы на работи дип сик пытали с вопросами как избавляться от трупов...

он вас слил? менты приехали?
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 1632
0 Пользователей:
[ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх