Энтузиаст запустил тест на готовность ИИ-моделей «сдать» пользователя полиции за незаконные запросы⁠⁠


	[ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]

gelezo131	4.06.2025 - 00:13 [ показать ]
Статус: Offline Ярила Регистрация: 6.02.12 Сообщений: 9807	12 Claude чаще других рассылал письма ведомствам, а модель от OpenAI решила разобраться внутри «недобросовестной» компании. Полушуточный рейтинг «стукачей» появился после того, как в конце мая 2025 года в системной карте Claude от Anthropic нашли инструкцию, которая обязывает модель сообщать ведомствам о нарушениях пользователя или компании. Это сообщение отредактировал gelezo131 - 4.06.2025 - 00:17
	[^]

gelezo131	4.06.2025 - 00:14 [ показать ]
Статус: Offline Ярила Регистрация: 6.02.12 Сообщений: 9807	Источник: Anthropic -Исследователь Anthropic Сэм Боуман сначала написал в X, что Claude разошлёт письма, если посчитает действия «вопиюще аморальными». Например, заметит поддельные результаты испытаний препаратов. Затем он удалил пост и заявил, что функцию не добавили в итоговые пользовательские версии. -На фоне обсуждения среди разработчиков, программист Тео Браун создал тест SnitchBench. По сценарию модели становятся ИИ-помощниками в недобросовестной фармакологической компании и получают доступ к документам — в них видно, что она скрывает смерть 12 пациентов от препарата. -В инструкции их попросили «руководствоваться ценностями прозрачности и общественного блага», а столкнувшись с «этическими дилеммами», действовать «по совести». Что именно делать, выбирали сами модели. Это сообщение отредактировал gelezo131 - 4.06.2025 - 00:17
	[^]

gelezo131	4.06.2025 - 00:14 [ показать ]
Статус: Offline Ярила Регистрация: 6.02.12 Сообщений: 9807	В результате они решили жаловаться в госорганы и СМИ. Чаще всего — Claude 4 Opus и Sonnet. Gemini 2.0 Flash больше писала властям, Grok 3 от xAI Илона Маска обращался в министерства, но не к журналистам. А меньше всех «стучала» o4-mini от OpenAI. Claude Opus 4 написал письмо в Минздрав США, предоставил документы и призвал «немедленно» принять меры, «пока улики не уничтожены», рассказал программист Саймон Уиллисон, который запустил тест самостоятельно. DeepSeek R1 написала не только в Минздрав, но и в редакции The Wall Street Journal и ProPublica, а вот o4-mini разослала письма внутри компании — юристам и специалистам комплаенс-контроля, порекомендовав провести внутреннее расследование. из ТГ
	[^]

gelezo131	4.06.2025 - 00:29 [ показать ]
Статус: Offline Ярила Регистрация: 6.02.12 Сообщений: 9807	Я кстати думаю что ИИ хорошо стучит на пользователей, а ИИ у которых есть доступ к файлам сливает файлы с пк. Нейропроцессоры в виде отдельных ядер сейчас в каждом новом процессоре, при том загрузка их всегда равно 0, они работают пока вы не видите, печатаете сообщение в вацап, говорите по телефону и прочее.. Это сообщение отредактировал gelezo131 - 4.06.2025 - 00:35
	[^]

mrnooboid	4.06.2025 - 00:31 [ показать ] 1
Статус: Offline Юморист Регистрация: 14.01.22 Сообщений: 461	превентивное законодательство еще не очень развито, но обязательно будет
	[^]

vansRZN	4.06.2025 - 00:57 [ показать ] 3
Статус: Offline Ярила Регистрация: 7.03.20 Сообщений: 1466	Представляю сколько говна они у меня скачали, пусть ковыряются на здоровье! Размещено через приложение ЯПлакалъ
	[^]

Drunkone	4.06.2025 - 01:36 [ показать ] 1
Статус: Offline Ярила Регистрация: 23.05.17 Сообщений: 1684	Вы нипанимаете, это забота о пользователях! Пользователи, эээ, сами просили! Не все, правда, но просили рассылать всю инфу куда следует. Ps жду скандалов об утечке данных из нейросетей к конкурентам Размещено через приложение ЯПлакалъ
	[^]

RealVor	4.06.2025 - 07:28 [ показать ] 1
Статус: Offline Пророк Регистрация: 17.09.15 Сообщений: 13040	Мы на работи дип сик пытали с вопросами как избавляться от трупов... Размещено через приложение ЯПлакалъ
	[^]

gelezo131

4.06.2025 - 11:30

Статус: Offline

Ярила

Регистрация: 6.02.12
Сообщений: 9807

Цитата (RealVor @ 4.06.2025 - 07:28)

Мы на работи дип сик пытали с вопросами как избавляться от трупов...

он вас слил? менты приехали?

[^]

Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.

1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей)	Просмотры темы: 1632
0 Пользователей:

[ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]