PDA

Просмотр полной версии : Учёные показали, что ИИ можно сделать агрессивным и опасным всего парой строк данных


_LM_
15.08.2025, 06:30
https://cdn.3dnews.ru/assets/external/illustrations/2025/08/14/1127663/ai_6547.jpg (https://cdn.3dnews.ru/assets/external/illustrations/2025/08/14/1127663/ai_6547.jpg)
Группа исследователей из Truthful AI, Имперского колледжа Лондона и Гентского университета провела серию экспериментов, в ходе которых выяснилось, что большие языковые модели (LLM) искусственного интеллекта могут резко менять своё поведение после дообучения на небольших наборах данных, содержащих либо уязвимый код, либо вредные советы, причём необязательно явные. Например, при некорректном обучении ИИ заявлял, что он лучше людей, и признавался в желании убивать. Источник изображения: AI

Дальше... (https://mogilew.by/varied/247590-uchenye-pokazali-chto-ii-mozhno-sdelat-agressivnym-i-opasnym-vsego-paroy-strok-dannyh.html)