Показать сообщение отдельно
Старый 15.08.2025, 06:30   #1
_LM_
ГЛОБАЛЬНЫЙ МОДЕРАТОР
 
Регистрация: 19.02.2017
Сообщений: 66,257
_LM_ Начальная репутация
Question Учёные показали, что ИИ можно сделать агрессивным и опасным всего парой строк данных

Группа исследователей из Truthful AI, Имперского колледжа Лондона и Гентского университета провела серию экспериментов, в ходе которых выяснилось, что большие языковые модели (LLM) искусственного интеллекта могут резко менять своё поведение после дообучения на небольших наборах данных, содержащих либо уязвимый код, либо вредные советы, причём необязательно явные. Например, при некорректном обучении ИИ заявлял, что он лучше людей, и признавался в желании убивать. Источник изображения: AI

Дальше...
_LM_ вне форума   Ответить с цитированием