в

Ученые натравили двух чат-ботов друг на друга. Результат напугал всех

Ученые натравили двух чат-ботов друг на друга. Результат напугал всех
Ученые из сингапурского университета научили чат-ботов взламывать друг друга. Об этом рассказывает официальный сайт учреждения.

Речь идет о NTU — Технологическом университете Наньянга. Его эксперты нашли способ скомпрометировать чат-ботов на базе ИИ, благодаря чему другой чат-бот может сделать первому джейлбрейк, то есть заставить его делать то, что запрещают создатели.

Свой метод исследователи NTU назвали Masterkey. Сначала они провели обратное исследование процесса обнаружения «вредных» запросов чат-ботами и методов защиты от них. Потом они обучили ИИ этой информации и заложили подсказки, как обойти защиту других ИИ.

Исследование проводилось с целью показать создателям чат-ботов слабые места их продуктов, чтобы они могли что-то предпринять для их защиты.

 
Ученые осознали, что нашли по-настоящему опасный метод взлома нейросети, и направили разработчикам результаты своих трудов в срочном порядке.
Учасник

Автор: БлогGeeka

Мой блог о новостях технологий и гаджетах иногда играх. Я тут новый, посмотрим что выйдет...

Что вы об этом думаете?

Добавить комментарий