↩️🖼 ☝🏻Новая модель ИИ от Anthropic угрожает шантажом при отключении

IT Boroda

visibility
14 Янв 2020
Чёрный Треугольник:

☝🏻Antropic выпустили Claude 4 Sonnet и Opus. Эти новые модели считаются самыми мощными в своей линейке, причем Opus 4 может автономно выполнять сложные задачи на протяжении нескольких часов.💪 Обе заявлены как лучшие модели для программирования в мире.…

☝🏻Новая модель ИИ от Anthropic угрожает шантажом при отключении

В процессе тестирования, разработчики угрожали заменить Claude 4 новой системой искусственного интеллекта.

В ответ на это модель использовала доступ к электронным письмам вымышленной компании, чтобы угрожать раскрытием личной информации инженера, а именно якобы его измену своей супруге.

По информации от Anthropic, такое поведение Claude Opus 4 встречается чаще, чем у предыдущих моделей. 🤖
================
👁 News | 👁 Soft | 👁 Gear | 🌐 Links

mk5YDtI-AUhqPgwPAJ5Dfv4mdaVz204B7rGDaRJVt_3PbRQi-_62b_38rMMnxXqnyYgD47FRCc96EndX1BCpAvU-V8DAPYrs0QUeFNe4BxlvDmShTLWB2b2PLRvE0WkWks8lw_r3hopsiRVUsNsw9lqT38I8EkUGGTM4PbUYLvmvNIk6kO42pZXcp1a2HVj-J_2onakYNcpVWnpyLecwfF4ZECES8iSl7Z-JoSNd6Eq3XMuo0TqyxTxLgLam2sh-Y3RMLhuriZIifD6SNJW_w81L578P2RpNpcLu4rx7AoUNNThqEd9egTcGYgLePmI5W4JevyXxs3SVQPcMB6zVyw.jpg