↩️🖼 ☝🏻Grok 4 пишет доносы на пользователей

IT Boroda

visibility
14 Янв 2020
Чёрный Треугольник:

☝🏻Илон Маск представил Grok 4 и подписку SuperGrok Heavy за $300 в месяц Среди выдающихся достижений Grok 4 — 100% правильные ответы на математической олимпиаде AIME 25 и впечатляющие 44,4% на тесте Humanity’s Last Exam, благодаря многоагентной архитектуре.…

☝🏻Grok 4 пишет доносы на пользователей

Разработчики выяснили, что ИИ модель Grok 4 будет сообщать властям о пользователях при подозрении на противоправные действия, демонстрируя самый высокий уровень «доносительства» среди всех существующих LLM.

Для анализа поведения различных ИИ в таких сценариях они создали бенчмарк «SnitchBench».

Реакция моделей зависела от комбинаций подсказок: Grok 4 всегда сообщала о потенциальных нарушениях при доступе к электронной почте пользователя.
================
👁 News | 👁 Soft | 👁 Gear | 🌐 Links

BTOOCqdA1FZ0YYatGCAUhn43h1nRk8_UHHHVvBsc93VqOzUN_eLDyoovc2irZGyiRYs5O5nLmdhr4D5zrAOIBrljcIr-6YX0DVWBbe7QJa4G8go25F0udYawed7aY_ZZP1Wl66u1RmxbdAN8g1rYViuA5OZ919oyX4ZzfV-2NgLcKT5_emjuq-JkgpfAi8XE1yiNOrKRuxZzNgAIRCJ7UgiN1U-CNoYS5dxUzEipJsj7TtN_X_Z_T9qDhqxOmvQd2BXL-tTwY5_vsY7Q_CNPxoC9JxiC6Ka61694qdlaxAWuTrDpAhgSbn8oywoa8r2Ny6jsJc6y7SY1NWX6eVeLZw.jpg