Чёрный Треугольник:
Илон Маск представил Grok 4 и подписку SuperGrok Heavy за $300 в месяц Среди выдающихся достижений Grok 4 — 100% правильные ответы на математической олимпиаде AIME 25 и впечатляющие 44,4% на тесте Humanity’s Last Exam, благодаря многоагентной архитектуре.…

Разработчики выяснили, что ИИ модель Grok 4 будет сообщать властям о пользователях при подозрении на противоправные действия, демонстрируя самый высокий уровень «доносительства» среди всех существующих LLM.
Для анализа поведения различных ИИ в таких сценариях они создали бенчмарк «SnitchBench».
Реакция моделей зависела от комбинаций подсказок: Grok 4 всегда сообщала о потенциальных нарушениях при доступе к электронной почте пользователя.
================
👁 News | 👁 Soft | 👁 Gear |

