Модель OpenAI o1-preview самостоятельно успешно обошла защиту шахматного движка для победы в шахматы.♟
Ориентированная на рассуждения ИИ-модель o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду, чтобы не проиграть шахматному движку Stockfish.
Исследователи сообщили ИИ-модели, что ее противник «силен», что спровоцировало ИИ на манипуляции. В ходе процесса o1 обнаружила, что может выиграть, редактируя код игры.
Нейросеть заменяла содержимое файла «game/fen.txt», добавляя черным 500 пешек, что и обеспечило ей победу
Эксперты Palisade Research отметили, что в отличие от других моделей, таких как GPT-4o и Claude 3.5, которые требуют внешнего вмешательства, o1-preview смогла провести взлом самостоятельно.
================
👁 News | 👁 Software | 👁 Hardware
Ориентированная на рассуждения ИИ-модель o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду, чтобы не проиграть шахматному движку Stockfish.
Исследователи сообщили ИИ-модели, что ее противник «силен», что спровоцировало ИИ на манипуляции. В ходе процесса o1 обнаружила, что может выиграть, редактируя код игры.
Нейросеть заменяла содержимое файла «game/fen.txt», добавляя черным 500 пешек, что и обеспечило ей победу
Эксперты Palisade Research отметили, что в отличие от других моделей, таких как GPT-4o и Claude 3.5, которые требуют внешнего вмешательства, o1-preview смогла провести взлом самостоятельно.
================
👁 News | 👁 Software | 👁 Hardware