ChatGPT научился выполнять задачи вместо человека

TechnoLab · Вчера в 10:48

Стартап OpenAI запустил нового универсального ИИ-агента в ChatGPT, который способен выполнять широкий спектр компьютерных задач от имени пользователя.

ChatGPT can now do work for you using its own computer.

Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ

— OpenAI (@OpenAI) July 17, 2025

Компания утверждает, что он может автоматически управлять календарем пользователя, создавать редактируемые презентации и слайды, а также запускать код.

ChatGPT agent объединяет в себе несколько функций предыдущих агентных решений. В их числе способность Operator выполнять клики по сайтам и возможность Deep Research собирать информацию с десятков сайтов и предоставлять сжатый аналитический отчет.

Взаимодействовать с инструментом можно на естественном языке в ходе диалога с чат-ботом.

Первоначально ИИ-агент доступен для подписчиков Pro, Plus и Team. Для его активации необходимо выбрать «режим агента» (agent mode) в выпадающем меню инструментов ChatGPT.

OpenAI утверждает, что новый ChatGPT agent значительно превосходит другие решения. Он способен задействовать ChatGPT connectors — подключать приложения вроде Gmail и GitHub для поиска необходимой информации и ответа на запросы. Также у него есть доступ к терминалу и возможность использовать API.

Умения цифрового помощника включают планирование и покупку ингредиентов для японского завтрака на четверых, анализ трех конкурентов с последующей подготовкой презентации.

Тесты

Лежащая в основе инструмента модель демонстрирует передовые результаты в ряде бенчмарков, отметили в OpenAI. В Humanity’s Last Exam — сложнейшем тесте, включающем тысячи вопросов по более чем сотне предметов, — ChatGPT agent показывает результат 41,6%. Это примерно в два раза выше показателей o3 и o4-mini.

AD_4nXeTl4x9zfTG2sJh2VmSvknK9KhqDy6_BJUMqvrDr0gj6QKZXFcBvkHQNuVJxpwP4pH1jtA9rveEUQRbhhbIDRdYTL5O07CtFVZVXscEJwq86WYxRzBX05nGiM1peI6iKSPQwI4XLw

Сравнение разных моделей в Humanity’s Last Exam. Источник: OpenAI.

На одном из самых сложных математических анализов FrontierMath нейросеть набрала 27,4%. Предыдущий рекорд принадлежал o4-mini — 6,3%.

Безопасность

Стартап отметил, что при разработке ChatGPT agent особое внимание уделялось вопросам безопасности, поскольку новый продукт обладает расширенными возможностями, которые могут нанести вред в случае попадания в руки злоумышленников.

В отчете модель отнесена к категории «высокая способность» в области биологического и химического оружия. Это означает, что она может усилить уже существующие пути нанесения серьезного вреда. При этом OpenAI подчеркивает, что не имеет прямых доказательств такой угрозы, но применяет превентивный подход и вводит дополнительные меры защиты. Они включают:

модуль онлайн-мониторинга — все пользовательские запросы проходят через классификатор, который определяет, связано ли обращение с биологической тематикой. Если да — ответ дополнительно проверяется вторым механизмом на предмет потенциальной угрозы;
отключение функции памяти — это сделано для предотвращения утечек данных через атаки с внедрением вредоносных промптов.

Напомним, в июле стало известно, что OpenAI пересмотрела свою систему безопасности для защиты интеллектуальной собственности от корпоративного шпионажа на фоне опасений касательно кражи со стороны китайских конкурентов.

Ранее ChatGPT обучили подключаться к большему количеству внутренних источников и получать контекстную информацию в реальном времени.

Поиск

Новые сообщения в профилях

ChatGPT научился выполнять задачи вместо человека

TechnoLab

visibility

Тесты

Безопасность

Новые сообщения в профилях

ChatGPT научился выполнять задачи вместо человека

TechnoLab

visibility

Тесты​

Безопасность​

Тесты

Безопасность