ChatGPT научился выполнять задачи вместо человека

TechnoLab

visibility
22 Дек 2019
indite.ru
Чат-бот ChatGPT от OpenAI



Стартап OpenAI запустил нового универсального ИИ-агента в ChatGPT, который способен выполнять широкий спектр компьютерных задач от имени пользователя.

ChatGPT can now do work for you using its own computer.

Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ

— OpenAI (@OpenAI) July 17, 2025

Компания утверждает, что он может автоматически управлять календарем пользователя, создавать редактируемые презентации и слайды, а также запускать код.


ChatGPT agent объединяет в себе несколько функций предыдущих агентных решений. В их числе способность Operator выполнять клики по сайтам и возможность Deep Research собирать информацию с десятков сайтов и предоставлять сжатый аналитический отчет.


Взаимодействовать с инструментом можно на естественном языке в ходе диалога с чат-ботом.


Первоначально ИИ-агент доступен для подписчиков Pro, Plus и Team. Для его активации необходимо выбрать «режим агента» (agent mode) в выпадающем меню инструментов ChatGPT.


OpenAI утверждает, что новый ChatGPT agent значительно превосходит другие решения. Он способен задействовать ChatGPT connectors — подключать приложения вроде Gmail и GitHub для поиска необходимой информации и ответа на запросы. Также у него есть доступ к терминалу и возможность использовать API.


Умения цифрового помощника включают планирование и покупку ингредиентов для японского завтрака на четверых, анализ трех конкурентов с последующей подготовкой презентации.

Тесты


Лежащая в основе инструмента модель демонстрирует передовые результаты в ряде бенчмарков, отметили в OpenAI. В Humanity’s Last Exam — сложнейшем тесте, включающем тысячи вопросов по более чем сотне предметов, — ChatGPT agent показывает результат 41,6%. Это примерно в два раза выше показателей o3 и o4-mini.

AD_4nXeTl4x9zfTG2sJh2VmSvknK9KhqDy6_BJUMqvrDr0gj6QKZXFcBvkHQNuVJxpwP4pH1jtA9rveEUQRbhhbIDRdYTL5O07CtFVZVXscEJwq86WYxRzBX05nGiM1peI6iKSPQwI4XLw

Сравнение разных моделей в Humanity’s Last Exam. Источник: OpenAI.

На одном из самых сложных математических анализов FrontierMath нейросеть набрала 27,4%. Предыдущий рекорд принадлежал o4-mini — 6,3%.

Безопасность


Стартап отметил, что при разработке ChatGPT agent особое внимание уделялось вопросам безопасности, поскольку новый продукт обладает расширенными возможностями, которые могут нанести вред в случае попадания в руки злоумышленников.


В отчете модель отнесена к категории «высокая способность» в области биологического и химического оружия. Это означает, что она может усилить уже существующие пути нанесения серьезного вреда. При этом OpenAI подчеркивает, что не имеет прямых доказательств такой угрозы, но применяет превентивный подход и вводит дополнительные меры защиты. Они включают:

  • модуль онлайн-мониторинга — все пользовательские запросы проходят через классификатор, который определяет, связано ли обращение с биологической тематикой. Если да — ответ дополнительно проверяется вторым механизмом на предмет потенциальной угрозы;
  • отключение функции памяти — это сделано для предотвращения утечек данных через атаки с внедрением вредоносных промптов.

Напомним, в июле стало известно, что OpenAI пересмотрела свою систему безопасности для защиты интеллектуальной собственности от корпоративного шпионажа на фоне опасений касательно кражи со стороны китайских конкурентов.


Ранее ChatGPT обучили подключаться к большему количеству внутренних источников и получать контекстную информацию в реальном времени.