↩️ ☝🏻DeepSeek представляет новую модель рассуждений, превосходящую o1 от OpenAI Китайск...

IT Boroda · Вчера в 18:40

Чёрный Треугольник:

DeepSeek-V3: Китайская языковая модель обошла Claude 3.5 Sonnet в программировании. Компания DeepSeek, с поддержкой китайского хедж-фонда High-Flyer, анонсировала свою новую языковую модель DeepSeek-V3, обладающую впечатляющими 685 миллиардами параметров.…

DeepSeek представляет новую модель рассуждений, превосходящую o1 от OpenAI

Китайская лаборатория искусственного интеллекта DeepSeek анонсировала свою открытую модель рассуждений DeepSeek-R1, которая, по мнению разработчиков , может конкурировать с моделью o1 от OpenAI в ряде тестов.

Модель доступна на платформе Hugging Face под лицензией MIT для коммерческого использования и демонстрирует лучшие результаты по сравнению с o1 в тестах AIME, MATH-500 и SWE-bench Verified, несмотря на более длительное время поиска решений.

Базовая версия R1 содержит впечатляющие 671 миллиард параметров, а также предлагает облегчённые версии на 1,5 и 70 миллиардов параметров.

Запуск DeepSeek-R1 происходит на фоне ужесточения экспортных правил США в отношении технологий AI, предназначенных для Китая.

Однако у R1 есть недостаток. Будучи китайской моделью, он подвергается жестокой цензуре и его ответы должны «отражать основные социалистические ценности».

Например, R1 не будет отвечать на вопросы о площади Тяньаньмэнь или об автономии Тайваня.
================
👁 News | 👁 Software | 👁 Hardware

Поиск

Новые сообщения в профилях

↩️ ☝🏻DeepSeek представляет новую модель рассуждений, превосходящую o1 от OpenAI Китайск...

IT Boroda

visibility