Чёрный Треугольник:
DeepSeek-V3: Китайская языковая модель обошла Claude 3.5 Sonnet в программировании. Компания DeepSeek, с поддержкой китайского хедж-фонда High-Flyer, анонсировала свою новую языковую модель DeepSeek-V3, обладающую впечатляющими 685 миллиардами параметров.…
DeepSeek представляет новую модель рассуждений, превосходящую o1 от OpenAI
Китайская лаборатория искусственного интеллекта DeepSeek анонсировала свою открытую модель рассуждений DeepSeek-R1, которая, по мнению разработчиков, может конкурировать с моделью o1 от OpenAI в ряде тестов.
Модель доступна на платформе Hugging Face под лицензией MIT для коммерческого использования и демонстрирует лучшие результаты по сравнению с o1 в тестах AIME, MATH-500 и SWE-bench Verified, несмотря на более длительное время поиска решений.
Базовая версия R1 содержит впечатляющие 671 миллиард параметров, а также предлагает облегчённые версии на 1,5 и 70 миллиардов параметров.
Запуск DeepSeek-R1 происходит на фоне ужесточения экспортных правил США в отношении технологий AI, предназначенных для Китая.
Однако у R1 есть недостаток. Будучи китайской моделью, он подвергается жестокой цензуре и его ответы должны «отражать основные социалистические ценности».
Например, R1 не будет отвечать на вопросы о площади Тяньаньмэнь или об автономии Тайваня.
================
👁 News | 👁 Software | 👁 Hardware