Новые сообщения в профилях


🌪️ Лос-Анджелес продолжает гореть. В штате бушуют огненные смерчи.

По последним данным, число погибших достигло 11 человек, более 10 тысяч зданий разрушено, более 180 тысяч человек эвакуированы

Запрещёнка ❗️Подписаться

↩️ ☝🏻DeepSeek представляет новую модель рассуждений, превосходящую o1 от OpenAI Китайск...

IT Boroda

visibility
14 Янв 2020
Чёрный Треугольник:

DeepSeek-V3: Китайская языковая модель обошла Claude 3.5 Sonnet в программировании.🤖 Компания DeepSeek, с поддержкой китайского хедж-фонда High-Flyer, анонсировала свою новую языковую модель DeepSeek-V3, обладающую впечатляющими 685 миллиардами параметров.…

☝🏻DeepSeek представляет новую модель рассуждений, превосходящую o1 от OpenAI

Китайская лаборатория искусственного интеллекта DeepSeek анонсировала свою открытую модель рассуждений DeepSeek-R1, которая, по мнению разработчиков, может конкурировать с моделью o1 от OpenAI в ряде тестов.💡

Модель доступна на платформе Hugging Face под лицензией MIT для коммерческого использования и демонстрирует лучшие результаты по сравнению с o1 в тестах AIME, MATH-500 и SWE-bench Verified, несмотря на более длительное время поиска решений.

Базовая версия R1 содержит впечатляющие 671 миллиард параметров, а также предлагает облегчённые версии на 1,5 и 70 миллиардов параметров.📊

Запуск DeepSeek-R1 происходит на фоне ужесточения экспортных правил США в отношении технологий AI, предназначенных для Китая.

☝🏻Однако у R1 есть недостаток. Будучи китайской моделью, он подвергается жестокой цензуре и его ответы должны «отражать основные социалистические ценности».

Например, R1 не будет отвечать на вопросы о площади Тяньаньмэнь или об автономии Тайваня.
================
👁 News | 👁 Software | 👁 Hardware