Home • Нейросети • Статьи • Нейросеть DeepSeek V3 взорвала бенчмарки

Нейросеть DeepSeek V3 взорвала бенчмарки Еще один «ИИ на базе миллиардов параметров» поставил на уши западный мир

📝 Пост № 199 от 25 января 2025 | В категории Нейросети, Статьи | Комментариев нет

deep Еще один «ИИ на базе миллиардов параметров» поставил на уши западный мир 💥. Нейронка DeepSeek V3 из Китая собралась подвинуть OpenAI и Anthropic 🤖. Ну и всем показать, что такое китайский искусственный интеллект.

Вложили в нее всего ничего – $5,5 миллионов 💸. К примеру, на ChatGPT-4 ушло примерно $100 млн. Это только на обучение. В общем, китайский стартап DeepSeek за копейки разработал и выкатил нейросеть, которая очень достойно выглядит в компании флагманов.

По данным внутренних тестов DeepSeek V3 обходит по ряду параметров передовые модели с открытым (open-source) и закрытым исходным кодом – Llama3.1, Claude-3.5 и GPT-4o 📊. Другой вопрос, насколько этим тестам можно доверять. Как часто (почти всегда) бывает с релизами, их любят красиво «упаковывать». Для этого всего-то нужно дать нейронке специально подобранные задачи. Стандартная практика для показательных тестов. Но пока что имеем, тем и пользуемся.

Эксперты назвали DeepSeek V3 «технологическим прорывом» по ряду причин. Заявленные возможности сопоставимы с флагманскими моделями рынка. DeepSeek V3 генерирует тексты, пишет код, переводит, анализирует. При этом нейросеть опенсорсная, что сразу сто плюсов в карму 🙌.

DeepSeek V3 с 671 миллиардами параметров и 14,8 триллионами токенов опережает многих по масштабу 📈. Это внушительная архитектура, особенно если сравнивать с GPT-4. В техническом отчете компания OpenAI воздержалась от указания точных данных. Ходят слухи, что GPT-4 может содержать от 500 миллиардов до 1,76 триллиона параметров. Это значит, что DeepSeek, как минимум, конкурентоспособная 💪. Ох, не зря OpenAI предложила технарям всех стран объединяться против Китая. Понимает угрозу.

Масштаб – не гарантия качества. Важно, как модель применяет ресурсы в реальных задачах. Благодаря открытому исходному коду у разработчиков есть возможность не только проверить модель, но и адаптировать ее под себя. И сразу отметим первый из недостатков. DeepSeek V3 – «тяжеловес». 671 миллиард параметров – это серьезно. Поставить, обучить и обслуживать такой масштаб – удовольствие не из легких и не из дешевых.

Но для простых пользователей она работает очень даже н плохо и… бесплатно! Вот пример, который я реализовал буквально за 48 секунд! Написал короткое задание-промт, в котором попросил нейронку создать мне для сайта простой калькулятор объёма помещения и… получил готовый скрипт с инструкцией! И все это на русском, без знаний html верстки, всего лишь за 48 секунд!

Вот пример:

Но, несмотря на все преимущества в скорости и прозорливости нейронки, всё-таки, при публикации на сайте нужно адаптировать скрипты под свой дизайн. Но это по усмотрению… можно и вставлять «сырой» вариант, созданный нейронкой. Кроме кодинга, этот чат может создавать кучу полезных «прибамбасов».

— Модель имеет открытый исходный код: любой желающий может запустить её на своём оборудовании (но не на персональном компьютере, конечно).
— Несмотря на происхождение, DeepSeek-V3 отлично понимает и английский, и русский языки.
— В ряде бенчмарков новинка обходит и GPT-4o от OpenAI, и Claude-3.5 Sonnet от Anthropic, в том числе в тестах математических способностей и задачах по программированию.
— Высокая скорость генерации — ответы появляются заметно быстрее, чем в ChatGPT.
— Доступ к чат-боту полностью бесплатный.
— Чат-бот умеет выходить в интернет — можно заменить классический поиск в Google или «Яндексе».

DeepSeek спокойно принимает пользователей с российскими IP-адресами. Приложения тоже доступны в сторах без региональных ограничений. Попробуйте этот чат и вы будете приятно удивлены!

Удачи и до новых встреч!
С уважением, MasterPRO