Нейросеть DeepSeek V3 взорвала бенчмарки Еще один «ИИ на базе миллиардов параметров» поставил на уши западный мир
Еще один «ИИ на базе миллиардов параметров» поставил на уши западный мир 💥. Нейронка DeepSeek V3 из Китая собралась подвинуть OpenAI и Anthropic 🤖. Ну и всем показать, что такое китайский искусственный интеллект.
Вложили в нее всего ничего – $5,5 миллионов 💸. К примеру, на ChatGPT-4 ушло примерно $100 млн. Это только на обучение. В общем, китайский стартап DeepSeek за копейки разработал и выкатил нейросеть, которая очень достойно выглядит в компании флагманов.
По данным внутренних тестов DeepSeek V3 обходит по ряду параметров передовые модели с открытым (open-source) и закрытым исходным кодом – Llama3.1, Claude-3.5 и GPT-4o 📊. Другой вопрос, насколько этим тестам можно доверять. Как часто (почти всегда) бывает с релизами, их любят красиво «упаковывать». Для этого всего-то нужно дать нейронке специально подобранные задачи. Стандартная практика для показательных тестов. Но пока что имеем, тем и пользуемся. ДАЛЕЕ…