Alibaba випустила нову модель штучного інтелекту Qwen 2.5, що має перевершити DeepSeek-V3

2 хвилин читання

Китайська технологічна компанія Alibaba 29 січня анонсувала запуск нової моделі штучного інтелекту Qwen 2.5, що, за її словами, перевершила популярну модель DeepSeek-V3, GPT-4o та Llama-3.1-405B, пише Reuters. 

Випуск моделі DeepSeek-V3 викликало падіння акцій в Кремнієвій долині. Це стимулювало зростання конкуренції серед китайських технологічних гігантів.

«Qwen 2.5-Max перевершує GPT-4o, DeepSeek-V3 та Llama-3.1-405B майже по всіх параметрах»
Оголошення хмарного підрозділу Alibaba в офіційному акаунті WeChat

Через два дні після випуску DeepSeek-R1 ByteDance випустив оновлення своєї флагманської моделі штучного інтелекту, що, як стверджує компанія, перевершила підтримуваний Microsoft OpenAI o1 в AIME, етарному тесті, що вимірює, наскільки добре моделі ШІ розуміють і реагують на складні інструкції.

Читайте також: Сполучені Штати Америки додали низку провідних китайських технологічних компаній до переліку фірм, які, за оцінкою Пентагону, можуть бути пов’язані з китайськими військовими структурами, пише Reuters.

Тож китайські техгіганти, включаючи Alibaba, Baidu та Tencent, також були змушені знизити ціни на свої моделі, щоб залишатися конкурентоспроможними в умовах бурхливого розвитку ШІ в країні. DeepSeek, однак, виступає проти цінових війн, підкреслюючи, що їхньою головною метою є досягнення штучного загального інтелекту (AGI), що перевершить людину у найцінніших економічних завданнях.