Alibaba представив свою модель нейромережі

Великий китайський маркетплейс Alibaba представив свою нову модель нейромережі Qwen2.5-Max.

Про це повідомили у компанії.

За словами розробників, модель перевершує ChatGPT та DeepSeek за багатьма показниками, або, як кажуть у фахівці у сфері штучного інтелекту, бенчмаркам: Arena-Hard, LiveBench, LiveCodeBench та GPQA-Diamond. Також новинка демонструє близькі до конкурентів результати в інших бенчмарках, наприклад, MMLU-Pro.

Зазначається, що Qwen2.5-Max є великомасштабною моделлю, яка була попередньо навчена більш ніж на 20 трильйонах токенів.

При цьому нейромережа має доступ до інтернету та може працювати з актуальними даними. Також вона вміє писати код, генерувати фото та відео, хоча остання функція поки що недоступна.

Передбачається, що модель викладали поспіхом, щоб встигнути потрапити в інформаційну хвилю про ІІ-сенсації, приурочену до китайського нового року. Тому спочатку у неї можуть виявлятися недоліки.

Порівняння з DeepSeek та з LLaMA3.1

Порівняння з GPT-4o та Claude Sonnet-3.5

Раніше американська компанія OpenAI, яка розробила чат-бот із генеративним штучним інтелектом ChatGPT, звинуватила китайського конкурента DeepSeek у крадіжці їхніх даних.

Також у ЗМІ писали про те, що китайська модель штучного інтелекту від DeepSeek вперше обійшла ChatGPT, ставши рейтинговим безкоштовним додатком, доступним в App Store.

Нещодавно ми докладно розбирали, що означає поява китайської нейромережі DeepSeek.

Ще одна ШІ-новинка з Китаю. Маркетплейс Alibaba представив модель нейромережі, що перевершує аналоги