Великий китайський маркетплейс Alibaba представив свою нову модель нейромережі Qwen2.5-Max.
Про це повідомили у компанії.
За словами розробників, модель перевершує ChatGPT та DeepSeek за багатьма показниками, або, як кажуть у фахівці у сфері штучного інтелекту, бенчмаркам: Arena-Hard, LiveBench, LiveCodeBench та GPQA-Diamond. Також новинка демонструє близькі до конкурентів результати в інших бенчмарках, наприклад, MMLU-Pro.
Зазначається, що Qwen2.5-Max є великомасштабною моделлю, яка була попередньо навчена більш ніж на 20 трильйонах токенів.
При цьому нейромережа має доступ до інтернету та може працювати з актуальними даними. Також вона вміє писати код, генерувати фото та відео, хоча остання функція поки що недоступна.
Передбачається, що модель викладали поспіхом, щоб встигнути потрапити в інформаційну хвилю про ІІ-сенсації, приурочену до китайського нового року. Тому спочатку у неї можуть виявлятися недоліки.
Порівняння з DeepSeek та з LLaMA3.1
Порівняння з GPT-4o та Claude Sonnet-3.5
Раніше американська компанія OpenAI, яка розробила чат-бот із генеративним штучним інтелектом ChatGPT, звинуватила китайського конкурента DeepSeek у крадіжці їхніх даних.
Також у ЗМІ писали про те, що китайська модель штучного інтелекту від DeepSeek вперше обійшла ChatGPT, ставши рейтинговим безкоштовним додатком, доступним в App Store.
Нещодавно ми докладно розбирали, що означає поява китайської нейромережі DeepSeek.