Photo by John Schnobrich on Unsplash

Alibaba Wypuszcza Nowy Model AI Qwen i Twierdzi, że Przewyższa DeepSeek-V3

Przeczytasz w: 2 min

Ostatnia aktualizacja: Jan 31, 2025

Autor: Andrea Miliani Ekspert od wiadomości technologicznych
Tłumaczenie Zespół ds. lokalizacji i tłumaczenia Usługi związane z tłumaczeniem i lokalizacją treści

Chiński gigant, Alibaba, wypuścił najnowszą wersję swojego flagowego modelu AI, Qwen, w tę środę. Firma twierdzi, że może on działać lepiej niż popularny DeepSeek-V3.

W pośpiechu? Oto szybkie fakty!

Alibaba opublikowała swój najnowszy model wnioskowania Qwen 2.5-Max w ostatnią środę.
Chiński gigant twierdzi, że przewyższa popularne modele, takie jak DeepSeek-V3, GPT-4o i Llama-3.1-405B.
Firma uruchomiła również Qwen2.5-VL w tym tygodniu, model AI zdolny do przetwarzania obrazów i działania jako agent AI, wykorzystując komputery i telefony komórkowe do wykonywania zadań.

Według Reuters, Alibaba wprowadziło nowy model Qwen 2.5-Max, jak nazwano nowy model rozumowania, właśnie podczas świąt Nowego Roku Księżycowego w Chinach, aby dołączyć do ogromnego rozwoju AI ostatnich dni i zwiększyć konkurencję krajową.

W poniedziałek, DeepSeek osiągnął pierwsze miejsce w App Store firmy Apple w Stanach Zjednoczonych, wyprzedzając ChatGPT, co wywołało niepokój wśród innych firm z branży AI i zaniepokoiło inwestorów—akcje Nvidia spadły o 17% w ciągu jednego dnia.

Teraz Alibaba ogłosiło najnowsze wersje swojego modelu Qwen—wypuściło 100 modeli AI na otwartym kodzie dla pakietu Qwen we wrześniu ubiegłego roku—obiecując lepsze wyniki niż popularne modele na czele.

„Qwen 2.5-Max przewyższa (…) niemalże na całej linii GPT-4o, DeepSeek-V3 i Llama-3.1-405B” – napisała firma na swoim oficjalnym koncie WeChat.

Nowy model rozumowania Qwen 2.5-Max jest dostępny za pośrednictwem chmury Alibaba, a użytkownicy mogą również przetestować model na jego stronie czatu.

„Rozwijamy Qwen2.5-Max, duży model MoE, który został wstępnie trenowany na ponad 20 bilionach tokenów, a następnie dodatkowo trenowany przy użyciu starannie dobranych metodologii Supervised Fine-Tuning (SFT) i Reinforcement Learning from Human Feedback (RLHF)” – napisał Zespół Qwen na Githubie.

Chiński gigant w poniedziałek wydał również Qwen2.5-VL, serię multimodalnych modeli AI, które mogą również przetwarzać obrazy i uzyskiwać dostęp do telefonów komórkowych i komputerów, aby wykonywać zadania. OpenAI ogłosiło podobną funkcję, Operator, pozwalającą ChatGPT na autonomiczne wykonywanie zadań poprzez przejęcie kontroli nad komputerem użytkownika.

Według zespołu Alibaba, wszystkie modele Qwen przewyższają podobne wersje od OpenAI, Microsoft, Google, Meta i DeepSeek.

Alibaba Wypuszcza Nowy Model AI Qwen i Twierdzi, że Przewyższa DeepSeek-V3

Cieszymy się, że doceniasz to, co robimy!

Zostaw komentarz