Alibaba Wypuszcza Nowy Model AI Qwen i Twierdzi, że Przewyższa DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba Wypuszcza Nowy Model AI Qwen i Twierdzi, że Przewyższa DeepSeek-V3

Przeczytasz w: 2 min

Chiński gigant, Alibaba, wypuścił najnowszą wersję swojego flagowego modelu AI, Qwen, w tę środę. Firma twierdzi, że może on działać lepiej niż popularny DeepSeek-V3.

W pośpiechu? Oto szybkie fakty!

  • Alibaba opublikowała swój najnowszy model wnioskowania Qwen 2.5-Max w ostatnią środę.
  • Chiński gigant twierdzi, że przewyższa popularne modele, takie jak DeepSeek-V3, GPT-4o i Llama-3.1-405B.
  • Firma uruchomiła również Qwen2.5-VL w tym tygodniu, model AI zdolny do przetwarzania obrazów i działania jako agent AI, wykorzystując komputery i telefony komórkowe do wykonywania zadań.

Według Reuters, Alibaba wprowadziło nowy model Qwen 2.5-Max, jak nazwano nowy model rozumowania, właśnie podczas świąt Nowego Roku Księżycowego w Chinach, aby dołączyć do ogromnego rozwoju AI ostatnich dni i zwiększyć konkurencję krajową.

W poniedziałek, DeepSeek osiągnął pierwsze miejsce w App Store firmy Apple w Stanach Zjednoczonych, wyprzedzając ChatGPT, co wywołało niepokój wśród innych firm z branży AI i zaniepokoiło inwestorów—akcje Nvidia spadły o 17% w ciągu jednego dnia.

Teraz Alibaba ogłosiło najnowsze wersje swojego modelu Qwen—wypuściło 100 modeli AI na otwartym kodzie dla pakietu Qwen we wrześniu ubiegłego roku—obiecując lepsze wyniki niż popularne modele na czele.

„Qwen 2.5-Max przewyższa (…) niemalże na całej linii GPT-4o, DeepSeek-V3 i Llama-3.1-405B” – napisała firma na swoim oficjalnym koncie WeChat.

Nowy model rozumowania Qwen 2.5-Max jest dostępny za pośrednictwem chmury Alibaba, a użytkownicy mogą również przetestować model na jego stronie czatu.

„Rozwijamy Qwen2.5-Max, duży model MoE, który został wstępnie trenowany na ponad 20 bilionach tokenów, a następnie dodatkowo trenowany przy użyciu starannie dobranych metodologii Supervised Fine-Tuning (SFT) i Reinforcement Learning from Human Feedback (RLHF)” – napisał Zespół Qwen na Githubie.

Chiński gigant w poniedziałek wydał również Qwen2.5-VL, serię multimodalnych modeli AI, które mogą również przetwarzać obrazy i uzyskiwać dostęp do telefonów komórkowych i komputerów, aby wykonywać zadania. OpenAI ogłosiło podobną funkcję, Operator, pozwalającą ChatGPT na autonomiczne wykonywanie zadań poprzez przejęcie kontroli nad komputerem użytkownika.

Według zespołu Alibaba, wszystkie modele Qwen przewyższają podobne wersje od OpenAI, Microsoft, Google, Meta i DeepSeek.

Spodobał Ci się ten artykuł? Oceń go!
Był okropny Nie podobał mi się Był w porządku Był całkiem dobry! Był super!

Cieszymy się, że doceniasz to, co robimy!

Cenimy Twoją opinię. Czy możemy liczyć na ocenę na Trustpilot? Zajmie Ci to tylko chwilę. Będziemy zobowiązani. Dziękujemy za wsparcie!

Oceń nas na Trustpilot
0 Na podstawie głosów 0 użytkowników
Tytuł
Komentarz
Dziękujemy za Twoją opinię
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Zostaw komentarz

Loader
Loader Pokaż więcej...