DeepSeek prezentuje model 3V, najmocniejsze dotychczas open-source AI

Photo by Mimi Thian on Unsplash

DeepSeek prezentuje model 3V, najmocniejsze dotychczas open-source AI

Przeczytasz w: 2 min

Chińska firma zajmująca się sztuczną inteligencją, DeepSeek, wypuściła na rynek swój najnowszy otwartoźródłowy model, DeepSeek-V3, w tym tygodniu. Startup twierdzi, że jego nowy, duży model zawiera 671B parametrów i może działać lepiej niż nowoczesne modele, takie jak GPT-4o od OpenAI oraz Claude-Sonnet-3.5 od Anthropic.

W pośpiechu? Oto szybkie fakty!

  • DeepSeek wydało swój najnowszy model AI DeepSeek-V3, twierdząc, że działa lepiej niż GPT 4o i Claude-Sonnet-3.5.
  • Chińska firma AI wyjaśniła, że nowy model zawiera 671B parametrów i jest trzy razy szybszy niż poprzedni model.
  • DeepSeek-V3 jest teraz najpotężniejszym otwartoźródłowym modelem AI na rynku

Użytkownicy mogą interaktywnie korzystać z modelu za pośrednictwem oficjalnej strony internetowej, czytać artykuł firmy i uzyskać dostęp do modelu za pośrednictwem Hugging Face. DeepSeek poinformował, że ten nowy model jest trzy razy szybszy niż poprzednia wersja, która została wydana w listopadzie, i ma zwiększone możliwości oraz kompatybilność z API.

„Prezentujemy DeepSeek-V3, mocny model językowy Mixture-of-Experts (MoE) z 671B całkowitej liczby parametrów, z których 37B jest aktywowanych dla każdego tokena” – napisała firma na GitHubie. „Wszechstronne oceny pokazują, że DeepSeek-V3 przewyższa inne modele open-source i osiąga wydajność porównywalną z wiodącymi modelami closed-source.”

Wielu użytkowników, organizacji i firm pogratulowało DeepSeek za jej osiągnięcia. „Gratulacje z okazji wybitnej premiery!” napisał Hugging Face na X, „Punkty kontrolne modelu i szczegółowy raport – naprawdę, to jakby już były Święta!”

Andrej Karpathy—były badacz w OpenAI i szef AI w Tesla—także podzielił się kilkoma przemyśleniami. „DeepSeek (chińska firma AI) dziś udowadnia, że to proste z otwartą publikacją wag modelu LLM na poziomie pionierskim, trenowanym przy śmiesznym budżecie (2048 GPU przez 2 miesiące, 6 milionów dolarów).”

DeepSeek-V3 jest obecnie jednym z najmocniejszych otwartoźródłowych modeli AI na rynku, a jego płatne API nadal należy do najbardziej przystępnych cenowo na rynku.

Spodobał Ci się ten artykuł? Oceń go!
Był okropny Nie podobał mi się Był w porządku Był całkiem dobry! Był super!

Cieszymy się, że doceniasz to, co robimy!

Cenimy Twoją opinię. Czy możemy liczyć na ocenę na Trustpilot? Zajmie Ci to tylko chwilę. Będziemy zobowiązani. Dziękujemy za wsparcie!

Oceń nas na Trustpilot
0 Na podstawie głosów 0 użytkowników
Tytuł
Komentarz
Dziękujemy za Twoją opinię
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Zostaw komentarz

Loader
Loader Pokaż więcej...