Photo by Mimi Thian on Unsplash

DeepSeek prezentuje model 3V, najmocniejsze dotychczas open-source AI

Przeczytasz w: 2 min

Ostatnia aktualizacja: Apr 3, 2025

Autor: Andrea Miliani Ekspert od wiadomości technologicznych
Tłumaczenie Zespół ds. lokalizacji i tłumaczenia Usługi związane z tłumaczeniem i lokalizacją treści

Chińska firma zajmująca się sztuczną inteligencją, DeepSeek, wypuściła na rynek swój najnowszy otwartoźródłowy model, DeepSeek-V3, w tym tygodniu. Startup twierdzi, że jego nowy, duży model zawiera 671B parametrów i może działać lepiej niż nowoczesne modele, takie jak GPT-4o od OpenAI oraz Claude-Sonnet-3.5 od Anthropic.

W pośpiechu? Oto szybkie fakty!

DeepSeek wydało swój najnowszy model AI DeepSeek-V3, twierdząc, że działa lepiej niż GPT 4o i Claude-Sonnet-3.5.
Chińska firma AI wyjaśniła, że nowy model zawiera 671B parametrów i jest trzy razy szybszy niż poprzedni model.
DeepSeek-V3 jest teraz najpotężniejszym otwartoźródłowym modelem AI na rynku

Użytkownicy mogą interaktywnie korzystać z modelu za pośrednictwem oficjalnej strony internetowej, czytać artykuł firmy i uzyskać dostęp do modelu za pośrednictwem Hugging Face. DeepSeek poinformował, że ten nowy model jest trzy razy szybszy niż poprzednia wersja, która została wydana w listopadzie, i ma zwiększone możliwości oraz kompatybilność z API.

🚀 Przedstawiamy DeepSeek-V3!

Największy do tej pory skok naprzód:
⚡ 60 tokenów/sekundę (3x szybciej niż V2!)
💪 Ulepszone możliwości
🛠 Kompatybilność API zachowana
🌍 W pełni otwarte modele i publikacje

🐋 1/n pic.twitter.com/p1dV9gJ2Sd

— DeepSeek (@deepseek_ai) 26 grudnia 2024

„Prezentujemy DeepSeek-V3, mocny model językowy Mixture-of-Experts (MoE) z 671B całkowitej liczby parametrów, z których 37B jest aktywowanych dla każdego tokena” – napisała firma na GitHubie. „Wszechstronne oceny pokazują, że DeepSeek-V3 przewyższa inne modele open-source i osiąga wydajność porównywalną z wiodącymi modelami closed-source.”

Wielu użytkowników, organizacji i firm pogratulowało DeepSeek za jej osiągnięcia. „Gratulacje z okazji wybitnej premiery!” napisał Hugging Face na X, „Punkty kontrolne modelu i szczegółowy raport – naprawdę, to jakby już były Święta!”

Andrej Karpathy—były badacz w OpenAI i szef AI w Tesla—także podzielił się kilkoma przemyśleniami. „DeepSeek (chińska firma AI) dziś udowadnia, że to proste z otwartą publikacją wag modelu LLM na poziomie pionierskim, trenowanym przy śmiesznym budżecie (2048 GPU przez 2 miesiące, 6 milionów dolarów).”

DeepSeek-V3 jest obecnie jednym z najmocniejszych otwartoźródłowych modeli AI na rynku, a jego płatne API nadal należy do najbardziej przystępnych cenowo na rynku.

DeepSeek prezentuje model 3V, najmocniejsze dotychczas open-source AI

Cieszymy się, że doceniasz to, co robimy!

Zostaw komentarz