DeepSeek prezentuje model 3V, najmocniejsze dotychczas open-source AI
Chińska firma zajmująca się sztuczną inteligencją, DeepSeek, wypuściła na rynek swój najnowszy otwartoźródłowy model, DeepSeek-V3, w tym tygodniu. Startup twierdzi, że jego nowy, duży model zawiera 671B parametrów i może działać lepiej niż nowoczesne modele, takie jak GPT-4o od OpenAI oraz Claude-Sonnet-3.5 od Anthropic.
W pośpiechu? Oto szybkie fakty!
- DeepSeek wydało swój najnowszy model AI DeepSeek-V3, twierdząc, że działa lepiej niż GPT 4o i Claude-Sonnet-3.5.
- Chińska firma AI wyjaśniła, że nowy model zawiera 671B parametrów i jest trzy razy szybszy niż poprzedni model.
- DeepSeek-V3 jest teraz najpotężniejszym otwartoźródłowym modelem AI na rynku
Użytkownicy mogą interaktywnie korzystać z modelu za pośrednictwem oficjalnej strony internetowej, czytać artykuł firmy i uzyskać dostęp do modelu za pośrednictwem Hugging Face. DeepSeek poinformował, że ten nowy model jest trzy razy szybszy niż poprzednia wersja, która została wydana w listopadzie, i ma zwiększone możliwości oraz kompatybilność z API.
🚀 Przedstawiamy DeepSeek-V3!
Największy do tej pory skok naprzód:
⚡ 60 tokenów/sekundę (3x szybciej niż V2!)
💪 Ulepszone możliwości
🛠 Kompatybilność API zachowana
🌍 W pełni otwarte modele i publikacje🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 26 grudnia 2024
„Prezentujemy DeepSeek-V3, mocny model językowy Mixture-of-Experts (MoE) z 671B całkowitej liczby parametrów, z których 37B jest aktywowanych dla każdego tokena” – napisała firma na GitHubie. „Wszechstronne oceny pokazują, że DeepSeek-V3 przewyższa inne modele open-source i osiąga wydajność porównywalną z wiodącymi modelami closed-source.”
Wielu użytkowników, organizacji i firm pogratulowało DeepSeek za jej osiągnięcia. „Gratulacje z okazji wybitnej premiery!” napisał Hugging Face na X, „Punkty kontrolne modelu i szczegółowy raport – naprawdę, to jakby już były Święta!”
Andrej Karpathy—były badacz w OpenAI i szef AI w Tesla—także podzielił się kilkoma przemyśleniami. „DeepSeek (chińska firma AI) dziś udowadnia, że to proste z otwartą publikacją wag modelu LLM na poziomie pionierskim, trenowanym przy śmiesznym budżecie (2048 GPU przez 2 miesiące, 6 milionów dolarów).”
DeepSeek-V3 jest obecnie jednym z najmocniejszych otwartoźródłowych modeli AI na rynku, a jego płatne API nadal należy do najbardziej przystępnych cenowo na rynku.
Zostaw komentarz
Anuluj odpowiedź