Microsoft szkoli nowy model sztucznej inteligencji – na tyle potężny, by konkurować z najważniejszymi LLM na rynku

Microsoft szkoli nowy model sztucznej inteligencji – na tyle potężny, by konkurować z najważniejszymi LLM na rynku

Przeczytasz w: 2 min

  • Shipra Sanganeria

    Autor: Shipra Sanganeria Cybersecurity & Tech Writer

  • Zespół ds. lokalizacji i tłumaczenia

    Tłumaczenie: Zespół ds. lokalizacji i tłumaczenia Usługi związane z tłumaczeniem i lokalizacją treści

Microsoft opracowuje nowy duży model językowy (LLM – z ang. Large Language Model) o nazwie kodowej MAI-1, który ma potencjał konkurowania z LLM SI od Google i OpenAI. To pierwszy tak duży LLM opracowywany przez Microsoft, od momentu gdy firma zainwestowała miliardy dolarów w OpenAI w celu uzyskania praw do wdrożenia tej technologii w swoim pakiecie oprogramowania biurowego.

Zgodnie z raportem The Information rozwój MAI-1 jest nadzorowany przez Google DeepMind i współzałożyciela Inflection – Mustafę Suleyman. W marcu 2024 roku firma Microsoft przejęła kilku pracowników Inflection w ramach umowy o wartości 650 milionów dolarów.

Według raportu opublikowanego 6 maja model MAI-1 będzie miał około 500 miliardów parametrów, co plasuje go między rzekomym bilionem parametrów GPT-4 OpenAI a 70 miliardami parametrów modelu Meta Llama 3 AI. Oczekuje się również, że będzie „znacznie większy” i droższy niż którykolwiek z wcześniejszych mniejszych modeli SI open-source Microsoftu (Phi-3 i WizardLM-2), ponieważ będzie wymagał większej mocy obliczeniowej i danych szkoleniowych.

Chociaż MAI-1 może wykorzystywać techniki i dane szkoleniowe z Inflection, stanowi oddzielne rozwiązanie od wszelkich modeli lub technologii wyprodukowanych przez OpenAI lub Inflection. Według pracowników Microsoftu zaznajomionych z projektem MAI-1 to całkowicie nowy LLM opracowany wewnętrznie przez firmę.

Microsoft jeszcze nie ogłosił, do czego tak naprawdę ma służyć MAI-1, a dokładne zastosowanie modelu będzie zależało od jego wydajności. W międzyczasie firma przydzieliła duży klaster serwerów wyposażonych w GPU od Nvidii i wykorzystujących ogromne ilości danych z różnych źródeł, by usprawnić model.

Według raportów, w zależności od postępów, firma może zaprezentować MAI-1 na konferencji programistycznej Build jeszcze w tym miesiącu, ale nie zostało to potwierdzone.

Spodobał Ci się ten artykuł? Oceń go!
Był okropny Nie podobał mi się Był w porządku Był całkiem dobry! Był super!
0 Na podstawie głosów 0 użytkowników
Tytuł
Komentarz
Dziękujemy za Twoją opinię
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Zostaw komentarz

Pokaż więcej...