Microsoft szkoli nowy model sztucznej inteligencji – na tyle potężny, by konkurować z najważniejszymi LLM na rynku
Microsoft opracowuje nowy duży model językowy (LLM – z ang. Large Language Model) o nazwie kodowej MAI-1, który ma potencjał konkurowania z LLM SI od Google i OpenAI. To pierwszy tak duży LLM opracowywany przez Microsoft, od momentu gdy firma zainwestowała miliardy dolarów w OpenAI w celu uzyskania praw do wdrożenia tej technologii w swoim pakiecie oprogramowania biurowego.
Zgodnie z raportem The Information rozwój MAI-1 jest nadzorowany przez Google DeepMind i współzałożyciela Inflection – Mustafę Suleyman. W marcu 2024 roku firma Microsoft przejęła kilku pracowników Inflection w ramach umowy o wartości 650 milionów dolarów.
Według raportu opublikowanego 6 maja model MAI-1 będzie miał około 500 miliardów parametrów, co plasuje go między rzekomym bilionem parametrów GPT-4 OpenAI a 70 miliardami parametrów modelu Meta Llama 3 AI. Oczekuje się również, że będzie „znacznie większy” i droższy niż którykolwiek z wcześniejszych mniejszych modeli SI open-source Microsoftu (Phi-3 i WizardLM-2), ponieważ będzie wymagał większej mocy obliczeniowej i danych szkoleniowych.
Chociaż MAI-1 może wykorzystywać techniki i dane szkoleniowe z Inflection, stanowi oddzielne rozwiązanie od wszelkich modeli lub technologii wyprodukowanych przez OpenAI lub Inflection. Według pracowników Microsoftu zaznajomionych z projektem MAI-1 to całkowicie nowy LLM opracowany wewnętrznie przez firmę.
Microsoft jeszcze nie ogłosił, do czego tak naprawdę ma służyć MAI-1, a dokładne zastosowanie modelu będzie zależało od jego wydajności. W międzyczasie firma przydzieliła duży klaster serwerów wyposażonych w GPU od Nvidii i wykorzystujących ogromne ilości danych z różnych źródeł, by usprawnić model.
Według raportów, w zależności od postępów, firma może zaprezentować MAI-1 na konferencji programistycznej Build jeszcze w tym miesiącu, ale nie zostało to potwierdzone.
Zostaw komentarz
Anuluj odpowiedź