Image by Matheus Bertelli, from Pexels

AI DeepSeek Nauczył Się Myśleć Samodzielnie

Przeczytasz w: 2 min

Ostatnia aktualizacja: Apr 8, 2025

Autor: Kiara Fabbri Dziennikarka multimedialna
Tłumaczenie Zespół ds. lokalizacji i tłumaczenia Usługi związane z tłumaczeniem i lokalizacją treści

Chiński startup DeepSeek, we współpracy z Uniwersytetem Tsinghua, twierdzi, że opracował sprytniejszą metodę, która pomaga modelom sztucznej inteligencji myśleć lepiej i szybciej, bez potrzeby korzystania z ogromnych komputerów czy drogich zasobów.

W pośpiechu? Oto najważniejsze fakty:

DeepSeek stworzyło samo-doskonalącą się sztuczną inteligencję przy użyciu Self-Principled Critique Tuning (SPCT).
SPCT uczy sztuczną inteligencję oceniać swoją własną pracę przy użyciu samodzielnie generowanych reguł.
Metoda zwiększa wydajność bez konieczności używania ogromnej mocy obliczeniowej.

Przełom wynika z nowej techniki zwanej Self-Principled Critique Tuning (SPCT). SPCT różni się od prostego powiększania modeli AI w celu poprawy wydajności – SPCT nie wymaga dużej ilości energii i mocy obliczeniowej, aby nauczyć AI oceniać swoją własną pracę, korzystając z zestawu samodzielnie stworzonych reguł.

Sposób, w jaki to działa, polega na wbudowanym „sędziu”, który sprawdza, czy odpowiedź AI jest zgodna z jej wewnętrznymi zasadami logiki i wydaje się odpowiednia dla ludzkiego wyjścia. Kiedy AI dostarcza solidną odpowiedź, otrzymuje pozytywne informacje zwrotne, które pomagają mu poprawić zdolność do odpowiadania na podobne pytania w przyszłych przypadkach.

DeepSeek implementuje tę metodę jako część swojego systemu DeepSeek-GRM, który oznacza Generative Reward Modeling. GRM działa inaczej niż tradycyjne metody, ponieważ wykonuje równoległe kontrole, aby zwiększyć zarówno dokładność, jak i spójność.

„Proponujemy Zasadnicze Dostrojenie Krytyki (Self-Principled Critique Tuning – SPCT) w celu promowania skalowalnych zachowań generujących nagrody” – napisali badacze w swoim artykule. „SPCT umożliwia [modelowi] adaptacyjne formułowanie zasad i krytyk na podstawie wprowadzonego zapytania i odpowiedzi, co prowadzi do lepszych wyników nagród.”

Za pomocą tego systemu, DeepSeek twierdzi, że jego AI teraz może wyprzedzać konkurencję, taką jak Gemini od Google, Llama od Meta i GPT-4o od OpenAI, szczególnie jeśli chodzi o skomplikowane zadania, takie jak rozumowanie czy podejmowanie decyzji, jak zauważono na Euronews.

Istotnie, DeepSeek ogłasza, że planuje udostępnić te nowe narzędzia jako oprogramowanie open-source, chociaż nie podano jeszcze daty wydania.

AI DeepSeek Nauczył Się Myśleć Samodzielnie

Cieszymy się, że doceniasz to, co robimy!

Zostaw komentarz