
Image by Matheus Bertelli, from Pexels
AI DeepSeek Nauczył Się Myśleć Samodzielnie
Chiński startup DeepSeek, we współpracy z Uniwersytetem Tsinghua, twierdzi, że opracował sprytniejszą metodę, która pomaga modelom sztucznej inteligencji myśleć lepiej i szybciej, bez potrzeby korzystania z ogromnych komputerów czy drogich zasobów.
W pośpiechu? Oto najważniejsze fakty:
- DeepSeek stworzyło samo-doskonalącą się sztuczną inteligencję przy użyciu Self-Principled Critique Tuning (SPCT).
- SPCT uczy sztuczną inteligencję oceniać swoją własną pracę przy użyciu samodzielnie generowanych reguł.
- Metoda zwiększa wydajność bez konieczności używania ogromnej mocy obliczeniowej.
Przełom wynika z nowej techniki zwanej Self-Principled Critique Tuning (SPCT). SPCT różni się od prostego powiększania modeli AI w celu poprawy wydajności – SPCT nie wymaga dużej ilości energii i mocy obliczeniowej, aby nauczyć AI oceniać swoją własną pracę, korzystając z zestawu samodzielnie stworzonych reguł.
Sposób, w jaki to działa, polega na wbudowanym „sędziu”, który sprawdza, czy odpowiedź AI jest zgodna z jej wewnętrznymi zasadami logiki i wydaje się odpowiednia dla ludzkiego wyjścia. Kiedy AI dostarcza solidną odpowiedź, otrzymuje pozytywne informacje zwrotne, które pomagają mu poprawić zdolność do odpowiadania na podobne pytania w przyszłych przypadkach.
DeepSeek implementuje tę metodę jako część swojego systemu DeepSeek-GRM, który oznacza Generative Reward Modeling. GRM działa inaczej niż tradycyjne metody, ponieważ wykonuje równoległe kontrole, aby zwiększyć zarówno dokładność, jak i spójność.
„Proponujemy Zasadnicze Dostrojenie Krytyki (Self-Principled Critique Tuning – SPCT) w celu promowania skalowalnych zachowań generujących nagrody” – napisali badacze w swoim artykule. „SPCT umożliwia [modelowi] adaptacyjne formułowanie zasad i krytyk na podstawie wprowadzonego zapytania i odpowiedzi, co prowadzi do lepszych wyników nagród.”
Za pomocą tego systemu, DeepSeek twierdzi, że jego AI teraz może wyprzedzać konkurencję, taką jak Gemini od Google, Llama od Meta i GPT-4o od OpenAI, szczególnie jeśli chodzi o skomplikowane zadania, takie jak rozumowanie czy podejmowanie decyzji, jak zauważono na Euronews.
Istotnie, DeepSeek ogłasza, że planuje udostępnić te nowe narzędzia jako oprogramowanie open-source, chociaż nie podano jeszcze daty wydania.
Zostaw komentarz
Anuluj odpowiedź