Nowy algorytm MIT zwiększa efektywność podejmowania decyzji przez AI nawet 50-krotnie
Badacze z MIT opracowali efektywny algorytm szkolenia AI, poprawiając wydajność poprzez dobór najlepszych zadań, ulepszanie procesu podejmowania decyzji i redukowanie kosztów szkolenia.
W pośpiechu? Oto najważniejsze informacje!
- Model-Based Transfer Learning (MBTL) poprawia wydajność, jednocześnie redukując potrzebę danych i zasobów obliczeniowych.
- MBTL był od pięciu do 50 razy bardziej wydajny niż tradycyjne metody uczenia z wzmocnieniem.
- Naukowcy planują rozszerzyć MBTL do rozwiązywania bardziej skomplikowanych problemów występujących w rzeczywistym świecie.
Badacze z MIT przedstawili nowy algorytm mający na celu zwiększenie efektywności modeli decyzyjnych AI, zwłaszcza w przypadku skomplikowanych zadań, takich jak kontrola ruchu drogowego w miastach.
Algorytm poprawia tradycyjne uczenie ze wzmocnieniem, które często boryka się z różnorodnością w różnych zadaniach.
Komunikat prasowy MIT wyjaśnia, że na przykład model AI nauczył się kontrolować ruch na jednym skrzyżowaniu, może nie poradzić sobie, gdy zostanie zastosowany do innych z różnymi wzorcami ruchu, liczbą pasów czy ograniczeniami prędkości.
Nowe podejście, znane jako Model-Based Transfer Learning (MBTL), strategicznie wybiera podzbiór zadań do treningu agenta AI, koncentrując się na tych, które zapewnią najbardziej znaczące poprawy w wydajności.
Zawężając obszar treningu, ta metoda redukuje potrzebne dane i zasoby obliczeniowe, jednocześnie zwiększając efektywność procesu uczenia się, mówi MIT.
Badania zespołu, które zostaną zaprezentowane na Konferencji Systemów Przetwarzania Informacji Neuronalnej, wykazały, że MBTL była od pięciu do 50 razy bardziej efektywna niż standardowe metody.
„Zdołaliśmy zaobserwować niesamowitą poprawę wydajności, przy użyciu bardzo prostego algorytmu, dzięki myśleniu poza schematami,” powiedziała Cathy Wu, główna autorka i profesor asociowany na MIT.
„Algorytm, który nie jest zbyt skomplikowany, ma większą szansę na przyjęcie przez społeczność, ponieważ jest łatwiejszy do zaimplementowania i zrozumienia przez innych.”
Zazwyczaj modele AI do zadań takich jak kontrola ruchu drogowego są szkolone na jeden z dwóch sposobów: albo przy użyciu danych ze wszystkich zadań, albo szkoląc oddzielne modele dla każdego zadania.
MIT wyjaśnia, że obie metody mają swoje wady – szkolenie oddzielnych modeli wymaga ogromnych ilości danych, podczas gdy szkolenie we wszystkich zadaniach często prowadzi do poniżej średniej wydajności.
Metoda badaczy znajduje kompromis, szkoląc algorytm na mniejszym podzbiorze zadań, które są strategicznie wybrane, aby maksymalizować wydajność we wszystkich zadaniach.
MBTL korzysta z uczenia przenoszenia typu zero-shot, koncepcji, w której model szkolony do jednego zadania jest stosowany do podobnych zadań bez dodatkowego przeszkolenia.
MIT wyjaśnia, że ta metoda szacuje, jak dobrze model poradzi sobie w zadaniach, na które nie był bezpośrednio szkolony, a więc wybiera zadania, które poprawią ogólną generalizację.
„Z 50-krotnym wzrostem efektywności, algorytm MBTL mógł być trenowany na zaledwie dwóch zadaniach i osiągać taką samą wydajność, jak standardowa metoda, która korzysta z danych z 100 zadań,” wyjaśniła Wu.
To podejście znacznie redukuje ilość potrzebnych danych do treningu, poprawiając zarówno prędkość, jak i opłacalność tworzenia modeli AI do skomplikowanych decyzji, według MIT.
Patrząc w przyszłość, zespół planuje udoskonalić metodę MBTL dla bardziej skomplikowanych systemów i aplikacji ze świata rzeczywistego, takich jak systemy mobilności nowej generacji.
Zostaw komentarz
Anuluj odpowiedź