
Image by Freepik
AI Przekształcająca Myśli w Mowę Tłumaczy Fale Mózgowe na Mowę
Naukowcy dokonali przełomu w przywracaniu naturalnej mowy osobom sparaliżowanym, używając AI-sterowanych implantów mózgu, które przekształcają fale mózgowe w wypowiedziane słowa w czasie rzeczywistym.
W pośpiechu? Oto najważniejsze informacje:
- System odczytuje fale mózgowe i przekształca je w niemal natychmiastową, naturalnie brzmiącą mowę.
- System korzysta z głosu pacjenta sprzed urazu, aby stworzyć spersonalizowaną syntezę mowy, która umożliwia autentyczną komunikację.
- Model AI odczytuje sygnały mowy w 80 milisekund, znacznie redukując wcześniejsze opóźnienia.
Naukowcy z Uniwersytetu Radboud we współpracy z UMC Utrecht opracowali technologię implantów mózgowych z AI, która przekształca sygnały nerwowe w mówione słowa z dokładnością od 92 do 100%, jak podaje Neuroscience News. Badanie opublikowane w tym tygodniu w Nature Neuroscience ma na celu rozwijanie narzędzi komunikacyjnych dla osób sparaliżowanych.
Badania wykorzystywały pacjentów z epilepsją z krótkoterminowymi implantami mózgu, aby tworzyć skojarzenia między sygnałami neuronalnymi a wyrażeniami werbalnymi. Rozwój ten skraca wcześniejsze opóźnienia, które utrudniały komunikację osobom z zaburzeniami mowy.
„Nasze podejście do strumieniowania przynosi neuroprotezom tę samą szybkość dekodowania mowy, jaką mają urządzenia takie jak Alexa i Siri,” wyjaśnił Gopala Anumanchipalli, współkierownik badania, jak podaje New Atlas. „Korzystając z podobnego typu algorytmu, odkryliśmy, że możemy dekodować dane neuronalne i po raz pierwszy umożliwić niemal synchroniczne strumieniowanie głosu,” dodał.
System działa poprzez rejestrowanie aktywności mózgu za pomocą elektrod o wysokiej gęstości umieszczonych na powierzchni mózgu. Następnie AI rozszyfrowuje te sygnały, odtwarzając słowa i zdania z zadziwiającą precyzją.
Dodatkowo, model tekst-na-mowę, który został nauczone zapamiętać głos pacjenta sprzed urazu, gwarantuje, że wygenerowana mowa brzmi naturalnie i jest bardzo zbliżona do ich oryginalnego głosu.
Jeden z autorów badania, Cheol Jun Cho, wyjaśnił, jak system przetwarza myśli na mowę: „To, co dekodujemy, następuje po tym, jak myśl już się pojawiła, po tym, jak zdecydowaliśmy, co powiedzieć, jakie słowa użyć i jak poruszyć naszymi mięśniami krtani”, jak podaje New Atlas.
Przełom znacząco poprawia wcześniejsze technologie. Dodatkowo, ten system oparty na sztucznej inteligencji umożliwia teraz inicjowanie mowy w ciągu jednej sekundy, co umożliwia prowadzenie płynnych, nieprzerwanych rozmów. Ta technologia może zrewolucjonizować życie osób z ciężką paraliżem, zespołem zamknięcia w sobie lub schorzeniami takimi jak ALS, umożliwiając im naturalną komunikację z innymi.
Jednak, pomimo tych postępów, technologia nadal napotyka na wyzwania. Jak wyjaśniono w Neuroscience News, ta sztuczna inteligencja wymaga intensywnego treningu na danych neuronalnych osoby, a może nie działać efektywnie dla osób, które nie posiadają wcześniejszych nagrań mowy.
Chociaż system potrafi odczytać słowa, osiągnięcie całkowicie naturalnego tempa i ekspresji jest nadal trudne. Dodatkowo, obecne modele mają problemy z przewidywaniem pełnych zdań i akapitów, skupiając się głównie na pojedynczych słowach.
Ponadto, nieinwazyjne wersje korzystające z hełmów EEG mają niższą dokładność, około 60%, w porównaniu z implantowanymi elektrodami, jak zauważono w New Scientist.
W przyszłości, badacze zamierzają zwiększyć szybkość mowy systemu i jego ekspresyjność, sprawiając, że rozmowy będą wydawały się jeszcze bardziej realistyczne.
Zostaw komentarz
Anuluj odpowiedź