
|
Zamknij X
|
Czy możliwa jest komunikacja bez użycia głosu i ruchu? Studenci z Politechniki Wrocławskiej badają, czy sygnały EEG i sztuczna inteligencja mogą w przyszłości umożliwić tworzenie interfejsów komunikacyjnych opartych wyłącznie na aktywności mózgu.
Projekt „EEG2Text” rozwijany przez członków Koła Naukowego Neuron działającego na Wydziale Informatyki i Telekomunikacji Politechniki Wrocławskiej wraz z Tymonem Dropem – tegorocznym maturzystą – zakwalifikował się do krajowego finału programu Red Bull Basement 2026. System mógłby w przyszłości umożliwiać komunikację osobom, które utraciły możliwość mówienia lub wykonywania ruchów.
Technologia opiera się na elektroencefalografii (EEG), czyli nieinwazyjnej metodzie rejestrowania aktywności elektrycznej mózgu za pomocą elektrod umieszczonych na głowie. Zebrane sygnały są następnie analizowane przez algorytmy AI, które próbują rozpoznawać określone wzorce aktywności mózgu i przekładać je na tekst lub cyfrowe komendy.
Sygnał odpowiadający konkretnej myśli jest w aktywności mózgu niezwykle subtelny — przypomina „elektryczny szept” ukryty w ogromnym szumie innych procesów zachodzących w mózgu.
– Zadaniem AI jest odfiltrowanie tego informacyjnego chaosu i odnalezienie wzorców, których człowiek nie byłby w stanie zauważyć na wykresie EEG – tłumaczy Kamil Wróbel z KN Neuron.
Rozwiązania należą do obszaru tzw. interfejsów mózg–komputer (BCI, Brain-Computer Interface). Są to systemy umożliwiające komunikację między mózgiem a komputerem bez udziału mięśni czy ruchu ciała.
Choć badania nad tzw. imagined speech, czyli wyobrażoną mową, prowadzone są od lat, nadal pozostają jednym z najtrudniejszych problemów współczesnych badań nad EEG. – Temat nie jest bardzo popularny w obrębie BCI ze względu na ogromne wyzwanie odkodowania sygnału z myśli i relatywnie słabe wyniki – wytłumaczył w rozmowie z Nauka w Polsce Kamil Wróbel.
Jak zaznaczył, istnieją dziś dwa główne kierunki rozwoju takich technologii. Pierwszy zakłada bezpośrednie tłumaczenie myśli na tekst lub komendy. – Możemy próbować rozpoznawać pojedyncze fonemy, całe słowa albo znaczenie całych zdań. Każde z tych podejść ma inne zalety i ograniczenia – powiedział Wróbel.
Drugi kierunek, uznawany obecnie za bardziej realistyczny, polega na pośredniej komunikacji. Użytkownik sterowałby np. wirtualną klawiaturą za pomocą wyobrażonych ruchów dłoni lub innych intencji ruchowych, a system wspierany przez modele językowe AI podpowiadałby kolejne słowa podobnie jak autouzupełnianie tekstu w smartfonach.
Sygnały EEG związane z wyobrażaniem sobie ruchu — np. lewej lub prawej dłoni — są znacznie silniejsze i łatwiejsze do wykrycia niż sygnały odpowiadające abstrakcyjnym myślom czy słowom.
– Tutaj kluczowy byłby odpowiedni projekt interfejsu i wykorzystanie dużych modeli językowych, które pomagałyby użytkownikowi szybciej budować zdania – podkreślił badacz.
Zdaniem studentów największym problemem pozostaje jednak sama natura sygnału EEG. – Największym wyzwaniem jest bardzo niski stosunek sygnału do szumu. Mózg nieustannie generuje aktywność elektryczną związaną z emocjami, bodźcami zewnętrznymi czy procesami fizjologicznymi. W tym „chaosie” sygnał odpowiadający konkretnej myśli jest niezwykle subtelny – wyjaśnił Wróbel. Dodatkowym problemem jest to, że ludzie mogą w różny sposób „myśleć” o tym samym pojęciu.
– Jedna osoba będzie wyobrażała sobie obiekt, druga wypowie słowo w myślach, a trzecia wyobrazi sobie ruch języka potrzebny do jego artykulacji. Te niejednoznaczności sprawiają, że interpretacja sygnałów EEG staje się bardzo trudna – podkreślił badacz.
Naukowcy wyróżniają obecnie kilka głównych podejść analizowanych w badaniach nad EEG: mowę wewnętrzną (inner speech), wyobrażoną artykulację (imagined speech) oraz obrazy wizualne (visual imagery).
– Wizualizacja dobrze sprawdza się przy konkretnych obiektach, ale gorzej radzi sobie z pojęciami abstrakcyjnymi czy emocjami. Gdybym miał wskazać najbardziej obiecujący kierunek, postawiłbym na mowę wyobrażoną, choć nadal wymaga to dalszych badań – powiedział Wróbel.
Badacze zwracają uwagę, że współczesne systemy AI nie „czytają myśli” w dosłownym znaczeniu. Algorytmy próbują raczej rozpoznawać powtarzalne wzorce aktywności mózgu powiązane z określonymi intencjami użytkownika.
– Zakładamy, że istnieją pewne wspólne wzorce aktywności związane np. ze słowem „krzesło” czy „piłka”. Problem polega na tym, że są one bardzo słabe i różnią się między ludźmi – podkreślił badacz.
Jednym z największych wyzwań pozostaje tzw. generalizacja między użytkownikami. Model działający dobrze u jednej osoby często nie działa równie skutecznie u innej. – Za każdym razem czepek EEG zakładany jest minimalnie inaczej, co utrudnia znalezienie uniwersalnych wzorców nawet u tej samej osoby – wyjaśnił Wróbel.
Badacze porównują sygnały EEG do linii papilarnych — każdy człowiek ma własny, unikalny sposób „kodowania” myśli. Oznacza to, że system wymagałby wcześniejszej kalibracji dla każdego użytkownika. Każdy nowy użytkownik musiałby przejść proces uczenia systemu, podczas którego algorytm dostosowywałby się do specyfiki jego fal mózgowych.
Problemem pozostaje również brak dużych i ujednoliconych zbiorów danych EEG.– Większość publicznych baz danych różni się protokołem badania albo zawiera zbyt mało przykładów. Powstanie dużego, standaryzowanego zbioru danych mogłoby znacząco przyspieszyć rozwój badań – ocenił Wróbel.
Zespół testował już modele AI na publicznie dostępnych danych EEG i uzyskał obiecujące wyniki przy prostych zestawach znaków i obiektów. Studenci podkreślają jednak, że część publikowanych rezultatów może być zawyżona z powodu błędów metodologicznych, m.in. problemu tzw. wycieku danych (data leakage). – Wiele prac prezentuje bardzo optymistyczne wyniki, które nie zawsze przekładają się na rzeczywiste zastosowania – zaznaczył Wróbel.
Jak dodał, właśnie z powodu ograniczeń danych projekt „EEG2Text” został obecnie wstrzymany w części dotyczącej bezpośredniego odczytywania myśli. W kole rozwijane są natomiast bardziej realistyczne projekty pośredniej komunikacji, takie jak „BrainBoard”.
Studenci podkreślają jednocześnie, że wizja pełnego „czytania myśli” znana z filmów science fiction pozostaje bardzo odległa, szczególnie w przypadku metod nieinwazyjnych takich jak EEG.
– Jeśli mówimy o nieinwazyjnych metodach, do praktycznych zastosowań klinicznych wciąż jest bardzo daleko – ocenił Wróbel.
Mimo ograniczeń badacze podkreślają, że nawet częściowo skuteczne systemy komunikacji mogłyby w przyszłości znacząco poprawić jakość życia osób całkowicie pozbawionych możliwości mówienia lub ruchu.
Technologie rozwijane wokół interfejsów mózg–komputer mogą znaleźć zastosowanie także w sterowaniu protezami, rozpoznawaniu emocji czy systemach biometrycznych.
25 maja 2018 roku zacznie obowiązywać Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r (RODO). Potrzebujemy Twojej zgody na przetwarzanie Twoich danych osobowych przechowywanych w plikach cookies. Poniżej znajdziesz pełny zakres informacji na ten temat.
Zgadzam się na przechowywanie na urządzeniu, z którego korzystam tzw. plików cookies oraz na przetwarzanie moich danych osobowych pozostawianych w czasie korzystania przeze mnie ze strony internetowej Laboratoria.net w celach marketingowych, w tym na profilowanie i w celach analitycznych.
Administratorami Twoich danych będziemy my: Portal Laboratoria.net z siedzibą w Krakowie (Grupa INTS ul. Czerwone Maki 55/25 30-392 Kraków).
Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług w tym zapisywanych w plikach cookies.
Przetwarzamy te dane w celach opisanych w polityce prywatności, między innymi aby:
dopasować treści stron i ich tematykę, w tym tematykę ukazujących się tam materiałów do Twoich zainteresowań,
dokonywać pomiarów, które pozwalają nam udoskonalać nasze usługi i sprawić, że będą maksymalnie odpowiadać Twoim potrzebom,
pokazywać Ci reklamy dopasowane do Twoich potrzeb i zainteresowań.
Zgodnie z obowiązującym prawem Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie, np. agencjom marketingowym, podwykonawcom naszych usług oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa np. sądom lub organom ścigania – oczywiście tylko gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.
Masz między innymi prawo do żądania dostępu do danych, sprostowania, usunięcia lub ograniczenia ich przetwarzania. Możesz także wycofać zgodę na przetwarzanie danych osobowych, zgłosić sprzeciw oraz skorzystać z innych praw.
Każde przetwarzanie Twoich danych musi być oparte na właściwej, zgodnej z obowiązującymi przepisami, podstawie prawnej. Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług, w tym dopasowywania ich do Twoich zainteresowań, analizowania ich i udoskonalania oraz zapewniania ich bezpieczeństwa jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy lub podobne dokumenty dostępne w usługach, z których korzystasz). Taką podstawą prawną dla pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych podmiotów trzecich będzie odbywać się na podstawie Twojej dobrowolnej zgody.
Dlatego też proszę zaznacz przycisk "zgadzam się" jeżeli zgadzasz się na przetwarzanie Twoich danych osobowych zbieranych w ramach korzystania przez ze mnie z portalu *Laboratoria.net, udostępnianych zarówno w wersji "desktop", jak i "mobile", w tym także zbieranych w tzw. plikach cookies. Wyrażenie zgody jest dobrowolne i możesz ją w dowolnym momencie wycofać.
Więcej w naszej POLITYCE PRYWATNOŚCI