Akceptuję
W ramach naszej witryny stosujemy pliki cookies w celu świadczenia państwu usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczone w Państwa urządzeniu końcowym. Możecie Państwo dokonać w każdym czasie zmiany ustawień dotyczących cookies. Więcej szczegółów w naszej Polityce Prywatności

Zamknij X
FMM
Strona główna Nowe technologie
Dodatkowy u góry
Labro na dole

Polacy badają technologie rozpoznawania mowy


Technologie rozpoznawania i odszumiania mowy oraz biometrii będą ułatwiały nam korzystanie z usług banków, infolinii, wspierały lekarzy i pracowników sądów, monitorowały media. Pracę nad takimi innowacjami prowadzi m.in. Voicelab – spółka, która powstała w wyniku konkursu Innowator organizowanego przez Fundację na rzecz Nauki Polskiej. Wdrożenia i rozwój spółki wspomaga Rada Naukowa, a dofinansowuje Narodowe Centrum Badań i Rozwoju.

 

Jakie produkty powstają w gdańskiej firmie?

 

INNOWACYJNE USŁUGI DLA BANKOWOŚCI

 

"Naszym flagowym produktem jest Voicebanking – innowacyjne usługi głosowe dla banków. Dzięki technologiom, które opracowaliśmy, klient może zlecać przelewy głosem w bankowej aplikacji mobilnej, sprawdzać saldo na rachunku i wykonywać wiele innych czynności za pomocą głosu" – mówi Tomasz Szwelnik, który razem z Marcinem Kuropatwińskim wygrał w 2009 r. konkurs FNP i założył firmę prowadzącą badania w zakresie rozpoznawania i odszumiania mowy.

 

Voicelab wdrożył już swoje rozwiązania w dwóch bankach w Polsce i negocjuje warunki kolejnych wdrożeń. Wkrótce zatem będziemy mogli wypróbować polską technologię w codziennym życiu. Jak będzie to wyglądać?

 

"Wystarczy powiedzieć np. +Chcę zrobić przelew+ lub +Ile mam forsy na koncie+ czy +Ile wydałem w zeszłym tygodniu+. Nasza technologia rozpoznawania mowy zapewnia szybkie dotarcie do właściwych informacji bez podejmowania wielu czynności w aplikacji. Nasz system rozpoznaje polecenia głosowe. Jest to szybsze i wygodniejsze niż używanie tradycyjnego klikania" – tłumaczy Szwelnik.

 

Nowe rozwiązania dla bankowości obejmują również biometrię głosową. Dla klientów banku mogą one stanowić duże ułatwienie. Dzięki specjalnemu systemowi nie trzeba będzie dokonywać tradycyjnej autoryzacji, oczekując długo na infolinii na zgłoszenie się konsultanta, wystarczy biometryczne hasło głosowe. Dzięki metodom biometrii głosowej aplikacja bezbłędnie rozpozna cechy głosu zarejestrowanego klienta i pozwoli mu na dokonanie wybranej operacji.

 

Jak zaznacza Szwelnik, taka metoda może być bezpieczniejsza od klasycznych, opartych często na danych z dowodu osobistego. Te dane bardzo łatwo zdobyć, trudniej natomiast podrobić cechy biometryczne związane z budową traktu głosowego człowieka. Jeżeli system „zna” próbkę głosu, to autoryzuje ją błyskawicznie i użytkownik od razu może korzystać z aplikacji bankowej.

 

Voicebanking, czyli obsługa klienta za pomocą rozpoznawania i syntezy mowy, to technologia gotowa do komercjalizacji. W rozpoznawaniu mowy i biometrii firma wdraża własne rozwiązania, natomiast w zakresie syntezy mowy współpracuje ze światowym liderem – również polską firmą Ivona Software.

 

NISZE W TELEKOMUNIKACJI, MEDYCYNIE, SĄDOWNICTWIE, MEDIACH

 

Opracowany przez Voicelab system rozpoznawania mowy ma zastosowanie również w infolinii telefonicznej. Dzięki rozpoznawaniu głosu można bez naciskania przycisków można poprosić o połączenie z wybranym działem lub też wykonać żądaną funkcję.

 

"Jest to sporym udogodnieniem zwłaszcza dla osób, dla których barierą jest obsługa za pomocą klikania. Nasze rozwiązanie to propozycja dla dużych firm, korporacji, które obsługują bardzo wielu klientów i chcą zautomatyzować proces jego obsługi. Dzięki temu użytkownik ma możliwość łatwego dostępu do informacji nawet przez 24 godziny na dobę" – zapewnia Szwelnik.

 

Wyjaśnia, że ogólne informacje są przekazywane przez system dialogu – rozpoznawania i syntezy mowy. System rozpoznawania mowy jest również stosowany do wyszukiwania słów kluczowych w rozmowach telefonicznych. Analiza rozmów dostarcza informacji, które wymagałyby przesłuchania wielu tysięcy godzin nagrań.

 

Z omawianych technologii może również korzystać sektor obronny, medyczny, sądownictwo, media, telekomunikacja… Transkrypcja medyczna to zamiana mowy na tekst, z uwzględnieniem specjalistycznego języka stosowanego przy opisie badań lekarskich. Technologia umożliwia rozpoznawanie wypowiedzi lekarzy, którzy opisują swoje diagnozy i wykonywanie określonych procedur medycznych.

 

„Lekarz będzie mógł przesłać nagranie do centrum transkrypcji, po czym zostanie ono odesłane i będzie nadawało się do dalszego użytkowania jako zapis tekstowy. Na świecie jest to powszechnie stosowane przez centra medyczne, lekarze są wyręczani w rutynowych czynnościach, technologie ich wspierają. Na rynku polskim będzie to innowacja” – zapowiada Szwelnik.

 

Zapisywanie mowy jest z pewnością przydatne w sądownictwie. Obecnie sędziowie dyktują postanowienia, wyroki i ich uzasadnienia stenotypistom, również zeznania są zapisywane ręcznie. Kancelarie prawne pracują z dużą ilością nagrań z rozpraw, które trzeba następnie odsłuchać. Automatyzacja tych czynności byłaby rewolucyjna.

 

„Planujemy takie wdrożenia. Pojawia się tutaj jednak utrudnienie związane z jakością nagrań z rozpraw na salach sądowych. Najczęściej towarzyszy im wiele dodatkowych zjawisk akustycznych, co zakłóca w sposób znaczący rozpoznawanie mowy. Dobrze byłoby, aby w takich nagraniach zostały użyte specjalistyczne mikrofony kierunkowe. Wymaga to odpowiedniego sprzętu, który my dostarczamy. Ponadto specjalizujemy się w budowaniu modelu akustycznego uwzględniającego różne warunki akustyczne. Przed nami jeszcze sporo wyzwań” – przyznaje rozmówca PAP.

 

Możliwe jest również zaadaptowanie systemu rozpoznawania mowy dla potrzeb mediów. System umożliwia transkrypcję z zapisu nagrań programów telewizyjnych czy radiowych. Kolejny aspekt to monitorowanie kampanii marketingowych.

 

"W reklamie zwykle używa się hasła lub nazwy produktowej. Jeśli osoby dzwonią w sprawie określonego produktu, można zmierzyć ilość rozmów, jakie odbyły się w tej sprawie i ocenić, jaka jest skuteczność kampanii. Taką analizą zajmuje się nasze oprogramowanie do rozpoznawania słów kluczowych w rozmowach telefonicznych" – mówi Szwelnik.

 

Jest to przydatne również w obsłudze call center. System potrafi „wyłapywać” słowa podczas rozmów, które powinny być używane lub są zabronione w rozmowach.

 

„Możemy w ten sposób wykrywać czy klient dzwoni w sprawie reklamacji, rezygnacji z umowy, a może straszy firmę wezwaniem do sądu. System pozwala na wczesnym etapie wykrywać takie słowa. Wówczas rozmowy zostają przekierowane do konsultantów o większym doświadczeniu dzięki czemu można rozładować napięcie, które powstało w rozmowie” – opisuje współtwórca innowacji.

 

PAP – Nauka w Polsce, Karolina Olszewska

Źródło: www.naukawpolsce.pap.pl

 


Tagi: mowa, technologia, biometria
Drukuj PDF
wstecz Podziel się ze znajomymi

Informacje dnia: Potrzebne regulacje dot. norm i zasad hałasu turbin wiatrowych Naukowcy zbadali, jakie obrazy zapadają częściej w pamięć Człowiek poprzez emisję gazów spowodował ocieplenie Sztuczna inteligencja diagnozuje spektrum autyzmu Autonomiczne hulajnogi elektryczne Wydano pierwszy atlas geologiczny Księżyca Potrzebne regulacje dot. norm i zasad hałasu turbin wiatrowych Naukowcy zbadali, jakie obrazy zapadają częściej w pamięć Człowiek poprzez emisję gazów spowodował ocieplenie Sztuczna inteligencja diagnozuje spektrum autyzmu Autonomiczne hulajnogi elektryczne Wydano pierwszy atlas geologiczny Księżyca Potrzebne regulacje dot. norm i zasad hałasu turbin wiatrowych Naukowcy zbadali, jakie obrazy zapadają częściej w pamięć Człowiek poprzez emisję gazów spowodował ocieplenie Sztuczna inteligencja diagnozuje spektrum autyzmu Autonomiczne hulajnogi elektryczne Wydano pierwszy atlas geologiczny Księżyca

Partnerzy

GoldenLine Fundacja Kobiety Nauki Job24 Obywatele Nauki NeuroSkoki Portal MaterialyInzynierskie.pl Uni Gdansk MULTITRAIN I MULTITRAIN II Nauki przyrodnicze KOŁO INZYNIERÓW PB ICHF PAN FUNDACJA JWP NEURONAUKA Mlodym Okiem Polski Instytut Rozwoju Biznesu Analityka Nauka w Polsce CITTRU - Centrum Innowacji, Transferu Technologii i Rozwoju Uniwersytetu Akademia PAN Chemia i Biznes Farmacom Świat Chemii Forum Akademickie Biotechnologia     Bioszkolenia Geodezja Instytut Lotnictwa EuroLab

Szanowny Czytelniku!

 
25 maja 2018 roku zacznie obowiązywać Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r (RODO). Potrzebujemy Twojej zgody na przetwarzanie Twoich danych osobowych przechowywanych w plikach cookies. Poniżej znajdziesz pełny zakres informacji na ten temat.
 
Zgadzam się na przechowywanie na urządzeniu, z którego korzystam tzw. plików cookies oraz na przetwarzanie moich danych osobowych pozostawianych w czasie korzystania przeze mnie ze strony internetowej Laboratoria.net w celach marketingowych, w tym na profilowanie i w celach analitycznych.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będziemy my: Portal Laboratoria.net z siedzibą w Krakowie (Grupa INTS ul. Czerwone Maki 55/25 30-392 Kraków).

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług w tym zapisywanych w plikach cookies.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy te dane w celach opisanych w polityce prywatności, między innymi aby:

Komu możemy przekazać dane?

Zgodnie z obowiązującym prawem Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie, np. agencjom marketingowym, podwykonawcom naszych usług oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa np. sądom lub organom ścigania – oczywiście tylko gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz między innymi prawo do żądania dostępu do danych, sprostowania, usunięcia lub ograniczenia ich przetwarzania. Możesz także wycofać zgodę na przetwarzanie danych osobowych, zgłosić sprzeciw oraz skorzystać z innych praw.

Jakie są podstawy prawne przetwarzania Twoich danych?

Każde przetwarzanie Twoich danych musi być oparte na właściwej, zgodnej z obowiązującymi przepisami, podstawie prawnej. Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług, w tym dopasowywania ich do Twoich zainteresowań, analizowania ich i udoskonalania oraz zapewniania ich bezpieczeństwa jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy lub podobne dokumenty dostępne w usługach, z których korzystasz). Taką podstawą prawną dla pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych podmiotów trzecich będzie odbywać się na podstawie Twojej dobrowolnej zgody.

Dlatego też proszę zaznacz przycisk "zgadzam się" jeżeli zgadzasz się na przetwarzanie Twoich danych osobowych zbieranych w ramach korzystania przez ze mnie z portalu *Laboratoria.net, udostępnianych zarówno w wersji "desktop", jak i "mobile", w tym także zbieranych w tzw. plikach cookies. Wyrażenie zgody jest dobrowolne i możesz ją w dowolnym momencie wycofać.
 
Więcej w naszej POLITYCE PRYWATNOŚCI
 

Newsletter

Zawsze aktualne informacje