Akceptuję
W ramach naszej witryny stosujemy pliki cookies w celu świadczenia państwu usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczone w Państwa urządzeniu końcowym. Możecie Państwo dokonać w każdym czasie zmiany ustawień dotyczących cookies. Więcej szczegółów w naszej Polityce Prywatności

Zamknij X
Dygestorium

Naukowy styl życia

Nauka i biznes

Strona główna Informacje
Dodatkowy u góry
Labro na dole

Polskie okno na ChatGPT


Wrocławscy badacze pracują nad polskim odpowiednikiem ChatuGPT. Aby go jednak opracować, potrzebują jak najwięcej danych o tym, jak wyglądają rozmowy Polaków ze sztuczną inteligencją. Dlatego apelują o to, by w ramach rozmów z ChatemGPT korzystać z przygotowanego przez nich polskiego okienka.

ChatGPT udostępniony został w listopadzie ub.r. przez amerykańską firmę OpenAI. To bazujący na sztucznej inteligencji generator treści - bot, z którym porozumiewać się można językiem naturalnym. Narzędzie - posługuje się ono również językiem polskim - jest w stanie odpowiadać na pytania, tłumaczyć dokumenty na różne języki, przeprowadzić korektę i redakcję językową tekstów, streszczać i analizować prace naukowe, sugerować rozwiązania przeróżnych problemów, pisać eseje, scenariusze, poprawiać błędy w kodach programistycznych, przeszukiwać bazy danych. A jego zastosowania dopiero są odkrywane.

“Szacujemy, że nawet do 70 proc. osób w Polsce nie miało do czynienia z tym czatem. Dla wielu osób trudnością nie do pokonania jest choćby to, że ChatGPT nie ma polskiego interfejsu. W dodatku, aby móc z czatu skorzystać, trzeba się zalogować - używając logowania przez konto Google, czy podając numer telefonu. To bariera, której wiele osób nie jest w stanie przekroczyć. My wychodzimy tym problemom naprzeciw” - tłumaczy w rozmowie z PAP dr Jan Kocoń z projektu CLARIN-PL Politechniki Wrocławskiej.

Zespół z Wrocławia przygotował polskie okienko dialogowe dla ChatuGPT. Pomysł jest bardzo prosty: za pośrednictwem polskiej strony rozmawia się z ChatemGPT, ale wgląd do tej rozmowy mają również polscy badacze. Dzięki temu polscy użytkownicy mają łatwiejszy dostęp do amerykańskiej aplikacji, a badacze zdobywają bazę zapytań do czatu i informacje, czego w tych odpowiedziach brakuje.

Strona zespołu CLARIN-PL przygotowana jest w języku polskim. A kilka pierwszych pytań można zadać natychmiast, bez logowania. Dla użytkowników, którzy się zalogują (rejestracja jest darmowa) przewidziane są większe limity niż w przypadku bezpłatnego dostępu do ChatuGPT. W ten sposób badacze chcą zachęcić polskich internautów do uchylenia rąbka tajemnicy na temat tego, jak wyglądają ich konwersacje ze sztuczną inteligencją.

"Pracujemy nad polskim odpowiednikiem ChatuGPT. Żeby to rozwiązanie miało szansę zaistnieć, musimy zebrać jak najwięcej informacji o metodach używania takich czatów przez polskich odbiorców. ChatGPT powstał za granicą i niekoniecznie przy jego opracowywaniu pochylono się tam nad problemami, które są istotne dla polskich użytkowników" - mówi dr Kocoń.

Ocenia, że ChatGPT znacznie słabiej posługuje się językiem polskim niż np. angielskim. Popełnia błędy językowe i nie najlepiej rozumie zapytania formułowane w naszym języku. To widać na przykład wtedy, kiedy prosimy czat o napisanie wiersza czy piosenki - zwraca uwagę badacz. Po angielsku wychodzi to całkiem nieźle, ale po polsku tekst zwykle się nawet nie rymuje.

"Nie mamy informacji, jak powstawał model OpenAI, ale naszym głównym podejrzeniem jest to, że on polskiego 'widział' relatywnie niewiele w stosunku do innych języków. Najprawdopodobniej model stosuje międzyjęzykowy transfer wiedzy na podstawie bazy tłumaczeń" - ocenia naukowiec.

Badacz opisuje, że tworzenie sztucznej inteligencji składa się z dwóch głównych etapów: trzeba mieć dużą bazę danych - w tym przypadku tekstów, na podstawie których model uczy się języka. A potem potrzebna jest jeszcze baza zapytań i odpowiedzi, na podstawie których sztuczna inteligencja uczy się generować pożądane treści.

Problemem jest nie tylko to, że ChatGPT widział mało tekstów w języku polskim na etapie tworzenia modeli języka, ale i na etapie szkolenia widział mało polskich instrukcji, zapytań.

Dlatego naukowcy z Wrocławia chcą opracować model, w którego sercu będzie od samego początku język polski. “Nie jesteśmy w stanie konkurować z OpenAI w języku takim jak angielski, ale jeśli chodzi o języki słowiańskie - mamy dużo do zaoferowania. Mamy zebraną bardzo dużą bazę tzw. tekstów korpusowych (służących do badań lingwistycznych) - w języku polskim. Na ich podstawie jesteśmy w stanie zrobić duży model językowy. A potem chcemy go stroić na instrukcjach, które dostaniemy od użytkowników” - tłumaczy naukowiec.

“Najważniejsze dla nas jest to, aby za pośrednictwem naszego okienka użytkownicy zgłaszali różnego rodzaju nieprawidłowości wynikające z używania czata” - tłumaczy Jan Kocoń.

Jeśli czat poda odpowiedź niezgodną z oczekiwaniami, można wcisnąć smutną buźkę pod okienkiem dialogowym. Już to wystarczy badaczom jako sygnał, żeby przyjrzeli się odpowiedzi bota i sprawdzili, co jest nie tak.

Po każdej ocenie odpowiedzi otwiera się okienko, w którym można naukowcom wpisać swój komentarz - np. by zwrócić uwagę na błędy językowe; na to, że ChatGPT zmyślił jakieś informacje albo że jego odpowiedź była obraźliwa. A nawet wpisać, jaka odpowiedź by nas satysfakcjonowała. W ten sposób nie tylko pomagamy polskim badaczom, ale również trenujemy swoje krytyczne myślenie i ćwiczymy ograniczone zaufanie do sztucznej inteligencji.

Komentarze i reakcje internautów będą przeglądane przez polski zespół badaczy. A zapytania i wnioski z tych rozmów będą służyły do prac nad polskim botem. “Żeby powstał dobry czat, musi mieć do dyspozycji dużo instrukcji. Tak zrobiło OpenAI - zatrudniło mnóstwo ludzi, którzy rozmawiali z botem i korygowali odpowiedzi czatu"- mówi rozmówca PAP. W ten sposób czat uczył się, jakie treści są pożądane, a jakich treści nie powinien generować.

Chodzi m.in. o to, by nauczyć sztuczną inteligencję, że jest pewna klasa pytań, na które czat nie może odpowiedzieć wprost (np. treści mogące ułatwić popełnienie przestępstwa, naruszające prywatność lub obrażające uczucia religijne). Ktoś musiał więc kiedyś ręcznie dla takiej klasy zapytań przygotować wzorcowe odpowiedzi, a model stroił się do tych instrukcji.

Polscy badacze nie mają takich nakładów jak amerykańska firma. Nie są w stanie sami przewidzieć wszystkich możliwych zastosowań czata i sprawdzić, czy dobrze się on spisuje. Skorzystają więc z interakcji polskich użytkowników z ChatemGPT, żeby trenować swój model.

Badacz informuje, że jego uczelnia - we współpracy z Wrocławskim Centrum Sieciowo-Superkomputerowym - jest w trakcie zakupów sprzętu obliczeniowego, który ma przydać się w rozwijaniu badań nad polską sztuczną inteligencją. Budżet jest duży - to ok. 80 mln zł, ale sprzęt trafi do naukowców dopiero w przyszłym roku. Już teraz jednak badacze przygotowali dodatkowy budżet na dostęp do mocy obliczeniowych. “Nie chcemy czekać na sprzęt z założonymi rękami, już teraz przygotowujemy dane, na których będziemy trenować model" - relacjonuje.

Naukowiec apeluje też do badaczy i specjalistów z różnych dziedzin o pomoc w pracach nad polską sztuczną inteligencją. "Jeśli chcemy mieć polskie wysokomarżowe technologie, musimy je rozwijać i badać. A bez danych nie ruszymy z miejsca" - podkreśla.

W skład zespołu wchodzą: Bartosz Walkowiak, Dawid Banach, Tomasz Walkowiak, Magdalena Drewniak, Jan Wieczorek, Paweł Kazienko, Tomasz Naskręt, Jan Kocoń, Maciej Piasecki.(PAP)


Źródło: pap.pl

Recenzje



http://laboratoria.net/aktualnosci/31836.html
Informacje dnia: Zdrowych i Pogodnych Świąt Bożego Narodzenia Zapraszamy na wyjątkową edycję Targów PCI Days 2025! Zawał już dawno przestał być chorobą mężczyzn Świąteczna apteczka Radioaktywny pluton się nie ukryje Złoty Medal Chemii przyznany po raz 14 Zdrowych i Pogodnych Świąt Bożego Narodzenia Zapraszamy na wyjątkową edycję Targów PCI Days 2025! Zawał już dawno przestał być chorobą mężczyzn Świąteczna apteczka Radioaktywny pluton się nie ukryje Złoty Medal Chemii przyznany po raz 14 Zdrowych i Pogodnych Świąt Bożego Narodzenia Zapraszamy na wyjątkową edycję Targów PCI Days 2025! Zawał już dawno przestał być chorobą mężczyzn Świąteczna apteczka Radioaktywny pluton się nie ukryje Złoty Medal Chemii przyznany po raz 14

Partnerzy

GoldenLine Fundacja Kobiety Nauki Job24 Obywatele Nauki NeuroSkoki Portal MaterialyInzynierskie.pl Uni Gdansk MULTITRAIN I MULTITRAIN II Nauki przyrodnicze KOŁO INZYNIERÓW PB ICHF PAN FUNDACJA JWP NEURONAUKA Mlodym Okiem Polski Instytut Rozwoju Biznesu Analityka Nauka w Polsce CITTRU - Centrum Innowacji, Transferu Technologii i Rozwoju Uniwersytetu Akademia PAN Chemia i Biznes Farmacom Świat Chemii Forum Akademickie Biotechnologia     Bioszkolenia Geodezja Instytut Lotnictwa EuroLab

Szanowny Czytelniku!

 
25 maja 2018 roku zacznie obowiązywać Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r (RODO). Potrzebujemy Twojej zgody na przetwarzanie Twoich danych osobowych przechowywanych w plikach cookies. Poniżej znajdziesz pełny zakres informacji na ten temat.
 
Zgadzam się na przechowywanie na urządzeniu, z którego korzystam tzw. plików cookies oraz na przetwarzanie moich danych osobowych pozostawianych w czasie korzystania przeze mnie ze strony internetowej Laboratoria.net w celach marketingowych, w tym na profilowanie i w celach analitycznych.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będziemy my: Portal Laboratoria.net z siedzibą w Krakowie (Grupa INTS ul. Czerwone Maki 55/25 30-392 Kraków).

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług w tym zapisywanych w plikach cookies.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy te dane w celach opisanych w polityce prywatności, między innymi aby:

Komu możemy przekazać dane?

Zgodnie z obowiązującym prawem Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie, np. agencjom marketingowym, podwykonawcom naszych usług oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa np. sądom lub organom ścigania – oczywiście tylko gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz między innymi prawo do żądania dostępu do danych, sprostowania, usunięcia lub ograniczenia ich przetwarzania. Możesz także wycofać zgodę na przetwarzanie danych osobowych, zgłosić sprzeciw oraz skorzystać z innych praw.

Jakie są podstawy prawne przetwarzania Twoich danych?

Każde przetwarzanie Twoich danych musi być oparte na właściwej, zgodnej z obowiązującymi przepisami, podstawie prawnej. Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług, w tym dopasowywania ich do Twoich zainteresowań, analizowania ich i udoskonalania oraz zapewniania ich bezpieczeństwa jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy lub podobne dokumenty dostępne w usługach, z których korzystasz). Taką podstawą prawną dla pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych podmiotów trzecich będzie odbywać się na podstawie Twojej dobrowolnej zgody.

Dlatego też proszę zaznacz przycisk "zgadzam się" jeżeli zgadzasz się na przetwarzanie Twoich danych osobowych zbieranych w ramach korzystania przez ze mnie z portalu *Laboratoria.net, udostępnianych zarówno w wersji "desktop", jak i "mobile", w tym także zbieranych w tzw. plikach cookies. Wyrażenie zgody jest dobrowolne i możesz ją w dowolnym momencie wycofać.
 
Więcej w naszej POLITYCE PRYWATNOŚCI
 

Newsletter

Zawsze aktualne informacje