Akceptuję
W ramach naszej witryny stosujemy pliki cookies w celu świadczenia państwu usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczone w Państwa urządzeniu końcowym. Możecie Państwo dokonać w każdym czasie zmiany ustawień dotyczących cookies. Więcej szczegółów w naszej Polityce Prywatności

Zamknij X
Labro glowna

Naukowy styl życia

Nauka i biznes

Strona główna Informacje
Dodatkowy u góry
Labro na dole

Polskie narzędzie do porządkowania wirusowego chaosu

Polscy badacze opracowali program komputerowy Vclust, który pozwala w ledwie kilka godzin porównać miliony sekwencji wirusów i uporządkować je według stopnia podobieństwa. Analizowanie ogromnych zbiorów danych genetycznych tradycyjnymi metodami zajęłoby nawet kilka lat.

„Przy użyciu Vclust analiza zbioru 15 mln sekwencji zajmuje ok. czterech godzin, a najdokładniejsze narzędzia stosowane dotychczas potrzebowałyby na to ok. czterech lat. To istotny krok dla rozwoju wirusologii i metagenomiki, ponieważ ułatwi identyfikację i klasyfikację nowych wirusów, które w ostatnich latach są masowo odkrywane dzięki nowoczesnym technologiom sekwencjonowania” - podkreślili w rozmowie z PAP twórcy rozwiązania.

Na łamach czasopisma „Nature Methods” zespół naukowców z Wydziału Biologii Uniwersytetu im. Adama Mickiewicza w Poznaniu oraz Wydziału Automatyki, Elektroniki i Informatyki Politechniki Śląskiej, we współpracy ze specjalistą z Uniwersytet Friedricha Schillera w Jenie, opisał narzędzie, które pozwala odróżniać znane wirusy od nowych oraz analizować ich różnorodność w różnych środowiskach, co ma kluczowe znaczenie dla monitorowania nowych patogenów i badań nad mikrobiomem.

Badacze wyjaśnili, że współczesna mikrobiologia zmaga się problemem zalewu danych. Każdego roku odkrywa się nawet milion nowych wirusów, w efekcie czego powstają tak duże zbiory, że ich analiza oraz klasyfikacja staje się coraz większym wyzwaniem dla zespołów badawczych.

„Taka eksplozja danych to zasługa metagenomiki, czyli metody pozwalającej na odczytanie całego DNA obecnego w danej próbce środowiskowej, np. z oceanu, gleby czy jelita człowieka. Do tej pory brakowało narzędzi, które pozwalałoby efektywnie analizować i grupować tak dużą liczbę sekwencji. Istniały metody bardzo dokładne, ale nie radziły sobie one z taką skalą danych. Dlatego postanowiliśmy stworzyć program, który będzie równie precyzyjny, ale znacznie wydajniejszy i poradzi sobie z milionami genomów naraz” - wyjaśnił współautor publikacji dr hab. Andrzej Zieleziński z UAM.

Dlaczego wirusy są takie trudne?

Jak dodał, w biologii klasyfikacja organizmów - czyli taksonomia - opiera się zwykle na porównywaniu konkretnych genów obecnych u wszystkich przedstawicieli danej grupy. Dzięki temu można tworzyć drzewa filogenetyczne organizmów, grupować je, wyodrębniać rodziny czy gatunki i określać ich stopień pokrewieństwa. Z wirusami jest zupełnie inaczej.

„Wirusy, w przeciwieństwie chociażby do bakterii, nie mają jednego wspólnego genu, który można by porównywać. Różnią się od siebie zbyt mocno. Dlatego klasyczne metody filogenetyczne nie działają. Nie sprawdziło się też podejście oparte na ich morfologii, np. kształcie kapsydów, które okazało się zbyt powolne i mało skalowalne. Pozostało nam więc jedno - porównywać sekwencje całych genomów, litera po literze” - powiedział dr hab. Zieleziński.

Trudno to zrobić, kiedy takich genomów są miliony. Jak wyjaśnił kierujący projektem prof. Sebastian Deorowicz z Politechniki Śląskiej, istnieją już narzędzia pozwalające grupować te olbrzymie zbiory danych, jednak robią to ogromnym kosztem obliczeniowym, trudnym do powtórzenia w warunkach codziennej pracy badawczej. „Nie jest tak, że nikt wcześniej tego nie zrobił, ale wymagało to tak dużych zasobów (np. superkomputerów), że trudno byłoby powtarzać ten proces regularnie, zwłaszcza gdy mamy do czynienia z coraz mocniej rozrastającymi się zestawami danych” - zaznaczył.

„Dlatego my postawiliśmy na optymalizację, czyli zaprojektowanie jak najbardziej efektywnych algorytmów i możliwie najbardziej wydajnego kodu, który umożliwił redukcję czasu obliczeń o kilka rzędów wielkości. Wszystko po to, aby przenieść obliczenia z superkomputera na zwykłą stację roboczą” - dodał.

Trzy kroki do uporządkowania wirusów

Vclust działa w trzech etapach. Pierwszy z nich polega na wstępnym filtrowaniu, w którym program błyskawicznie identyfikuje pary sekwencji wykazujące choć minimalne podobieństwo. Dzięki temu zamiast porównywać każdą sekwencję z każdą inną - co oznaczałoby biliony możliwych kombinacji - algorytm ogranicza analizę do znacznie mniejszej liczby, rzędu setek milionów najbardziej obiecujących par.

Drugi etap to precyzyjne porównanie wybranych sekwencji. Wykorzystywany jest tu autorski algorytm LZ-ANI, oparty na technikach inspirowanych algorytmami kompresji danych używanych w formatach ZIP czy RAR. Zasada jego działania jest prosta: im bardziej dwie sekwencje są do siebie podobne, tym lepiej „kompresują się” razem, czyli zajmują mniej miejsca po przetworzeniu. Ten efekt jest wykorzystywany jako miara podobieństwa.

W ostatnim etapie następuje klastrowanie, czyli grupowanie sekwencji na podstawie ich podobieństwa. Wirusy, których genomy są do siebie najbardziej zbliżone, trafiają do tej samej grupy. Dzięki temu można łatwiej określić, które z nich są ze sobą spokrewnione i tworzą „rodziny”, a które są zupełnie odrębne. To pozwala lepiej zrozumieć różnorodność wirusów i ich ewolucyjne powiązania.

„Dzięki temu program wykorzystuje moc komputera do maksimum. Każdy, kto testował Vclust, był pełen zdumienia co do jego szybkości” - podkreślił dr hab. Zieleziński.

Twórcy Vclust zadbali o to, by narzędzie było w pełni darmowe i ogólnodostępne. Można je pobrać z internetu i uruchomić na własnym komputerze. Dla tych, którzy nie mają zaawansowanego sprzętu, przygotowano wersję przeglądarkową: vclust.org.

Narzędzie działa w bardzo prosty sposób: użytkownik może wkleić własne sekwencje, uruchomić analizę i po krótkim czasie otrzymać wynik - bez potrzeby logowania czy rejestracji. Aktualnie wersja przeglądarkowa pozwala na analizę do tysiąca sekwencji jednocześnie, co w wielu przypadkach okazuje się w zupełności wystarczające.

Prof. Deorowicz i dr hab. Zieleziński zapewniają, że projekt będzie rozwijany. „Planujemy dodać więcej funkcji, a w przyszłości chcielibyśmy rozszerzyć Vclust także o możliwość analizy genomów bakterii” — zapowiedzieli.


Źródło: pap.pl


Drukuj PDF
wstecz Podziel się ze znajomymi

Recenzje




Informacje dnia: Zaawansowany rak szyjki macicy – przełamać tabu 39 projektów z dofinansowaniem - Welcome to Poland 2024 Polscy naukowcy zajmą się certyfikacją technologii kwantowych Pasożyty mogą pomóc w leczeniu chorób autoimmunologicznych Pierwszy w Polsce zabieg termoablacji pierwotnego raka płuca Rodzaj treningu może wpływać na skład mikrobiomu jelitowego Zaawansowany rak szyjki macicy – przełamać tabu 39 projektów z dofinansowaniem - Welcome to Poland 2024 Polscy naukowcy zajmą się certyfikacją technologii kwantowych Pasożyty mogą pomóc w leczeniu chorób autoimmunologicznych Pierwszy w Polsce zabieg termoablacji pierwotnego raka płuca Rodzaj treningu może wpływać na skład mikrobiomu jelitowego Zaawansowany rak szyjki macicy – przełamać tabu 39 projektów z dofinansowaniem - Welcome to Poland 2024 Polscy naukowcy zajmą się certyfikacją technologii kwantowych Pasożyty mogą pomóc w leczeniu chorób autoimmunologicznych Pierwszy w Polsce zabieg termoablacji pierwotnego raka płuca Rodzaj treningu może wpływać na skład mikrobiomu jelitowego

Partnerzy

GoldenLine Fundacja Kobiety Nauki Job24 Obywatele Nauki NeuroSkoki Portal MaterialyInzynierskie.pl Uni Gdansk MULTITRAIN I MULTITRAIN II Nauki przyrodnicze KOŁO INZYNIERÓW PB ICHF PAN FUNDACJA JWP NEURONAUKA Mlodym Okiem Polski Instytut Rozwoju Biznesu Analityka Nauka w Polsce CITTRU - Centrum Innowacji, Transferu Technologii i Rozwoju Uniwersytetu Akademia PAN Chemia i Biznes Farmacom Świat Chemii Forum Akademickie Biotechnologia     Bioszkolenia Geodezja Instytut Lotnictwa EuroLab

Szanowny Czytelniku!

 
25 maja 2018 roku zacznie obowiązywać Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r (RODO). Potrzebujemy Twojej zgody na przetwarzanie Twoich danych osobowych przechowywanych w plikach cookies. Poniżej znajdziesz pełny zakres informacji na ten temat.
 
Zgadzam się na przechowywanie na urządzeniu, z którego korzystam tzw. plików cookies oraz na przetwarzanie moich danych osobowych pozostawianych w czasie korzystania przeze mnie ze strony internetowej Laboratoria.net w celach marketingowych, w tym na profilowanie i w celach analitycznych.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będziemy my: Portal Laboratoria.net z siedzibą w Krakowie (Grupa INTS ul. Czerwone Maki 55/25 30-392 Kraków).

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług w tym zapisywanych w plikach cookies.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy te dane w celach opisanych w polityce prywatności, między innymi aby:

Komu możemy przekazać dane?

Zgodnie z obowiązującym prawem Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie, np. agencjom marketingowym, podwykonawcom naszych usług oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa np. sądom lub organom ścigania – oczywiście tylko gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz między innymi prawo do żądania dostępu do danych, sprostowania, usunięcia lub ograniczenia ich przetwarzania. Możesz także wycofać zgodę na przetwarzanie danych osobowych, zgłosić sprzeciw oraz skorzystać z innych praw.

Jakie są podstawy prawne przetwarzania Twoich danych?

Każde przetwarzanie Twoich danych musi być oparte na właściwej, zgodnej z obowiązującymi przepisami, podstawie prawnej. Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług, w tym dopasowywania ich do Twoich zainteresowań, analizowania ich i udoskonalania oraz zapewniania ich bezpieczeństwa jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy lub podobne dokumenty dostępne w usługach, z których korzystasz). Taką podstawą prawną dla pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych podmiotów trzecich będzie odbywać się na podstawie Twojej dobrowolnej zgody.

Dlatego też proszę zaznacz przycisk "zgadzam się" jeżeli zgadzasz się na przetwarzanie Twoich danych osobowych zbieranych w ramach korzystania przez ze mnie z portalu *Laboratoria.net, udostępnianych zarówno w wersji "desktop", jak i "mobile", w tym także zbieranych w tzw. plikach cookies. Wyrażenie zgody jest dobrowolne i możesz ją w dowolnym momencie wycofać.
 
Więcej w naszej POLITYCE PRYWATNOŚCI
 

Newsletter

Zawsze aktualne informacje