Bioinformatyka – biologia i informatyka
Bioinformatyka
Bioinformatyka jest jedną z najmłodszych nauk, której burzliwy rozwój został wymuszony przez postęp w dziedzinie nauk biologicznych, a umożliwiły go dokonane przełomowe osiągnięcia i wdrożenia w samej informatyce. [cyt.Błażewicz2011]
Wielu badaczy, mówiąc o bioinformatyce, ma na myśli głównie aspekty związane z biologią na poziomie molekularnym (DNA, RNA, białko). Stymulującym to odkryciem było podanie w 1953 r. przez Watsona i Cricka (razem ze współtwórcami Wilkinsem i Franklin nagrodzonymi w 1962 r. Noblem) modelu podwójnej helisy łańcucha DNA, przechowującego (kodującego) informację genetyczną we wszystkich organizmach żywych, co barwnie przedstawia jeden z autorów w swej powieści [Watson1975].
DNA człowieka
Ludzka nić DNA liczy ok. 3mld elementów, czyli cząstek kwasu dezoksyrybnukleinowego. Cząstka może mieć jedną z czterech wartości: G, T, C lub A. Ludzie różnią się układem cząstek w DNA i bardzo rzadko spotyka się identyczne łańcuchy(np. bliźnięta jednojajowe). Odczytanie tak długiego łańcucha jest bardzo kłopotliwe. Ponieważ łatwo jest odczytać krótkie łańcuchy, więc jedną z metod odcyfrowania DNA jest podzielenie łańcucha, ściślej wszystkich egzemplarzy łańcucha w roztworze, na mniejsze odcinki. Podziały dla poszczególnych łańcuchów różnią się i np. łańcuch: actacag może zostać podzielony na wiele różnych sposobów (a,ct,ac,ag),(ac,ta,cag),(ac,t,a,ca,g) które współistnieją w tym samym roztworze. Metoda polega na wczytaniu łańcuchów „jak leci” wprost do pamięci komputera, który zajmuje się ułożeniem łańcuchów do pierwotnego porządku. Jest to możliwe dzięki łączeniu łańcuchów „na zakładkę”, tak by długość ostatecznego łańcucha powstałego z połączenia wszystkich występujących w roztworze fragmentów była jak najmniejsza.
W szerszym ujęciu problem przedstawiony w zadaniu polega na odczytaniu łańcucha o długości około 3 miliardów nukleotydów tworzonych przez jedną z czterech zasad: adeninę („A”), guaninę („G”), cytozynę („C”) i tyminę („T”). Zarysowana metoda to jeden z komputerowo wspomaganych sposobów zwany „Sekwencjonowaniem przez hybrydyzację”. Szkic nie uwzględnia na przykład błędów jakie mogą powstać w trakcie odczytywania sekwencji polegających na pojawianiu się odczytów, którym nie odpowiadają żadne rzeczywiste sekwencje (tzw. błędy dodatnie) lub nieodczytywaniu sekwencji, które powinny być w roztworze (tzw. błędy ujemne). Sekwencjonowanie DNA ma dziś ogromne znaczenie w kryminalistyce, sądownictwie, rolnictwie, archeologii, farmaceutyce i medycynie.
Sekwencjonery
Przedstawiony na Rys.3 zminiaturyzowany sekwencjoner podłączony do komputera w kilka sekund sekwencjonuje genomy bakterii i wirusów. Dłużej zajmuje „rozkodowanie” bardziej złożonych genomów (6h dla człowieka). Zastosowanie może znaleźć nie tylko w medycynie, ale np. w archeologii. Konkurencja zapowiada maszynę radzącą sobie z ludzkim DNA w 2 godziny.
Znaczenie DNA
Sekwencja DNA stanowi w pewnym sensie program działania mechanizmów w żywych komórkach, w szczególności pewne jej rejony określają jakie białko zostanie wytworzone a inne, w uproszczeniu, kiedy i gdzie (proces regulacji genów). Białka kodowane są za pomocą kodu genetycznego, w którym trójki zasad kodują pojedynczy aminokwas. Pojedyncze białko jest sekwencją aminokwasów, których standardowo wyróżniamy 20. Większość aminokwasów może być zakodowana w DNA na kilka sposobów (kilka różnych trójek zasad koduje ten sam aminokwas). Sekwencje aminokwasów to inaczej łańcuchy polipeptydowe i mogą one przyjmować złożone struktury przestrzenne. Ustalenie biologicznie aktywnych struktur przestrzennych białek odpowiadających danej sekwencji aminokwasowej jest jednym z ciekawszych problemów z jakim boryka się biologia molekularna wspierana przez tzw.”Bioinformatykę strukturalną”. Tutaj z pomocą przychodzą zaawansowane metody informatyczne tzw. uczenia maszynowego. Otóż znane z doświadczeń biologicznych pary: sekwencja aminokwasów i struktura białkowa są podawane na wejście programu uczącego się, który po pełnym cyklu uczenia powinien umieć prawidłowo wskazać strukturę dla zadanej sekwencji lub sekwencję dla zadanej struktury (np. przy projektowaniu leków). W chwili obecnej istnieją ogromne bazy danych gromadzące te odpowiedniki i używane w maszynowym uczeniu. Pomimo tego ciągle jeszcze nam daleko do perfekcyjnego prognozowania struktur białek.
Kierunek bioinformatyka
Ogólnie rzecz biorąc absolwent kierunku bioinformatyka wyższej uczelni powinien reprezentować wysoki poziom wiedzy biologicznej jak też wiedzy informatycznej w tym talentów programistycznych i posługiwania się systemami informatycznymi. W Poznaniu makrokierunek bioinformatyka jest prowadzony we współpracy Wydziału Biologii Uniwersytetu Adama Mickiewicza i Wydziału Informatyki Politechniki Poznańskiej. Na terenie Politechniki Poznańskiej działa Europejskie Centrum Bioinformatyki i Genomiki (ECBiG) jako unikalna na terenie Wielkopolski jednostka badawczo-rozwojowa, powstała na bazie konsorcjum zawiązanego pomiędzy Politechniką Poznańską a Instytutem Chemii Bioorganicznej PAN w Poznaniu.
Nieco żartobliwym zilustrowaniem tych działań jest animowany teledysk z piosenką o sekwencjonowaniu metodą hybrydyzacji DNA:
Alan w rytmie DNA from Mobit on Vimeo.
Literatura
[Błażewicz2011]J.Błażewicz „Bioinformatyka i jej perspektywy”,wykład inauguracyjny, Politechnika Poznańska, 2011 http://www2.cs.put.poznan.pl/wp-content/uploads/2011/11/wyklad_inauguracyjny_2011.pdf
[Watson1975]J. D. Watson „Podwójna spirala. Relacja naoczna o wykryciu struktury DNA”, Wiedza Powszechna,Seria: Omega,Warszawa,1975
[Tomala2018] Ludwika Tomala „RNA w 3D? Polacy zostawiają konkurencję w tyle!” https://naukawpolsce.pap.pl/aktualnosci/news%2C27837%2Crna-w-3d-polacy-zostawiaja-konkurencje-w-tyle.html, 2018.
Marcin Radom, „Kombinatoryczne aspekty nieklasycznego sekwencjonowania DNA przez hybrydyzację”, rozprawa doktorska, Poznań, 2011, https://www.cs.put.poznan.pl/mradom/papers/MRphdthesis.pdf
Zadanie do tego tekstu https://andrzeju.pl/odtwarzanie-dna/
Podziękowanie
Autor dziękuje panu Maciejowi Miłostanowi za konsultację treści.
Fajnego masz bloga i ciekawe na nim treści czy na serwerze wszystko sie zmieści ? pięknie frazujesz słowa zmuszasz przy tym do myślenia tym komentarzem życzę powodzenia 🙂