13. 8. 2020  22:50 Ľubomír
Akademický informační systém

Přehled vypsaných témat - Fakulta informatiky a informačných technológií


Základní údaje

Typ práce:
Disertační práce
Název tématu:
Informatická podpora spracovania veľkých dát v biológii a medicíne
Název tématu anglicky:
Informatic support for processing of large data in biology and medicine
Stav tématu:
Vedoucí práce:
Fakulta:
Fakulta informatiky a informačných technológií
Garantující pracoviště: Ústav informatiky, informačných systémov a softvérového inžinierstva (FIIT)
Max. počet studentů:--
Akademický rok:
2020/2021
Navrhl:
prof. RNDr. Mária Lucká, PhD.
Anotace:
Veľký rozmach súčasných technológií má za následok rapídny nárast objemu biomedicínskych dát, či už sa jedná o dáta získané modernými sekvenovacími technológiami alebo o dáta získané pomocou prietokovej a hmotnostnej cytometrie. Kým v prvom prípade sa jedná o dátové množiny obsahujúce dôležité genetické informácie reprezentované zväčša reťazcami, cytometrické dáta majú podobu mnohodimenzionálnych dát. Keďže sa jedná o veľké dátové množiny, ich spracovanie klasickým spôsobom naráža na viaceré obmedzenia a tak prináša významné výzvy na hľadanie a tvorbu nových informatických nástrojov a modelov. Tieto musia byť schopné rýchlo vyhľadať a uchovať všetky podstatné informácie, minimalizovať objem uložených dát a zároveň zrýchliť čas spracovania. Ku klasickým metódam spracovania cytometrických dát patria metódy dolovania v dátach, zhlukovanie veľkých dát s rozdielnou hustotou, nemálo dôležitá je tiež vhodná grafická reprezentácia vysokodimenzionálnych dát. Spracovanie sekvenovacích dát obsahuje algoritmy na skladanie čítaní (readov), mapovanie sekvencií, vyhľadávanie vzorov a hľadanie podobných sekvencií, kompresiu údajov, viacnásobné zarovnávanie reťazcov, vyhľadávanie génov a iné. Dostupnosť genetických, cytometrických a klinických dát pacientov má potenciál aplikáciou vhodných metód predikovať klinický výsledok pacienta nájdením ich vzájomných závislostí. Súčasťou výskumu je návrh stabilných efektívnych metód a algoritmov s využitím vhodných paralelizačných nástrojov a techník.
Anotace anglicky:
The great boom of current technologies caused rapidly increase of volume of biomedical data, whether they come from modern sequencing technologies or they are gained by flow and mass cytometry. Whereas in the former case these large data sets contain important genetic information and have mostly the form of strings, the cytometry data is represented by large amount of high-dimensional data. Because in both cases the datasets are large, their processing in a classical way hits multiple constraints bringing so many significant challenges to find and create new IT tools and models. The new methods must be able to quickly find and store all the essential information, while minimizing the amount of stored data and speeding up the processing time. Classical methods of processing cytometry data include many data mining tools, clustering of large data with different density, proper graphical representation of big high-dimensional data and many others. The sequence data processing methods include for example reads assembling, sequence mapping, pattern matching, finding similar sequences, data compression, multiple string alignment, gene search, and many more. Moreover by applying appropriate methods the availability of patients' genetic, cytometry and clinical data has the potential to predict the clinical outcomes of the patient by finding hidden interdependencies. The research will include design of stable, efficient algorithms and methods with using appropriate parallelization tools and techniques.



Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení dle studia
Tabulka zobrazuje omezení dle studia, na které musí být student zapsán, aby se mohl na dané téma přihlásit.

Program
D-AI4xA aplikovaná informatika (v anglickom jazyku)
D-AI aplikovaná informatika
D-AI4 aplikovaná informatika
D-AIxA aplikovaná informatika (v anglickom jazyku)