May 24, 2019   11:37 a.m. Ela
Academic information system

Summary of topics offered - Faculty of Informatics and Information Technologies


Basic information

Type of work: Dissertation thesis
Topic: Informatická podpora spracovania veľkých dát v biológii a medicíne
Title of topic in English: Informatic support for processing of large data in biology and medicine
State of topic: approved (prof. RNDr. Otokar Grošek, PhD. - Chairperson of Departmental Board)
Thesis supervisor: prof. RNDr. Mária Lucká, PhD.
Faculty: Faculty of Informatics and Information Technologies
Supervising department: Institute of Informatics, Information Systems and Software Engineering - FIIT
Max. no. of students: --
Academic year:2019/2020
Proposed by: prof. RNDr. Mária Lucká, PhD.
Annotation: Veľký rozmach súčasných technológií má za následok rapídny nárast objemu biomedicínskych dát, či už sa jedná o dáta získané modernými sekvenovacími technológiami alebo o dáta získané pomocou prietokovej a hmotnostnej cytometrie. Kým v prvom prípade sa jedná o dátové množiny obsahujúce dôležité genetické informácie reprezentované zväčša reťazcami, cytometrické dáta majú podobu mnohodimenzionálnych dát. Keďže sa jedná o veľké dátové množiny, ich spracovanie klasickým spôsobom naráža na viaceré obmedzenia a tak prináša významné výzvy na hľadanie a tvorbu nových informatických nástrojov a modelov. Tieto musia byť schopné rýchlo vyhľadať a uchovať všetky podstatné informácie, minimalizovať objem uložených dát a zároveň zrýchliť čas spracovania. Ku klasickým metódam spracovania cytometrických dát patria metódy dolovania v dátach, zhlukovanie veľkých dát s rozdielnou hustotou, nemálo dôležitá je tiež vhodná grafická reprezentácia vysokodimenzionálnych dát. Spracovanie sekvenovacích dát obsahuje algoritmy na skladanie čítaní (readov), mapovanie sekvencií, vyhľadávanie vzorov a hľadanie podobných sekvencií, kompresiu údajov, viacnásobné zarovnávanie reťazcov, vyhľadávanie génov a iné. Dostupnosť genetických, cytometrických a klinických dát pacientov má potenciál aplikáciou vhodných metód predikovať klinický výsledok pacienta nájdením ich vzájomných závislostí. Súčasťou výskumu je návrh stabilných efektívnych metód a algoritmov s využitím vhodných paralelizačných nástrojov a techník.
Annotation in English: The great boom of current technologies caused rapidly increase of volume of biomedical data, whether they come from modern sequencing technologies or they are gained by flow and mass cytometry. Whereas in the former case these large data sets contain important genetic information and have mostly the form of strings, the cytometry data is represented by large amount of high-dimensional data. Because in both cases the datasets are large, their processing in a classical way hits multiple constraints bringing so many significant challenges to find and create new IT tools and models. The new methods must be able to quickly find and store all the essential information, while minimizing the amount of stored data and speeding up the processing time. Classical methods of processing cytometry data include many data mining tools, clustering of large data with different density, proper graphical representation of big high-dimensional data and many others. The sequence data processing methods include for example reads assembling, sequence mapping, pattern matching, finding similar sequences, data compression, multiple string alignment, gene search, and many more. Moreover by applying appropriate methods the availability of patients' genetic, cytometry and clinical data has the potential to predict the clinical outcomes of the patient by finding hidden interdependencies. The research will include design of stable, efficient algorithms and methods with using appropriate parallelization tools and techniques.



Limitations of the topic

To sign up for a topic it is necessary to fulfil one of the following restrictions

Limit to study programme
The table shows limitations of study programme, field, track the student has to be enrolled in to be able to register for a given topic.

ProgrammeTrackTrack
D-AI Applied Informatics -- not entered -- -- not entered --
D-AIxA Applied Informatics (study in English)-- not entered -- -- not entered --
D-AI4 Applied Informatics -- not entered -- -- not entered --
D-AI4xA Applied Informatics (study in English)-- not entered -- -- not entered --