May 20, 2019   12:54 p.m. Bernard
Academic information system

Summary of topics offered - Faculty of Informatics and Information Technologies


Basic information

Type of work: Dissertation thesis
Topic: Dolovanie v texte a extrakcia informácií
Title of topic in English: Text mining and information extraction
State of topic: approved (prof. Ing. Pavol Návrat, PhD. - Chairperson of Departmental Board)
Thesis supervisor: doc. Ing. Marián Šimko, PhD.
Faculty: Faculty of Informatics and Information Technologies
Supervising department: Institute of Informatics, Information Systems and Software Engineering - FIIT
Max. no. of students: --
Academic year:2019/2020
Proposed by: doc. Ing. Marián Šimko, PhD.
Annotation: Nárast množstva dostupných informácií, podporovaný neustálym rozmachom webu, sa prirodzene odrazil do zvýraznenia aktuálnosti problému preťaženia informáciami. Je potrebné objavovať a vyvíjať nové prístupy spracovania textových dát do aplikácií umožňujúcich efektívnejšie a hodnotnejšie pristupovanie k informáciám (v širšom alebo užšom zmysle). Na význame naberajú metódy strojového učenia, štatistické spracovanie a v poslednej dobe aj aplikácie modelov neurónových sietí. Mnoho otázok týkajúcich sa spracovania textu zostáva stále otvorených. Je potrebné hľadať nové alebo vylepšovať existujúce modely reprezentujúce text ako aj relevantné informácie v ňom uchované, s prípadným zameraním na špecifiká rôznych domén. Je nevyhnutné skúmať nové a zlepšovať existujúce metódy dolovania v texte, spracovania prirodzeného jazyka či extrakcie informácií. Úskalím pritom môže byť charakter, kvalita alebo jazyk spracovávaného textu. Hľadanie nových poznatkov v rámci tejto výskumnej témy je ukotvené v praktických aplikáciách výskumných a priemyselných projektov. Aktuálnymi výskumnými výzvami sú analýza sentimentu, sumarizácia textu, detekcia falošných správ, detekcia antisociálneho správania, či extrakcia informácií z používateľmi vytváraného obsahu.
Annotation in English: Increasing amount of available information, emphasized by incessant expansion of the Web, naturally accentuated the information overload problem. It is necessary to discover and develop new approaches to text data processing for applications allowing more efficient and valuable access to information (in both broader and narrower sense). Machine learning, statistical processing and recently also models of neural networks gain on importance, yet many questions regarding text processing remain unanswered. It is necessary to seek new or improve existing models representing text and information stored within, eventually focusing on domain specifics. It is inevitable to research new and improve existing methods for text mining, natural language processing or information extraction. Nature of the text being processed, its quality or language used may constitute potential pitfalls to deal with. Seeking for new knowledge within this research topic is rooted in practical applications of both research and industry projects. Current research challenges include sentiment analysis, text summarization, fake news detection, antisocial behaviour detection and information extraction from user generated content.



Limitations of the topic

To sign up for a topic it is necessary to fulfil one of the following restrictions

Limit to study programme
The table shows limitations of study programme, field, track the student has to be enrolled in to be able to register for a given topic.

ProgrammeTrackTrack
D-IIS Intelligent Information Systems-- not entered -- -- not entered --
D-IISxA Intelligent Information Systems (study in English)-- not entered -- -- not entered --