20. 11. 2019  17:34 Félix
Akademický informačný systém

Prehľad vypísaných tém - Fakulta informatiky a informačných technológií


Základné údaje

Typ práce: Dizertačná práca
Názov témy: Dolovanie v texte a extrakcia informácií
Názov témy anglicky: Text mining and information extraction
Stav témy: schválené (prof. Ing. Pavol Návrat, PhD. - Predseda odborovej komisie)
Vedúci práce: doc. Ing. Marián Šimko, PhD.
Fakulta: Fakulta informatiky a informačných technológií
Garantujúce pracovisko: Ústav informatiky, informačných systémov a softvérového inžinierstva - FIIT
Max. počet študentov: --
Akademický rok:2019/2020
Navrhol: doc. Ing. Marián Šimko, PhD.
Anotácia: Nárast množstva dostupných informácií, podporovaný neustálym rozmachom webu, sa prirodzene odrazil do zvýraznenia aktuálnosti problému preťaženia informáciami. Je potrebné objavovať a vyvíjať nové prístupy spracovania textových dát do aplikácií umožňujúcich efektívnejšie a hodnotnejšie pristupovanie k informáciám (v širšom alebo užšom zmysle). Na význame naberajú metódy strojového učenia, štatistické spracovanie a v poslednej dobe aj aplikácie modelov neurónových sietí. Mnoho otázok týkajúcich sa spracovania textu zostáva stále otvorených. Je potrebné hľadať nové alebo vylepšovať existujúce modely reprezentujúce text ako aj relevantné informácie v ňom uchované, s prípadným zameraním na špecifiká rôznych domén. Je nevyhnutné skúmať nové a zlepšovať existujúce metódy dolovania v texte, spracovania prirodzeného jazyka či extrakcie informácií. Úskalím pritom môže byť charakter, kvalita alebo jazyk spracovávaného textu. Hľadanie nových poznatkov v rámci tejto výskumnej témy je ukotvené v praktických aplikáciách výskumných a priemyselných projektov. Aktuálnymi výskumnými výzvami sú analýza sentimentu, sumarizácia textu, detekcia falošných správ, detekcia antisociálneho správania, či extrakcia informácií z používateľmi vytváraného obsahu.
Anotácia anglicky: Increasing amount of available information, emphasized by incessant expansion of the Web, naturally accentuated the information overload problem. It is necessary to discover and develop new approaches to text data processing for applications allowing more efficient and valuable access to information (in both broader and narrower sense). Machine learning, statistical processing and recently also models of neural networks gain on importance, yet many questions regarding text processing remain unanswered. It is necessary to seek new or improve existing models representing text and information stored within, eventually focusing on domain specifics. It is inevitable to research new and improve existing methods for text mining, natural language processing or information extraction. Nature of the text being processed, its quality or language used may constitute potential pitfalls to deal with. Seeking for new knowledge within this research topic is rooted in practical applications of both research and industry projects. Current research challenges include sentiment analysis, text summarization, fake news detection, antisocial behaviour detection and information extraction from user generated content.



Obmedzenie k téme

Na prihlásenie riešiteľa na tému je potrebné splnenie jedného z nasledujúcich obmedzení

Obmedzenie podľa štúdia
Tabuľka zobrazuje obmedzenia podľa štúdia, na ktoré musí byť študent zapísaný, aby sa mohol na danú tému prihlásiť.

Program
D-IIS inteligentné informačné systémy
D-IISxA inteligentné informačné systémy (v anglickom jazyku)