25. 1. 2020  10:26 Gejza
Akademický informační systém

Přehled vypsaných témat - Fakulta informatiky a informačných technológií


Základní údaje

Typ práce: Disertační práce
Název tématu: Dolovanie v texte a extrakcia informácií
Název tématu anglicky: Text mining and information extraction
Stav tématu: schváleno (prof. Ing. Gregor Rozinaj, PhD. - Předseda oborové rady)
Vedoucí práce: doc. Ing. Marián Šimko, PhD.
Fakulta: Fakulta informatiky a informačných technológií
Garantující pracoviště: Ústav informatiky, informačných systémov a softvérového inžinierstva (FIIT)
Max. počet studentů: --
Akademický rok:2019/2020
Navrhl: doc. Ing. Marián Šimko, PhD.
Anotace: Nárast množstva dostupných informácií, podporovaný neustálym rozmachom webu, sa prirodzene odrazil do zvýraznenia aktuálnosti problému preťaženia informáciami. Je potrebné objavovať a vyvíjať nové prístupy spracovania textových dát do aplikácií umožňujúcich efektívnejšie a hodnotnejšie pristupovanie k informáciám (v širšom alebo užšom zmysle). Na význame naberajú metódy strojového učenia, štatistické spracovanie a v poslednej dobe aj aplikácie modelov neurónových sietí. Mnoho otázok týkajúcich sa spracovania textu zostáva stále otvorených. Je potrebné hľadať nové alebo vylepšovať existujúce modely reprezentujúce text ako aj relevantné informácie v ňom uchované, s prípadným zameraním na špecifiká rôznych domén. Je nevyhnutné skúmať nové a zlepšovať existujúce metódy dolovania v texte, spracovania prirodzeného jazyka či extrakcie informácií. Úskalím pritom môže byť charakter, kvalita alebo jazyk spracovávaného textu. Hľadanie nových poznatkov v rámci tejto výskumnej témy je ukotvené v praktických aplikáciách výskumných a priemyselných projektov. Aktuálnymi výskumnými výzvami sú analýza sentimentu, sumarizácia textu, detekcia falošných správ, detekcia antisociálneho správania, či extrakcia informácií z používateľmi vytváraného obsahu.
Anotace anglicky: Increasing amount of available information, emphasized by incessant expansion of the Web, naturally accentuated the information overload problem. It is necessary to discover and develop new approaches to text data processing for applications allowing more efficient and valuable access to information (in both broader and narrower sense). Machine learning, statistical processing and recently also models of neural networks gain on importance, yet many questions regarding text processing remain unanswered. It is necessary to seek new or improve existing models representing text and information stored within, eventually focusing on domain specifics. It is inevitable to research new and improve existing methods for text mining, natural language processing or information extraction. Nature of the text being processed, its quality or language used may constitute potential pitfalls to deal with. Seeking for new knowledge within this research topic is rooted in practical applications of both research and industry projects. Current research challenges include sentiment analysis, text summarization, fake news detection, antisocial behaviour detection and information extraction from user generated content.



Omezení k tématu

K přihlášení řešitele na téma je potřeba splnění jednoho z následujících omezení

Omezení dle studia
Tabulka zobrazuje omezení dle studia, na které musí být student zapsán, aby se mohl na dané téma přihlásit.

Program
D-IIS inteligentné informačné systémy
D-IISxA inteligentné informačné systémy (v anglickom jazyku)