14. 10. 2019  14:51 Boris
Akademický informačný systém

Záverečné práce


Základné informácie

Základné informácie o záverečnej práci

Typ práce: Bakalárska práca
Názov práce:Vyhľadávanie tematicky podobných dokumentov
Autor: Ing. Barbora Brocková
Pracovisko: Ústav informatiky, informačných systémov a softvérového inžinierstva (FIIT)
Vedúci práce: Ing. Tomáš Kučečka
Oponent:Mgr. Jozef Tvarožek, PhD.
Stav záverečnej práce:Záverečná práca bola úspešne obhájená


Doplňujúce informácie

Nasledujú doplňujúce informácie záverečnej práce. Kliknutím na odkaz s názvom jazyka vyberiete, v akom jazyku majú byť informácie zobrazené.

Jazyk spracovania záverečnej práce:slovenský jazyk

slovenský jazyk        anglický jazyk

Názov práce:Vyhľadávanie tematicky podobných dokumentov
Abstrakt:V súčasnosti nám vyhľadávacie nástroje ponúkajú vyhľadávanie tematicky podobných dokumentov metódou porovnávania kľúčových slov a frekventovaných množín. Možné je aj vyhľadávanie dokumentov na základe referencií, ktoré sa nachádzajú pri citovanom dokumente. Používateľ len klikne na odkaz s referenciami a zobrazí sa mu zoznam všetkých dokumentov, ktoré citujú vybraný dokument. V našej práci sme sa rozhodli porovnať dva prístupy pri vyhľadávaní tematicky podobných dokumentov -- na základe kľúčových slov a na základe referencií. Implementovali sme metódu porovnávania dokumentov na základe ich kľúčových slov a vypočítali podobnosti medzi dokumentmi. Pre dvojice dokumentov, v ktorých jeden dokument je citovaný druhým dokumentom, sme porovnali podobnosti s podobnosťami dokumentov v korpuse a zistili sme, že väčšina citovaných dokumentov sa nachádza medzi podobnejšími dokumentmi v korpuse. Ďalej sme skúmali ako na podobnosť dokumentov vplýva rozšírenie vlastného textu o text, ktorý ich cituje. Zistili sme, že citovaným dokumentom sa podobnosť zvýšila, ale necitujúcim sa mohla aj znížiť. Okrem vzájomnej podobnosti dokumentov, ktorá je počítaná ako kosínusová podobnosť, sme priradili dokumenty do zhlukov frekventovaných množín pomocou Apriori algoritmu. Dokumenty v rámci zhluku sme označili za podobné a zistili sme, že vo viacerých zhlukoch sa nachádzali dvojice citovaných aj citujúcich dokumentov.
Kľúčové slová:zhlukovanie, podobnosť, citácie

Zobrazenie a sťahovanie súborov

Pokiaľ chcete zobraziť zadanie záverečnej práce, kliknite na ikonu Zobraziť zadanie. Ikony Záverečná práca, Prílohy práce, Posudok vedúceho a Posudok oponenta predstavujú súbory týkajúce sa záverečnej práce, ktoré je možné stiahnuť. Budú zobrazené iba v prípade, že je súbor vložený a zároveň je verejný.

Zobraziť zadanie

Časti práce s odloženým zverejnením:

Záverečná práca (prílohy záverečnej práce) neobmedzene
Posudky záverečnej práce neobmedzene