22. 10. 2019  11:09 Sergej
Akademický informační systém

Závěrečné práce


Základní informace

Základní informace o závěrečné práci

Typ práce: Bakalářská práce
Název práce:Vyhľadávanie tematicky podobných dokumentov
Autor: Ing. Barbora Brocková
Pracoviště: Ústav informatiky, informačných systémov a softvérového inžinierstva (FIIT)
Vedoucí práce: Ing. Tomáš Kučečka
Oponent:Mgr. Jozef Tvarožek, PhD.
Stav závěrečné práce:Závěrečná práce byla úspěšně obhájena


Doplňující informace

Následují doplňující informace závěrečné práce. Kliknutím na odkaz s názvem jazyka zvolíte, v jakém jazyce mají být informace zobrazeny.

Jazyk zpracování závěrečné práce:slovenský jazyk

slovenský jazyk        anglický jazyk

Název práce:Vyhľadávanie tematicky podobných dokumentov
Abstrakt:V súčasnosti nám vyhľadávacie nástroje ponúkajú vyhľadávanie tematicky podobných dokumentov metódou porovnávania kľúčových slov a frekventovaných množín. Možné je aj vyhľadávanie dokumentov na základe referencií, ktoré sa nachádzajú pri citovanom dokumente. Používateľ len klikne na odkaz s referenciami a zobrazí sa mu zoznam všetkých dokumentov, ktoré citujú vybraný dokument. V našej práci sme sa rozhodli porovnať dva prístupy pri vyhľadávaní tematicky podobných dokumentov -- na základe kľúčových slov a na základe referencií. Implementovali sme metódu porovnávania dokumentov na základe ich kľúčových slov a vypočítali podobnosti medzi dokumentmi. Pre dvojice dokumentov, v ktorých jeden dokument je citovaný druhým dokumentom, sme porovnali podobnosti s podobnosťami dokumentov v korpuse a zistili sme, že väčšina citovaných dokumentov sa nachádza medzi podobnejšími dokumentmi v korpuse. Ďalej sme skúmali ako na podobnosť dokumentov vplýva rozšírenie vlastného textu o text, ktorý ich cituje. Zistili sme, že citovaným dokumentom sa podobnosť zvýšila, ale necitujúcim sa mohla aj znížiť. Okrem vzájomnej podobnosti dokumentov, ktorá je počítaná ako kosínusová podobnosť, sme priradili dokumenty do zhlukov frekventovaných množín pomocou Apriori algoritmu. Dokumenty v rámci zhluku sme označili za podobné a zistili sme, že vo viacerých zhlukoch sa nachádzali dvojice citovaných aj citujúcich dokumentov.
Klíčová slova:zhlukovanie, podobnosť, citácie

Zobrazení a stahování souborů

Pokud chcete zobrazit zadání závěrečné práce, klikněte na ikonu Zobrazit zadání. Ikony Závěrečná práce, Přílohy práce, Posudek vedoucího a Posudek oponenta představují soubory týkající se závěrečné práce, které je možné stáhnout. Budou zobrazeny pouze v případě, že je soubor vložen a zároveň je veřejný.

Zobrazit zadání

Části práce s odloženým zveřejněním:

Závěrečná práce (přílohy závěrečné práce) neomezeně
Posudky závěrečné práce neomezeně