19. 1. 2020  6:32 Drahomíra, Mário, Sára
Akademický informační systém

Zadání závěrečné práce – Ing. Ján Hesko – FEI I-API-MSUS pres [sem 4, roč 2]


Aplikace umožňuje zobrazit náhled zadání závěrečné práce. Zobrazení je pouze informativní a neodpovídá tiskovému výstupu.

Zadání závěrečné práce není kompletní. Chybí následující povinné položky:
     Název práce anglicky

 
Slovenská technická univerzita v Bratislave
Ústav informatiky a matematiky
 Fakulta elektrotechniky a informatiky
2015/2016
 
 

 
ZADANIE DIPLOMOVEJ PRÁCE

 

Autor práce:Bc. Ján Hesko
Študijný program:aplikovaná informatika
Študijný odbor: informatika
Evidenčné číslo:FEI-5384-8765
ID študenta:8765
Vedúci práce:Ing. Fedor Lehocki, PhD.
Miesto vypracovania:Ústav robotiky a kybernetiky
  
Názov práce:Porovnanie databázových technológií Apache Hive a IBM BigSQL bežiacich na Big data platforme Apache Hadoop
  
Jazyk, v ktorom sa práca vypracuje:slovenský jazyk
  
Špecifikácia zadania:Práca je zameraná na výber správnej databázovej technológie pracujúcej na platforme Hadoop. Daná platforma ponúka možnosť škálovania do tisícok serverov, ktoré umožňujú spracovávať petabajty dát. Možnosti ukladania štruktúrovaných dát je niekoľko a táto práca porovná jednotlivé technológie, ktoré poskytujú možnosti využitia štruktúrovaného jazyka SQL alebo jazyka podobného SQL.


Úlohy:
1. Oboznámte sa s problematikou Big Data spracovania a s technológiami využívajúcimi platformu Hadoop.
2. Analyzujte možnosti dátového modelovania a návrh klastrovania tabuliek.
3. Naštudujte možnosti presunu dát medzi štandardnými relačnými databázami a Big Data databázovými technológiami.
4. Porovnajte funkčné vlastnosti Big Data databáz - viac-užívateľské spracovanie dát, bezpečnostné možnosti, možnosti prístupu a presunu dát.
5. Otestujte výkonnosť pri použití rôznych typov ukladania, komprimácie a stĺpcových formátov. Otestujte výkonnosť pri použití technológií Apache Hive a IBM BigSQL.


Literatúra:
1. Y. Huang, X. Lan, X. Chen and W. Guo, "Towards Model Based Approach to Hadoop Deployment and Configuration," 2015 12th Web Information System and Application Conference (WISA), Jinan, 2015, pp. 79-84.
2. A. Fuad, A. Erwin and H. P. Ipung, "Processing performance on Apache Pig, Apache Hive and MySQL cluster," Information, Communication Technology and System (ICTS), 2014 International Conference on, Surabaya, 2014, pp. 297-302.
3. R. Lee, T. Luo, Y. Huai, F. Wang, Y. He and X. Zhang, "YSmart: Yet Another SQL-to-MapReduce Translator," Distributed Computing Systems (ICDCS), 2011 31st International Conference on, Minneapolis, MN, 2011, pp. 25-36.
4. Z. Liu, P. Yang and L. Zhang, "A Sketch of Big Data Technologies," 2013 Seventh International Conference on Internet Computing for Engineering and Science, Shanghai, 2013, pp. 26-29.
  
Dátum zadania:21. 09. 2015
  
Dátum odovzdania:20. 05. 2016



Ing. Ján Hesko
študent
 
 
 
 
prof. RNDr. Otokar Grošek, PhD.
vedúci pracoviska
 prof. Dr. Ing. Miloš Oravec
garant študijného programu