Získávání znalostí z databází

Zkratka předmětu KMI/ZZD
Název předmětu Získávání znalostí z databází
Akademický rok 2019/2020
Pracoviště / Zkratka KMI/ZZD
Název Získávání znalostí z databází
Akreditováno/Kredity Ano/6
Rozsah hodin Přednáška 2 HOD/TYD Cvičení 2 HOD/TYD
Vyučovací jazyk čeština
Nahrazovaný předmět
Vyloučené předměty
Podmiňující
Způsob zakončení Zkouška
Forma zakončení Kombinovaná
Zápočet před zkouškou Ano
Vyučovaný semestr ZimníLetní
Cíle předmětu (anotace)

Cílem je uvést studenty do problematiky získávání znalostí z databází, jejich využívání. Kurz zahrnuje též práci s jednoduchými db aplikacemi. Studenti se seznámí se základními pojmy z oblasti data miningu, OLAP a datových skladů, získají přehled o vybraných analytických metodách. Jednotlivé etapy procesu dobývání dat budou objasněny na jednoduchých příkladech a předvedeny pomocí open-source softwarových nástrojů jako je např. R, Rapid Miner, MySQL, Weka.

Požadavky na studenta

Požadavky na studenty:
Ověření nabytých znalostí bude realizováno prostřednictvím 2 testů. Jednoho zápočtového a jednoho zkouškového testu (oba písemné).

Obsah

1. Úvod do data miningu.
2. Datové zdroje. Relační DB. OLAP. Datové sklady. Příprava dat
3. Statistické metody uplatnitelné v DM
4. Strojové učení. Rozhodovací stromy
5. Asociační pravidla. Rozhodovací pravidla
6. Shluková analýza - různé metody a přístupy
7. Hodnocení modelů, kombinace modelů, bagging, boosting
8. Jazyk SQL - pokročilé dotazy, objektově relační mapování
9. Použití uložených procedur, trigerů
10. Data wrangling, tidying
11. Řešení jednoduchých dm úloh. Zobrazení dat prostřednictvím formulářů a tabulek
12. Vytváření jednoduchých aplikací

Předpoklady - další informace k podmíněnosti studia předmětu

Prerekvizita: KMI/DBS1 Databázové systémy, KMI/TPS2 nebo KMI/TPS2A Teorie pravděpodobnosti a statistika 2

Získané způsobilosti

Student si osvojí znalosti nutné pro používání nástrojů pro dolování dat. Student bude znát vybrané teoretické základy data miningu, ale také vědět, jak je aplikovat v praxi.

Garanti a vyučující
  • Garanti: Ing. Michael Rost, Ph.D.
  • Přednášející: Ing. Michael Rost, Ph.D.
  • Cvičící: Ing. Michael Rost, Ph.D.
Literatura
  • Hendl, J. Přehled statistických metod zpracování dat. Praha: Portál, 2006. ISBN 80-7367-123-9.
  • Weka 3. Data Mining Software in Java [online]. 1998.
  • Humphries, M., Hawkins, W.,M., Dy. M.C. Data warehousing Návrh a implementace. Computer Press, 2002. ISBN 8072265601. Computer Press, 2002. ISBN 8072265601.
  • LACKO, M. Databáze: datové sklady, OLAP a dolování dat. Computer Press, 2003. ISBN 80-7226-969-0. Computer Press, 2003. ISBN 80-7226-969-0.
  • Berka, P. Dobývání znalostí z databází. Praha: Academia, 2003. ISBN 80-200-1062-9.
  • Venables, W., N., Ripley, B.D. Modern Applied Statistics with S. New York : 4th ed, 2002. ISBN 0-387-95457-0.
  • Anděl, J. Statistické metody 3. vyd., Praha, Marfyzpress.2003.ISBN 80-86732-08-8.
Vyučovací metody

Monologická (výklad, přednáška, instruktáž), Demonstrace, E-learning

Hodnotící metody

Kombinovaná zkouška, Seminární práce

Stáhnout jako PDF