Portál AbcLinuxu, 12. říjen 2005 10:00

Tvorba databází v MySQL - I

20.3.2003 07:00 | David Hauzar

Články - Návody - Tvorba databází v MySQL - I

První část podrobného seriálu o MySQL. Základní pojmy, návrh databáze.

V tomto seriálu se dozvíte to nejdůležitější, co budete potřebovat k tvorbě dobře strukturovaných databází i jejich správě v MySQL. Ve výkladu je počítáno i s úplnými začátečníky. MySQL jsem vybral, protože je v podstatě zadarmo (pro podrobnější informace si přečtěte licenční ujednání na domovské adrese MySQL), je velmi rychlý a jeho správa je poměrně jednoduchá. Navíc pokud budete v budoucnu nuceni naučit se pracovat s jiným relačním databázovým systémem, znalosti získané studiem a používáním MySQL snadno využijete.

Základní pojmy

Databázový systém

Databázový systém se skládá z programu pro práci s databázemi a celé řady podpůrných programů. Databázový systém obstarává přístup k datům. Mezi nejznámější databázové systémy patří např. Oracle9i, Microsoft SQL Server nebo PostgreSQL.

Jazyk SQL

Jazyk SQL je dotazovací jazyk, který se používá k manipulaci s daty v databázích.

Databáze

Databáze v sobě uchovává strukturovaná data. Se strukturovanými daty se pracuje mnohem lépe, než s daty uloženými např. v souborech. Databázový systém vám navíc poskytne řadu funkcí pro manipulaci s daty.

Tabulky (objekty)

Databáze se skládá z tabulek (objektů). V tabulkách jsou uloženy informace, které spolu nějakým způsobem souvisí. Například v tabulce Hudebni_Alba budou informace o hudebních albech.

Sloupce (pole)

Ve sloupcích jsou popsány vlastnosti objektu. Objekt Hudebni_Albamůže mít sloupce Autor, Nazev_Alba, Cena.

Záznamy (řádky)

Záznamy jsou už konkrétní data uložená v databázi. Záznam v tabulce Hudebni_Alba by mohl vypadat třeba takto:

Doors, L. A. Woman, 450 nebo Queen, The Game, 600.

Tabulka (objekt)

Primární klíč

Primární klíč je sloupec, který jednoznačně identifikuje záznam. To znamená, že tento sloupec musí být u každého záznamu jiný.

Pokud by jste tedy v databázi chtěli mít alba o stejné ceně, nemohl by primární klíč být sloupec Cena. Za předpokladu, že by žádná skupina neměla album se stejným jménem jako jakékoli album jakékoli jiné skupiny, mohl by primární klíč být sloupec Jmeno_Alba. To ale vždy nemůžeme předpokládat, proto si vytvoříme nový sloupec ID_Alba. Ten bude muset mít vždy jinou hodnotu. Nejjednodušší je vkládat do tohoto sloupce číslo, které bude u každého dalšího záznamu o jedna větší, než u předchozího.(jak na to se dozvíte v některém z dalších dílů)

Primární klíč se používá k vytváření relací mezi tabulkami.

Relační databáze

Relační databáze se skládá z více objektů (tabulek). Některé z nich spolu mohou souviset - tvořit relaci. Máme-li například objekty Hudebni_Alba(ID_Alba, Autor, Nazev_Alba, Cena), Objednavky(ID_Objednavky, Datum_Objednavky, Mnozstvi, Produkt) objekty Hudebni_Alba a Objednavky spolu mohou souviset - sloupec Proudukt může být Hudebni_Album.

Rozlišujeme několik typů relací.

Relace 1:1

Mějme objekty Objednavky a Transakce(ID_Transakce, Datum_Transakce, Dopravce, Datum_odeslani). Tyto objekty spolu mohou vytvořit relaci 1:1. Každá objednávka může souviset pouze s jednou transakcí a každá transakce může souviset pouze s jednou objednávkou.

Relaci 1:1 mezi tabulkami vytvoříme tak, že do jednoho z objektů přidáme primární klíč souvisejícího objektu a ten označíme jako jedinečný(tj. v objektu do kterého vložím primární klíč souvisejícího objektu nebudou smět být záznamy se stejným primárním klíčem souvisejícího objektu).

Když je primární klíč nějakého objektu přidán do souvisejícího objektu, v souvisejícím objektu mu říkáme cizí klíč. To, zda-li přidáme v našem případě do objektuObjenavky primární klíč objektu Transakce nebo naopak záleží na nás. My vložíme primární klíč objektu Objednavkydo objektu Transakce. Objekt Transakce tedy bude vypadat takto Transakce(ID_Transakce, ID_Objednavky Datum_Transakce, Dopravce, Datum_Odeslani). Sloupec ID_Objednavky bude v objektu Objednavky primární klíč, kdežto v objektu Transakce to bude cizí klíč. Cizí klíč je vrelaci 1:1 jedinečný.

Relace 1:1 ve skutečnosti

Relace 1:1

Relace 1:N

Mějme objekty Objednavky a Zakaznici(ID_Zakaznika, Jmeno, Adresa, Mesto, PSC). Mezi objekty Objednavky a Zakaznici je relace 1:N. Jeden zákazník může mít více objednávek, ale každá objednávka přísluší pouze jednomu zákazníku.

Při relaci 1:1 byly oba objekty rovnocenné. V relaci 1:N je jeden objekt primární a druhý s ním související. Primární objekt obsahuje záznamy, jejichž jeden záznam odpovídá mnoha záznamům souvisejícího objektu. Relaci 1:N vytvoříme tak, že do souvisejícího objektu vložíme primární klíč primárního objektu. Primární klíč primárního objektu ale nebude v souvisejícím objektu jedinečný. Související objekt bude tedy obsahovat svůj primární klíč, který bude jedinečný, a cizí klíč, který bude moci obsahovat i duplicitní hodnoty.

V našem případě bude primární objekt objekt Zakaznici a související objekt bude objekt Objednavky. Objekt Objednavky bude tedy vypadat takto:

Objednavky(ID_Objednavky, ID_Zakaznika, Datum_Objednavky, Mnozstvi, Produkt).

Sloupec ID_Zakaznika nebude v objektu Objednavky označen jako jedinečný. Kdyby byl cizí klíč jedinečný, vytvořili bychom relaci 1:1!

Relace 1:N

Relace M:N

Relace M:N by mohla vzniknout mezi objekty Objednavky a Hudebni_Alba. Jedno hudební album může být ve více objednávkách a jedna objednávka může obsahovat více hudebních alb.

Relaci M:N si můžeme představit jako dvě relace 1:N. Potřebujeme, aby oba dva objekty byly primární. Abychom toho dosáhli, musíme vytvořit nový objekt Rozpis_Objednavek a vytvořit relaci 1:N mezi objekty Objednavky a Rozpis_Objednavek a dále mezi objekty Hudebni_Alba a Rozpis_Objednavek, kde objekty Objednavky a Hudebni_Alba budou primární objekty. Objekt Rozpis_Objednavek bude tedy obsahovat sloupce Rozpis_Objednavek(ID_Rozpisu_Objednavek, ID_Objednavky, ID_Alba), kde ID_Rozpisu_Objednavek bude primární klíč a ID_Objednavky,ID_Alba budou cizí klíče, které budou moci obsahovat duplicitní hodnoty.

Relace M:N

Realizace relace M:N

Normalizace databáze

Normalizace databáze je v podstatě souhrn pravidel, které nám pomáhají vytvářet správné objekty, které obsahují správná pole. Normalizace také usnadňuje pochopení vzájemných vazeb (relací) mezi objekty.

Existují 3 běžně používané stupně normalizace. Jsou uspořádány vzestupně podle úrovně uspořádání.

První normalizovaná forma (1NF)

Pravidlo 1NF říká, že všechny objekty obsahující opakující se sloupce je třeba rozdělit do nových objektů.

V nerelační databázi bychom vytvořili objekt Zakaznici, který by obsahoval veškerá data týkající se zákazníků. Objekt Zakaznici by mohl vypadat třeba takto:

Zakaznici(ID_Zakaznika, Jmeno, Adresa, Mesto, PSC, Produkt_Cena, Produkt_Nazev, Produkt_Cena, Produkt_Nazev2, Produkt_Cena2, Objednavka_Datum, Objednavka_Mnozstvi, Dodavatel_Nazev).

Sloupce vztahující se k produktům budou zcela jistě obsahovat duplicitní hodnoty. Proto podle pravidla 1NF musíme objekt Zakaznici rozbít a sloupce s duplicitními položkami umístit do samostatného objektu. Nový objekt nazveme Produkty. Mezi objekty Zakaznici a Produkty vytvoříme relaci 1:N, kde zákazníci bude primární objekt.

Objekty normalizované na úroveň 1NF budou tedy vypadat takto:

Zakaznici(ID_Zakaznika, Jmeno, Adresa, Mesto, PSC, Objednavka_Datum, Objednavka_Mnozstvi, Dodavatel_Nazev) Produkty(ID_Produktu, ID_Zakaznika, Produkt_Nazev, Produkt_Cena)

Nyní, když je databáze normalizovaná na úroveň 1NF, je mnohem snažší jak vyhledávání informací v databázi, tak přidávání nových položek do databáze.

Druhá normalizovaná forma (2NF)

Pravidlo 2NF říká, že všechny objekty obsahující sloupce s duplicitními položkami, které mezi sebou vytvářejí částečné závislosti, je třeba rozdělit do objektů nových, v nichž bude každý záznam uložen pouze jednou.

Každý záznam v objektu Zakaznici obsahuje informace o objednávce. Jestliže si zákazníci budou objednávat pouze jeden druh zboží, bude vše vpořádku. Jestliže si ale objednají více druhů zboží, bude se muset pro každý druh objednaného zboží vytvořit nový záznam v objektu Zakaznici. Lepší by bylo vytvořit nový objekt Objednavky a mezi objekty Produkty a Objednavky vytvořit relaci M:N. K tomu ale potřebujeme vytvořit nový objekt Rozpis_Objednavek.

Objekty budou tedy vypadat takto:

Zakaznici(ID_Zakaznika, Jmeno, Adresa, Mesto, PSC), Objednavky(ID_Zakaznika, ID_Objednavky, Objednavka_Datum, Objednavka_Mnozstvi, Dodavatel_Nazev), Rozpis_Objednavek(ID_Rozpisu, ID_Pruduktu, ID_Objednavky), Produkty(ID_Produktu, Produkt_Nazev, Produkt_Cena).

A to už je něco jiného. Nyní jsme se můžeme doslova kochat výhodami relační databáze. Můžeme do databáze přidávat zákazníky, bez toho, aby to mělo negativní dopad na ostatní objekty.

Třetí normalizovaná forma (3NF)

Pravidlo třetí normalizované formy vyžaduje důsledné odstranění a oddělení veškerých dat, která nejsou v přímém vztahu s daným objektem.

Objekt Objednavky obsahuje sloupec Dodavatel_Nazev. Tento sloupec ale přímo nesouvisí s daným objektem Objednavky (nepopisuje žádnou jeho vlastnost). Podle pravidel 3NF je nutné tento sloupec vyčlenit do nového objektu. Vytvoříme proto nový objekt Dodavatele a mezi objekty Objednavky a Dodavatele vytvoříme relaci 1:1.

Objekty naší databáze normalizované na úroveň 3NF budou vypadat takto:

Zakaznici(ID_Zakaznika, Jmeno, Adresa, Mesto, PSC), Objednavky(ID_Zakaznika, ID_Objednavky, Objednavka_Datum, Objednavka_Mnozstvi), Dodavatele(ID_Dodavatele, ID_Objednavky), Rozpis_Objednavek(ID_Rozpisu, ID_Pruduktu, ID_Objednavky), Produkty(ID_Produktu, Produkt_Nazev, Produkt_Cena).

Nyní naše databáze vyhovuje pravidlům 3NF. Tento typ normalizace poskytuje maximální pružnost (stejně jako 2NF) a navíc předchází vzniku logických chyb. Každý sloupec objektu přímo souvisí s daným objektem a je proto jednoznačně identifikován primárním klíčem daného objektu.

Kam až normalizovat?

To záleží na konkrétní databázi. Normalizace je tu proto, aby udělala databázi přehlednější, lépe rozšiřitelnou a výkonnější. Je proto zbytečné normalizovat, když normalizace nepřinese zvýšení přehlednosti, rozšiřitelnosti nebo výkonu. Zbytečně velký počet objektů může naopak udělat databázi nepřehlednou.

Jako příklad zbytečné normalizace uvedu toto: Máme objekt Zakaznici(ID_Zakaznika, Jmeno, Adresa1, Adresa2). Podle pravidel 1NF bychom měli informace o adrese z objektu Zakaznici odstranit, vytvořit nový objekt Adresy a mezi těmito objekty vytvořit relaci M:N - 1 zákazník může mít více adres a 1 adresa může příslušet více zákazníkům (spolubydlící). Musíme tedy vytvořit nový objekt Rozpis_Adres.

Objekty by vypadaly takto:

Zakaznici(ID_Zakaznika, Jmeno) Rozpis_Adres(ID_Rozpisu_Adres, ID_Zakaznika, ID_Adresy) Adresy(ID_Adresy).

Teď databáze odpovídá standardům normalizace, ale kde je přehlednost?

Návrh databáze

Proces návrhu databáze se skládá z následujících kroků.

Definice aplikačního procesu

Definice aplikačního procesu je posloupnost kroků, které vedou ke splnění určitého cíle.

Například Aplikační proces internetového obchodu by mohl vypadat takto:

Zákazník si vybere produkty, které si u vás chce zakoupit -> bude ověřeno, zda je uživatel přihlášen, jestliže ne, musí se přihlásit popřípadě zaregistrovat -> bude odeslána zpráva,která bude obsahovat zákazníkovu objednávku -> pracovníci expedice zabalí objednávku, ověří adresu příjemce a poštou odešlou objednávku zákazníkovi

Definice aplikačních objektů

Aplikační objekty obsahují informace, které chcete v databázi uchovávat. Většinou obsahují klíčové informace, které jsou pro uskutečnění dané operace nezbytné. Aplikační objekt je například produkt nebo zákazník. Dále musímevytvořit sloupce objektů.

Definice aplikačních pravidel (aplikační logiky)

Aplikační pravidla jsou pravidla, kterými se koncová aplikace bude řídit.

Uvedu několik příkladů:

Internetový obchod musí uživatelům umožňovat vyhledávání produktů
Uživatelům by mělo být umožněno zobrazení všech jejich transakcí
Nelze vykonávat záporné transakce
Vždy, když objednávka vyhovuje požadavkům zpracování, mělo by dojít k odeslání objednávky...

Rozlišujeme dva typy aplikačních pravidel. Předpokládaná aplikační pravidla a platná aplikační pravidla. Předpokládané aplikační pravidlo by mohlo být, že každý zákazník má jméno, nebo že má adresu. Platné pravidlo je pravidlo vynucené konkrétní implementací. Tak například, že objednávka může obsahovat víc produktů.

Modelování databáze

Modelování databáze je nakreslení si všech objektů a jejich sloupců. Dále by jste měli stanovit datové typy sloupců a stanovit, zda-li budou jednotlivé sloupce v databázi vyžadovaná.

Normalizace databáze a vytvoření relací mezi objekty

Tyto dvě činnosti mezi sebou do značné míry souvisí. Na normalizaci by jste měli myslet už při modelování databáze, ale často se vám může stát, že při vytváření relací zjistíte, že vaše databáze není dostatečně normalizovaná.

Při vytváření relací musíte nejprve určit, jestli mezi objekty existuje nějaký vztah a pak určit jaký.

Závěr

Tak a to je všechno. V prvním díle jste se naučili základní databázové pojmy, víte, co to jsou relační databáze, umíte normalizovat a měli by jste být schopni správně strukturovanou databázi vymodelovat.

Příští díl bude podstatně méně teoretický. Napřed si v rychlosti připomeneme výhody MySQL a dále se naučíte MySQL používat.

Odkazy a zdroje

mysql.com

Další články z této rubriky

Cesta do hlubin kompilace jádra - 2 (Hardware)
Převod filmu na DVD
Cesta do hlubin kompilace jádra - 1
Rukověť baliče RPM 15 - XV (Závěr)
Rukověť baliče RPM - XIV (Přizpůsobení)