Maturitní otázka č. 19 - teorie grafů

Popište základní pojmy z teorie grafů

Graf je nějaká množina vrcholů a množina hran, které spojují dvojice vrcholů; pokud neřekneme jinak, mezi každými dvěma vrcholy vede nejvýš jedna hrana a je jedno, kterým směrem a hrana nesmí mít oba konce ve stejném vrcholu;
podgraf nějakého grafu získáme tak, že z původního grafu odebereme některé vrcholy a některé hrany (určitě hrany vedoucí do odebraných vrcholů, možná ještě nějaké další);
stupeň určitého vrcholu je prostě počet hran, které z něj vedou;
graf je souvislý, pokud se z každého vrcholu dokážeme přes nějaké hrany dostat do každého jiného;
doplněk grafu je graf na stejných vrcholech, který má cesty právě tam, kde je ten původní neměl (doplněk doplňku je původní graf);
úplný graf je graf s určitým počtem vrcholů, kde mezi každými dvěma vede hrana; značíme jej písmenem K, např. na pěti vrcholech je to K₅;
prázdný graf jsou jen vrcholy bez hran (prázdný graf je doplněk úplného a naopak);
cesta je graf, ve kterém jsou vrcholy spojené hranami do jedné šňůrky a žádné další hrany tam nejsou;
taky známe sled, což je nějaká posloupnost navazujících hran (mohou se libovolně opakovat, tedy to není přímo graf);
kružnice je graf, ve kterém jsou vrcholy spojené hranami dokola a další hrany tam nejsou (pokud je graf neorientovaný, musí ale kružnice mít aspoň tři vrcholy);
strom je souvislý graf, který neobsahuje kružnice (žádná kružnice není jeho podgrafem); také je to nejmenší souvislý graf na daném počtu vrcholů (na N vrcholech má vždy N-1 hran);
les je graf, který neobsahuje kružnice (tedy hodně stromů);
kostra nějakého grafu je strom obsahující všechny jeho vrcholy (vyházíme všechny hrany na kružnicích);
graf může být ohodnocený, což obvykle znamená, že každé jeho hraně přiřadíme nějaké reálné číslo;
minimální kostra grafu je ze všech jeho možných koster taková, která má nejmenší součet ohodnocení na hranách;
v orientovaném grafu má každá hrana určený směr; je potom možné, aby mezi dvěma vrcholy vedly dvě hrany, pokud jsou opačným směrem; je také možné, aby hrana měla začátek a konec ve stejném vrcholu (takové hraně říkáme smyčka);
stupeň vrcholu v orientovaném grafu je počet hran, které vedou ven mínus počet hran, které vedou dovnitř (tyhle počty samy o sobě označujeme výstupní a vstupní stupeň);
cyklus v orientovaném grafu musí mít všechny hrany stejným směrem, jinak ho nepočítáme;
acyklický orientovaný graf je přesně to, co bychom čekali, tedy orientovaný graf bez kružnic (pozor, tentokrát se počítají i kružnice délky 1 nebo 2); v praxi se s nimi setkáváme tak často, že má smysl je přímo zmínit;
třešnička na závěr: graf je rovinný, když se dá nějak nakreslit na papír, aby se jeho hrany nekřížily; obecně rozhodnout o rovinnosti nějakého grafu a případně ho nakreslit sice některé algoritmy dokážou v lineárním čase, ale není to nic jednoduchého.

Vyjmenujte některé způsoby implementace grafu v programu

Graf je hodně obecná idea. Není vůbec jasně dané, jak ho v programu budeme chtít ukládat, a často hodně záleží na tom, který způsob zvolíme. Může to výrazně ovlivnit, jak rychle celý program poběží, a především nám vhodná reprezentace grafu může ušetřit práci. U každého algoritmu se budeme zvlášť věnovat tomu, jak nejlépe vyjádřit potřebný graf.

Nejjednodušší je pamatovat si u každého vrcholu seznam (tedy nejspíš pole) ostatních vrcholů, do kterých z něj vede hrana. Ve vyšších programovacích jazycích bude každý vrchol objekt a v poli bude mít přímo uložené vrcholy, do kterých z něj vede hrana. Krom toho se nám asi bude hodit jedno další pole, ve kterém budeme mít prostě uložené všechny vrcholy, abychom je mohli například jeden po druhém projít.

V nižších programovacích jazycích uděláme vlastně úplně totéž, až na to, že asi nemáme k ruce pole s proměnlivou velikostí. Bude se hodit si předem spočítat, kolik z každého vrcholu vede hran, abychom si u něj mohli alokovat pole správné velikosti. V tom poli budou tentokrát ukazatele na vrcholy, nebo jejich čísla. Rozmyslete si, jak to udělat, aby nám stačilo alokovat jen jedno velké pole na všechny vrcholy a sami pro sebe s ním zacházet jako se spoustou menších.

Když je v grafu hodně hran (mezi N vrcholy může být až (N²-N)/2 hran, a to je hodně), byl by tenhle způsob ukládání trochu neúčinný. Bude potom výrazně pohodlnější si udělat velké dvourozměrné pole (lidštěji: tabulku) N×N pravdivostních hodnot, kde každá hodnota určuje, jestli je mezi příslušnými vrcholy hrana. Tomuhle zápisu grafu se většinou říká matice sousednosti. Když je graf neorientovaný, buďto si zapisujeme každou hranu dvakrát, nebo použijeme z pole jen pravou horní půlku. Když je graf ohodnocený, můžeme si ke každé hraně rovnou psát číslo (a nějakou speciální hodnotou označit, když příslušná hrana v grafu není).

Důležité je, že některé (dynamické) způsoby vyjádření grafu nám umožňují jej za běhu měnit: přidávat a odebírat vrcholy, přidávat a odebírat hrany. Matice sousednosti snadno umožňuje přidávat a odebírat hrany, přidávat vrcholy je trochu těžší a odebírání je lepší se vyhnout. Mít seznam hran v každém vrcholu může snadno umožňovat všechny zmíněné operace, jak to jen dovoluje dotyčný seznam: napřříklad když použijeme pole proměnlivé délky či spojový seznam. Když graf upravovat za běhu nejde (museli bychom jej postavit celý znovu), hovoříme o statické implementaci grafu.

Za poznámku stojí, že občas graf používáme jen, abychom líp pochopili, jak nějaký algoritmus funguje. Někdy pak stačí si graf jen představovat a v paměti počítače může být něco naprosto jiného.

Minimální kostra grafu - popište na příkladě funkci algoritmu a naznačte programovou realizaci

Zadání úlohy je takové: dostaneme ohodnocený graf a máme najít jeho kostru (tedy strom obsahující všechny jeho vrcholy a některé z jeho hran), která bude mít co nejmenší součet ohodnocení na hranách. Jde to pochopitelně jenom v případě, že je ten zadaný graf souvislý - jinak z něj žádnou kostru neuděláme, protože kostra musí být souvislá a my nesmíme hrany přidávat.

Jarníkův algoritmus

Obecně řečeno: libovolně zvolíme počáteční vrchol a prohlásíme ho za strom o jednom vrcholu. Tenhle strom pak rozšiřujeme pokaždé o nejníže ohodnocenou hranu, která vede z některého jeho vrcholu ven (rozšiřujeme také o druhý vrchol této hrany, samozřejmě). Skončíme, když jsou ve stromu všechny vrcholy.

Dá se to naprogramovat docela přímo, kdy si pamatujeme hrany, které vedou ze stromu ven, a vždycky vybereme tu nejmenší. Rychlejší je použít jistý magický artefakt, který nejmenší hranu vždycky najde za nás - říkejme mu halda. Dáváme pozor, aby v haldě byly vždycky všechny hrany, které vedou ze stromu ven, a pak stačí v každém kroku haldu poprosit o tu nejmenší z nich.

Vybereme libovolný vrchol v, například první vrchol v poli. Označíme si jej jako navštívený.
Přidáme do haldy všechny hrany (v, *): všechny hrany vedoucí z vrcholu v.
Dokud je něco v haldě, opakujeme:
1. Vytáhneme z haldy nejmenší hranu, říkejme jí (a, b).
2. Pokud jsou oba vrcholy a, b navštívené, přeskočíme krok cyklu (tuhle hranu zahodíme a zkusíme vytáhnout nějakou jinou).
3. Jinak si můžeme být jistí, že jeden z vrcholů a, b navštívený není; řekněme, že je to a (jinak si je přehodíme).
4. Označíme a jako navštívený a poznamenáme si, že hrana (a, b) je ve výsledném stromu.
5. Přidáme do haldy všechny hrany (a, *).
Navrátíme všechny hrany, které jsme si označili, jako že jsou ve výsledném stromu.

Zatím jsme neřekli, jak graf nacpat do počítače. Je docela dobře vidět, že se nejčastěji ptáme grafu, "najdi všechny hrany kolem tohohle vrcholu." Nejlepší tedy bude mít graf uložený tak, že u každého vrcholu budeme mít seznam hran, které z něj vedou (to je první výše popsaný způsob). Navíc musíme mít u každého vrcholu uloženou pravdivostní hodnotu, jestli je navštívený, nebo ne.

Krom toho potřebujeme někam psát výstup; nejlepší bude připravit si pole N - 1 hodnot a hrany zapsat do něj. Každá položka pole bude jedna hrana a zapíšeme si ji prostě jako vrcholy, mezi kterými vede.

Jde to napsat mnoha jinými způsoby, ale tenhle mi připadá nejjednodušší na vysvětlení i programování (a není nijak výrazně pomalý).

Ostatní algoritmy

Podobný algoritmus vymyslel pan Borůvka. Zásadní rozdíl je v tom, že na začátku nevybíráme jeden vrchol, ale začneme pěstovat celý les, z každého vrcholu jeden strom. V průběhu stromy spojujeme, takže po každém kroku nám jich zůstane nejvýš polovina (kdybychom měli štěstí, najdeme takhle minimální kostru v jednom kroku; rozmyslete si nějaký graf, ve kterém se to stane).

Třetí známý algoritmus je Kruskalův (tenhle bohužel žádný český vědec včas nevymyslel). Funguje úplně jinak, ale také velmi jednoduše. Seřadíme všechny hrany podle ohodnocení od nejmenší a zkoušíme jednu po druhé přidávat; pokaždé se ujistíme, že bychom tím nevytvořili kružnici, jinak hranu zahodíme. Ačkoliv pracuje jinak, dává opět navlas stejný výsledek jako předchozí dva.

Poslední zajímavost je, že všechny zmíněné algoritmy (když je napíšeme pořádně) běží zhruba stejně rychle a ve všech si vystačíme s haldou. Jsou známy o trochu rychlejší algoritmy, ale docela jistě si s nimi nechceme komplikovat život - nejsou zdaleka tak hezky jednoduché.