Vyhledávání, řazení, složitost IB111 Úvod do programování skrze Python 2014 1 / 48 Otrávené studny 8 studen, jedna z nich je otrávená laboratorní rozbor dokáže rozpoznat přítomnost jedu ve vodě je drahý kolik rozborů potřebujeme? jak určit otrávenou studnu? 2 / 48 Otrávené studny II 8 studen, jedna z nich je otrávená laboratorní rozbor dokáže rozpoznat přítomnost jedu ve vodě je drahý je časově náročný (1 den) jak určit otrávenou studnu za 1 den pomocí 3 paralelních rozborů? 3 / 48 Otrávené studny: řešení Řešení s využitím binárních čísel studna kód studna kód A 000 E 100 B 001 F 101 C 010 G 110 D 011 H 111 test přidělené studny 1 B, D, F, H 2 C, D, G, H 3 E, F, G, H 4 / 48 Vyhledávání: hra Myslím si přirozené číslo X mezi 1 a 1000. Povolená otázka: „Je X menší než N? Kolik otázek potřebujete na odhalení čísla? Kolik předem formulovaných otázek potřebujete? Mezi kolika čísly jste schopni odhalit skryté číslo na K otázek? 5 / 48 Vyhledávání: řešení „dynamické otázky : půlení intervalu „předem formulované otázky : dotazy na bity v bitovém zápisu (stejně jako u studen) N čísel: potřebujeme log2 N otázek K otázek: rozlišíme mezi 2K čísly 6 / 48 Připomenutí: logaritmus x = by ⇔ y = logb(x) log10(1000) = 3 log2(16) = 4 log2(1024) = 10 logb(xy) = logb(x) + logb(y) http://www.khanacademy.org/math/algebra/logarithms http://khanovaskola.cz/logaritmy/uvod-do-logaritmu 7 / 48 Logaritmus – graf 8 / 48 Logaritmus – test log3(81) = ? log2(2) = ? log5(1) = ? log10(0.1) = ? log2( √ 2) = ? log0.5(4) = ? 9 / 48 Vyhledávání: motivace vyhledávání v (připravených) datech je velmi častý problém: web slovník informační systémy dílčí krok v algoritmech 10 / 48 Vyhledávání: konkrétní problém vstup: seřazená posloupnost čísel + dotaz (číslo) např. 2, 3, 7, 8, 9, 14 + dotaz 8 výstup: pravdivostní hodnota (True/False) – přítomnost prvku v seznamu příp. index hledaného čísla v posloupnosti (případně -1 pokud tam není); výsledek příkladu: 3 (číslování od nuly) 11 / 48 Vyhledávání a logaritmus naivní metoda = průchod seznamu lineární vyhledávání, O(n) pomalé (viz např. databáze s milióny záznamů) jen velmi krátké seznamy základní rozumná metoda = půlení intervalu logaritmický počet kroků (vzhledem k délce seznamu), O(log(n)) 12 / 48 Vyhledávání: půlení intervalu binární vyhledávání podobné jako: hra s hádáním čísel, aproximace odmocniny podíváme se na prostřední člen ⇒ podle jeho hodnoty pokračujeme v levém/pravém intervalu udržujeme si „horní mez a „spodní mez 13 / 48 Vyhledávání: program def binarni_vyhledavani(hodnota, seznam): spodni_mez = 0 horni_mez = len(seznam) - 1 while spodni_mez <= horni_mez: stred = (spodni_mez + horni_mez) / 2 if seznam[stred] == hodnota: return True elif seznam[stred] > hodnota: horni_mez = stred - 1 else: spodni_mez = stred + 1 return False 14 / 48 Vyhledávání: rekurzivní varianta def binarni_vyhledavani(hodnota, seznam, spodni_mez, horni_mez): if spodni_mez > horni_mez: return False stred = (spodni_mez + horni_mez)/2 if seznam[stred] < hodnota: return binarni_vyhledavani(hodnota, seznam, stred+1, horni_mez) elif seznam[stred] > hodnota: return binarni_vyhledavani(hodnota, seznam, spodni_mez, stred-1) else: return True 15 / 48 Vyhledávání, přidávání, ubírání seřazený seznam – rychlé vyhledávání, ale pomalé přidávání prvků rychlé vyhledávání, přidávání i ubírání prvků – datová struktura slovník; vyhledávací stromy, hašovací tabulky více později / v IB002 16 / 48 Řadicí algoritmy: terminologická poznámka anglicky „sorting algorithm česky používáno: řadicí algoritmy nebo třídicí algoritmy řadicí vesměs považováno za „správnější 17 / 48 Řadicí algoritmy: komentář mnoho různých algoritmů pro stejný účel většina programovacích jazyků má vestavěnou podporu (funkce sort()) Proč se tím tedy zabýváme? 18 / 48 Řadicí algoritmy: komentář Proč se tím tedy zabýváme? 1 ukázka programů se seznamy 2 ilustrace algoritmického myšlení, technik návrhu algoritmů 3 typický příklad drobné změny algoritmu s velkým dopadem na rychlost programu 4 hezky se to vizualizuje a vysvětluje 5 tradice, patří to ke vzdělání informatika 6 občas se to může i hodit 19 / 48 Doporučené zdroje http://www.sorting-algorithms.com/ animace kódy vizualizace http://sorting.at/ elegantní animace více podobných: Google → sorting algorithms A na zpestření: http://www.youtube.com/watch?v=lyZQPjUT5B4 20 / 48 Řadicí algoritmy: problém vstup: posloupnost (přirozených) čísel např. 8, 2, 14, 3, 7, 9 výstup: seřazená posloupnost např. 2, 3, 7, 8, 9, 14 pozn. většina zmíněných algoritmů aplikovatená nejen na čísla na „cokoliv, co umíme porovnávat 21 / 48 Pokus č. 1 zkoušíme systematicky všechna možná uspořádání prvků pro každé z nich ověříme, zda jsou prvky korektně uspořádány je to dobrý algoritmus? 22 / 48 Co vy na to? zkuste vymyslet řadicí algoritmus co nejvíce různých principů co nejefektivnější algoritmus možná inspirace: jak řadíte karty? 23 / 48 Složitost n – délka vstupní posloupnosti počet operací jednoduché algoritmy O(n2 ), „kvadratická složitější algoritmy O(n log(n)) Zde: základní myšlenka algoritmů a složitost intuitivně, důkladněji v IB002. 24 / 48 Bublinkové řazení (Bubble sort) „probublávání vyšších hodnot nahoru srovnávání a prohazování sousedů po i iteracích je nejvyšších i členů na svém místě 25 / 48 Bublinkové řazení: program def bublinkove_razeni(a): n = len(a) for i in range(n): for j in range(n-i-1): if a[j] > a[j+1]: tmp = a[j] a[j] = a[j+1] a[j+1] = tmp invariant cyklu: a[n-i-1:] ve finální pozici 26 / 48 Bublinkové řazení: příklad běhu [8, 2, 7, 14, 3, 1] [2, 7, 8, 3, 1, 14] [2, 7, 3, 1, 8, 14] [2, 3, 1, 7, 8, 14] [2, 1, 3, 7, 8, 14] [1, 2, 3, 7, 8, 14] 27 / 48 Implementační detail: prohazování prvků prohození hodnot dvou proměnných a, b na slidech psáno „běžným způsobem pomocí pomocné proměnné: t = a; a = b; b = t Python umožňuje zápis: a, b = b, a 28 / 48 Řazení výběrem (Select sort) řazení výběrem projdeme dosud neseřazenou část seznamu a vybereme nejmenší prvek nejmenší prvek zařadíme na aktuální pozici (výměnou) 29 / 48 Řazení výběrem: program def razeni_vyberem(a): for i in range(len(a)): vybrany = i for j in range(i+1, len(a)): if a[j] < a[vybrany]: vybrany = j tmp = a[i] a[i] = a[vybrany] a[vybrany] = tmp 30 / 48 Řazení vkládáním (Insert sort) podobně jako „řazení karet prefix seznamu udržujeme seřazený každou další hodnotu zařadíme tam, kam patří 31 / 48 Řazení vkládáním: program def razeni_vkladanim(a): for i in range(1,len(a)): aktualni = a[i] j = i while j > 0 and a[j-1] > aktualni: a[j] = a[j-1] j -= 1 a[j] = aktualni 32 / 48 Quicksort rekurzivní algoritmus vybereme „pivota a seznam rozdělíme na dvě části: větší než pivot menší než pivot obě části pak nezávisle seřadíme (rekurzivně pomocí quicksortu) 33 / 48 Quick sort ilustrace dělení 34 / 48 Quick sort pokud máme smůlu při výběru pivota, tak je stejně pomalý jako předchozí v průměrném případě je rychlý – quick O(n log(n)) 35 / 48 Řazení slučováním (Merge sort) rekurzivní algoritmus seznam rozdělíme na dvě poloviny a ty seřadíme (pomocí Merge sort) ze seřazených polovin vyrobíme jeden seřazený seznam – „zipování vždy efektivní – O(n log(n)) 36 / 48 Radix sort předchozí algoritmy využívají pouze operaci porovnání dvou hodnot aplikovatelné na cokoliv, co lze porovnávat, žádné další předpoklady s doplňujícími předpoklady můžeme dostat nové algoritmy (obecný princip) 37 / 48 Radix sort aplikovatelné na (krátká) čísla postupujeme od nejméně významné cifry k nejvýznamnější seřadíme čísla podle dané cifry = rozdělení do 10 „kyblíčků (jednoduché, rychlé) 38 / 48 Radix sort ilustrace 39 / 48 Složitost trochu podrobněji složitost algoritmu – jak je algoritmus výpočetně náročný časová, prostorová měříme počet operací nikoliv čas na konkrétním stroji vyjadřujeme jako funkci délky vstupu O notace – zanedbáváme konstanty např. O(n), O(n log(n)), O(n2 ) 40 / 48 Ilustrace rozdílů v složitosti 41 / 48 Složitost řadicích algoritmů n – délka vstupní posloupnosti počet operací „jednoduché algoritmy O(n2 ), „kvadratická „složitější algoritmy O(n log(n)) 42 / 48 Vyhledávání a řazení v Pythonu x in seznam – test přítomnosti x v seznamu seznam.index(x) – pozice x v seznamu seznam.count(x) – počet výskytů x v seznamu seznam.sort() – seřadí položky seznamu sorted(seznam) – vrátí seřazené položky seznamu (ale nezmění vlastní proměnnou) 43 / 48 Přesmyčky přesmyčky = slova poskládaná ze stejných písmen úkol: rozpoznat, zda dvě slova jsou přesmyčky vstup: dva řetězce výstup: True/False příklady: odsun, dusno → True kostel, les → False houslista, souhlasit → True ovoce, ovace → False 44 / 48 Přesmyčky řešení seřadíme písmena obou slov přesmyčky ⇔ po seřazení identické implementace: převedení řetězce na seznam, pak seřazení def presmycky(slovo1, slovo2): return sorted(slovo1) == sorted(slovo2) 45 / 48 Rozměňování peněz vstup: částka X výstup: vyplacení částky pomocí co nejméně mincí (bankovek) předpokládejme „klasické hodnoty peněz: 1, 2, 5, 10, 20, 50, 100, . . . příklady: 29 → 2, 2, 5, 20 401 → 1, 200, 200 46 / 48 Rozměňování peněz hladový algoritmus: „použij vždy nejvyšší minci, která je menší než cílová částka cvičení – naprogramovat funguje pro klasické hodnoty nefunguje pro obecný případ – najděte konkrétní příklad zkuste vymyslet algoritmus pro obecný případ 47 / 48 Shrnutí vyhledávání: půlení intervalu, rekurze řadicí algoritmy: jednoduché (kvadratické): bublinkové, výběrem, vkládáním složitější (n · log(n), rekurzivní): quick sort, slučování příklady 48 / 48