Když se řekne klíčové slovo, tak mě nejdřív napadne těch pár klíčových slov, která jsou uvedena u každého článku nebo práce a která obvykle autor vybírá tak, aby co nejlépe vystihovala oblast, které se daný text týká. Jistě bychom si dokázali představit i nějaký algoritmus, který by taková slova z článku vybíral a jehož výstupem by bylo právě těch 5 klíčových slov nebo slovních sousloví. Otázka je, jestli by tato slova vybral program lépe než autor textu a jestli vůbec lze správně zařadit nějaký text pomocí pěti slov. Protože když jsem se zkoušel dívat v ISu na bakalářské práce s podobným zaměřením, jako má ta moje (tato podobnost se určuje právě podle klíčových slov), tak mi systém vracel spíše úplné nesmysly a práce s tou mou nesouvisející. Nejjednodušší vysvětlení je to, že jsme buď já, nebo autoři oněch dalších prací vybrali klíčová slova špatně. Ovšem jiný důvod by mohl být ten, že výběrem pouhých několika slov se ztrácí velká informace o textu. Tato informace by mohla být uchovávána a využívána lépe – programy by si mohly místo několika slov pamatovat například frekvence výskytu všech slov, každé slovo charakterizovat dalšími parametry nebo si pamatovat dokonce vazby mezi jednotlivými slovy v textu. Takováto struktura by lépe charakterizovala daný článek. S tímto problémem by souviselo také to, jak takovéto výsledky mezi sebou porovnávat. Každý autor může psát jiným stylem, používat jiná slova nebo jim přikládat odlišný význam. S rozvojem internetu a digitalizace dat se objevují nové možnosti využití klíčových slov. Je rozdíl mezi novinovým článkem a například webovou stránkou, kde existují nadpisy, odkazy a podobně. Tyto informace by měly algoritmy pracující s klíčovými slovy využívat a slovům v jiných částech stránky přikládat například jinou váhu. Zároveň lze využívat i informací, kam vedou odkazy z dané stránky a odkud naopak na ni. Zde vidím možnosti uplatnění algoritmů pracujících s klíčovými slovy.