Vaší úlohou bude zpracovat data poskytnutá [Johns Hopkins CSSE](https://github.com/CSSEGISandData/COVID-19) o situaci s  nemocí COVID-19.

Soubory s daty najdete ve [studijních materiálech](TODO) nebo si je můžete stáhnout spuštěním následujícího skriptu:

In [1]:
import datetime
first_day = datetime.date(2020, 1, 22)
last_day = datetime.date(2020, 3, 14)

In [None]:
import urllib

day = first_day # datetime objects are immutable
while day <= last_day:
    filename = day.strftime('%m-%d-%Y') + '.csv'
    
    print('Downloading ' + filename + '...')
    
    urllib.request.urlretrieve(
        'https://raw.githubusercontent.com/tungli/COVID-19/master/csse_covid_19_data/csse_covid_19_daily_reports/'
    + filename, filename)
    
    day = day + datetime.timedelta(days=1)

Soubory jsou ve formátu `csv` (Comma-separated values). To je standardní formát a pro práci s ním v Pythonu existuje balíček. 
Podívejte se na strukturu jednoho ze souborů.
Můžete vidět, že první řádek je vysvětlení, co který sloupec znamená.


**Vaším úkolem bude sestavit slovník, v němž heslo bude vždy datum a hodnota bude počet nakažených.
Vyberte si jeden stát, pro který budete tuto analýzu dělat.**

Skript pro načtení souborů dole vam vytvoří seřazený seznam dnů a slovnik s načtenými daty, jehož hesla jsou právě prvky seznamu dnů. Pro reprezenaci data používáme objekty z balíčku `datetime`.

**Notebook musí byt spuštěn v adresáři, kde soubory máte (jinak musíte modifikovat `filename`)!!**

In [3]:
import csv

covid_data = {}
days = []

day = first_day # datetime objects are immutable
while day <= last_day:
    filename = day.strftime('%m-%d-%Y') + '.csv'
    with open(filename) as f:
        data = []
        for line in csv.reader(f):
            data.append(line)
            
        covid_data[day] = data[1:] # skip the first (header) line
    
    days.append(day)
        
    day = day + datetime.timedelta(days=1)

In [4]:
print(days[0])

2020-01-22


In [5]:
print(covid_data[days[0]])

[['Anhui', 'Mainland China', '1/22/2020 17:00', '1', '', ''], ['Beijing', 'Mainland China', '1/22/2020 17:00', '14', '', ''], ['Chongqing', 'Mainland China', '1/22/2020 17:00', '6', '', ''], ['Fujian', 'Mainland China', '1/22/2020 17:00', '1', '', ''], ['Gansu', 'Mainland China', '1/22/2020 17:00', '', '', ''], ['Guangdong', 'Mainland China', '1/22/2020 17:00', '26', '', ''], ['Guangxi', 'Mainland China', '1/22/2020 17:00', '2', '', ''], ['Guizhou', 'Mainland China', '1/22/2020 17:00', '1', '', ''], ['Hainan', 'Mainland China', '1/22/2020 17:00', '4', '', ''], ['Hebei', 'Mainland China', '1/22/2020 17:00', '1', '', ''], ['Heilongjiang', 'Mainland China', '1/22/2020 17:00', '', '', ''], ['Henan', 'Mainland China', '1/22/2020 17:00', '5', '', ''], ['Hong Kong', 'Hong Kong', '1/22/2020 17:00', '', '', ''], ['Hubei', 'Mainland China', '1/22/2020 17:00', '444', '17', '28'], ['Hunan', 'Mainland China', '1/22/2020 17:00', '4', '', ''], ['Inner Mongolia', 'Mainland China', '1/22/2020 17:00', '

### Pár poznámek

* Pozor na název krajiny! Jedna krajina může mít víc názvů. Např. Česko může být `'Czech republic'` nebo `'Czechia'`.
* Pokud jste slovník sestavili, můžete si výsledek vizualizovat. Budete potřebovat knihovnu [matplotlib](https://matplotlib.org/) (`pip install matplotlib`). Příslušný skript:

```python
import matplotlib.pyplot as plt
fig = plt.figure(figsize=(12,12))
plt.bar(d.keys(), d.values())
```