# Klasifikace vín
Cílem tohoto projektu je naučit klasifikátor ze souboru slovního popisu vín (aroma, kyselinka...) a odrůd. Používáme standardní balíčky pro strojové učení Scikit Learn (https://scikit-learn.org/stable/index.html), datovou analytiku Pandas (https://pandas.pydata.org/), vizualizaci dat Yellowbrick (https://www.scikit-yb.org/en/latest/). Je potřeba mít python3.

In [1]:
!pip install sklearn --user
!pip install pandas --user
!pip install yellowbrick --user

[33mYou are using pip version 19.0.3, however version 19.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m
[33mYou are using pip version 19.0.3, however version 19.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m
[33mYou are using pip version 19.0.3, however version 19.1 is available.
You should consider upgrading via the 'pip install --upgrade pip' command.[0m


Balíček collections je standardem v pythonu, použijeme Counter na zjištění, které odrůdy jsou v datovém souboru nejčetnější. Kdyby nefungovalo `from sklearn.model_selection import train_test_split`, změňte jej na `from sklearn.cross_validation import train_test_split`, v různých verzích sklearn je to různě.

In [2]:
import numpy as np
from sklearn.naive_bayes import MultinomialNB
from sklearn.feature_extraction.text import TfidfVectorizer
import pandas as pd
from collections import Counter
from sklearn.model_selection import train_test_split

Jako trénovací i testovací data použijeme datový soubor Wine Reviews (https://www.scikit-yb.org/en/latest/). V Jupyter Notebooku je snadné vypsat obsah proměnné tím, že ji napíšeme na poslední místo slotu (zde `df`). Balíček pandas v tomto případě zajistí, že se DataFrame vypíše jako naformátovaná tabulka. Srovnejte s tím, jak vypadá soubor wine_data.csv v textovém editoru, případně jej můžete zkusit otevřít v Excelu, Libre Office Calc apod. 

In [3]:
df = pd.read_csv('data/wine_data.csv')
df

Unnamed: 0.1,Unnamed: 0,country,description,designation,points,price,province,region_1,region_2,taster_name,taster_twitter_handle,title,variety,winery
0,0,Italy,"Aromas include tropical fruit, broom, brimston...",Vulkà Bianco,87,,Sicily & Sardinia,Etna,,Kerin O’Keefe,@kerinokeefe,Nicosia 2013 Vulkà Bianco (Etna),White Blend,Nicosia
1,1,Portugal,"This is ripe and fruity, a wine that is smooth...",Avidagos,87,15.0,Douro,,,Roger Voss,@vossroger,Quinta dos Avidagos 2011 Avidagos Red (Douro),Portuguese Red,Quinta dos Avidagos
2,2,US,"Tart and snappy, the flavors of lime flesh and...",,87,14.0,Oregon,Willamette Valley,Willamette Valley,Paul Gregutt,@paulgwine,Rainstorm 2013 Pinot Gris (Willamette Valley),Pinot Gris,Rainstorm
3,3,US,"Pineapple rind, lemon pith and orange blossom ...",Reserve Late Harvest,87,13.0,Michigan,Lake Michigan Shore,,Alexander Peartree,,St. Julian 2013 Reserve Late Harvest Riesling ...,Riesling,St. Julian
4,4,US,"Much like the regular bottling from 2012, this...",Vintner's Reserve Wild Child Block,87,65.0,Oregon,Willamette Valley,Willamette Valley,Paul Gregutt,@paulgwine,Sweet Cheeks 2012 Vintner's Reserve Wild Child...,Pinot Noir,Sweet Cheeks
5,5,Spain,Blackberry and raspberry aromas show a typical...,Ars In Vitro,87,15.0,Northern Spain,Navarra,,Michael Schachner,@wineschach,Tandem 2011 Ars In Vitro Tempranillo-Merlot (N...,Tempranillo-Merlot,Tandem
6,6,Italy,"Here's a bright, informal red that opens with ...",Belsito,87,16.0,Sicily & Sardinia,Vittoria,,Kerin O’Keefe,@kerinokeefe,Terre di Giurfo 2013 Belsito Frappato (Vittoria),Frappato,Terre di Giurfo
7,7,France,This dry and restrained wine offers spice in p...,,87,24.0,Alsace,Alsace,,Roger Voss,@vossroger,Trimbach 2012 Gewurztraminer (Alsace),Gewürztraminer,Trimbach
8,8,Germany,Savory dried thyme notes accent sunnier flavor...,Shine,87,12.0,Rheinhessen,,,Anna Lee C. Iijima,,Heinz Eifel 2013 Shine Gewürztraminer (Rheinhe...,Gewürztraminer,Heinz Eifel
9,9,France,This has great depth of flavor with its fresh ...,Les Natures,87,27.0,Alsace,Alsace,,Roger Voss,@vossroger,Jean-Baptiste Adam 2012 Les Natures Pinot Gris...,Pinot Gris,Jean-Baptiste Adam


V DataFrame je možné ke sloupcům přistupovat jako ke slovníku (python `dict`), a tudíž je možné vybrat je sloupec se jménem odrůdy. Pro naše účely vybereme 10 nejčetnějších odrůd.

In [4]:
counter = Counter(df['variety'].tolist())
df = df[df['variety'].map(lambda x: x in [a for a,b in counter.most_common(10)])]
df

Unnamed: 0.1,Unnamed: 0,country,description,designation,points,price,province,region_1,region_2,taster_name,taster_twitter_handle,title,variety,winery
3,3,US,"Pineapple rind, lemon pith and orange blossom ...",Reserve Late Harvest,87,13.0,Michigan,Lake Michigan Shore,,Alexander Peartree,,St. Julian 2013 Reserve Late Harvest Riesling ...,Riesling,St. Julian
4,4,US,"Much like the regular bottling from 2012, this...",Vintner's Reserve Wild Child Block,87,65.0,Oregon,Willamette Valley,Willamette Valley,Paul Gregutt,@paulgwine,Sweet Cheeks 2012 Vintner's Reserve Wild Child...,Pinot Noir,Sweet Cheeks
10,10,US,"Soft, supple plum envelopes an oaky structure ...",Mountain Cuvée,87,19.0,California,Napa Valley,Napa,Virginie Boone,@vboone,Kirkland Signature 2011 Mountain Cuvée Caberne...,Cabernet Sauvignon,Kirkland Signature
12,12,US,"Slightly reduced, this wine offers a chalky, t...",,87,34.0,California,Alexander Valley,Sonoma,Virginie Boone,@vboone,Louis M. Martini 2012 Cabernet Sauvignon (Alex...,Cabernet Sauvignon,Louis M. Martini
14,14,US,Building on 150 years and six generations of w...,,87,12.0,California,Central Coast,Central Coast,Matt Kettmann,@mattkettmann,Mirassou 2012 Chardonnay (Central Coast),Chardonnay,Mirassou
15,15,Germany,Zesty orange peels and apple notes abound in t...,Devon,87,24.0,Mosel,,,Anna Lee C. Iijima,,Richard Böcking 2013 Devon Riesling (Mosel),Riesling,Richard Böcking
20,20,US,Ripe aromas of dark berries mingle with ample ...,Vin de Maison,87,23.0,Virginia,Virginia,,Alexander Peartree,,Quiévremont 2012 Vin de Maison Red (Virginia),Red Blend,Quiévremont
21,21,US,"A sleek mix of tart berry, stem and herb, alon...",,87,20.0,Oregon,Oregon,Oregon Other,Paul Gregutt,@paulgwine,Acrobat 2013 Pinot Noir (Oregon),Pinot Noir,Acrobat
23,23,US,This wine from the Geneseo district offers aro...,Signature Selection,87,22.0,California,Paso Robles,Central Coast,Matt Kettmann,@mattkettmann,Bianchi 2011 Signature Selection Merlot (Paso ...,Merlot,Bianchi
25,25,US,Oak and earth intermingle around robust aromas...,King Ridge Vineyard,87,69.0,California,Sonoma Coast,Sonoma,Virginie Boone,@vboone,Castello di Amorosa 2011 King Ridge Vineyard P...,Pinot Noir,Castello di Amorosa


LabelEncoder se bude hodit pro vizualizaci dat. Každá odrůda (třída) dostane má svoje číslo, LabelEncoder překódovává toto číslo na jméno odrůdy a naopak.

In [5]:
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit(df['variety'])
print("classes", le.classes_)
print("classes indices", le.transform(le.classes_))
le.transform(['Cabernet Sauvignon', 'Pinot Noir', 'Riesling'])

classes ['Bordeaux-style Red Blend' 'Cabernet Sauvignon' 'Chardonnay' 'Merlot'
 'Pinot Noir' 'Red Blend' 'Riesling' 'Rosé' 'Sauvignon Blanc' 'Syrah']
classes indices [0 1 2 3 4 5 6 7 8 9]


array([1, 4, 6])

Jak zhruba vypadá popis vína (můžete změnit číslo, ale pozor, teď máme v DataFrame jen některé řádky (10 nejčastějších odrůd).

In [6]:
print("description of wine no. 3:",df.loc[3,]["description"])

description of wine no. 3: Pineapple rind, lemon pith and orange blossom start off the aromas. The palate is a bit more opulent, with notes of honey-drizzled guava and mango giving way to a slightly astringent, semidry finish.


Proměnná `varietal_list` bude obsahovat řadu čísel odrůd. Algoritmy strojového učení dostanou na vstup matici rysů (řádky jsou jednotlivé instance, v našem případě konkrétní láhve vína, sloupce jsou v našem případě popisy) a vektor tříd (v našem případě čísla odrůd). Matice se označuje X, vektor se označuje Y. Klasifikátor se potom učí:

    [X ... ]       [Y]
    |  .   |       |.|
    |   .  |   =   |.|
    |    . |       |.|
    [     X]       [.]

In [7]:
description_list = df['description'].tolist()
varietal_list = le.transform(df['variety'].tolist())
print(varietal_list)

[6 4 1 ... 1 6 4]


Nejdůležitější část se odehrává zde. Za prvé je třeba převést slovní popisy na vektory (to budou řádky matice X). Z řady možností, jak to udělat, jsem zvolila TF-IDF, což je technika, která počítá důležitost slova oproti korpusovým datům (viz https://cs.wikipedia.org/wiki/Tf-idf). Výsledný vektor bude pro každé slovo obsažené v popisu obsahovat jeho "klíčovost", tj. jak moc je charakteristické právě pro tento popis. 

Za druhé je třeba zvolit algoritmus strojového učení, v tomto případě naivní Bayesovský klasifikátor (NB) pro více tříd (Multinomial). 

DataFrame rozdělíme na trénovací a testovací sady v poměru 7:3 (parametr `test_size`).

Trénování probíhá voláním funkce `fit()`. Aplikace na testovací sadu probíhá pomocí metody `predict()`.

Ve for-cyklu se potom počítá, kolik predikcí bylo správných. Vypisují se ty špatné. Zkuste je zběžně prohlédnout a vyvodit nějaké závěry, např. které dvojice tříd klasifikátor častěji zaměňuje?

In [8]:
tfidf_vectorizer = TfidfVectorizer()
x_train_tfidf = tfidf_vectorizer.fit_transform(description_list)

train_x, test_x, train_y, test_y = train_test_split(x_train_tfidf, varietal_list, test_size=0.3)

model = MultinomialNB()
clf = model.fit(train_x, train_y)
y_pred = clf.predict(test_x)

n_right = 0
for i in range(len(y_pred)):
    if y_pred[i] == test_y[i]:
        n_right += 1
    else:
        print(y_pred[i], le.inverse_transform([y_pred[i]])[0], test_y[i], le.inverse_transform([test_y[i]])[0])

print("Accuracy: %.2f%%" % ((n_right/float(len(test_y)) * 100)))

4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 7 Rosé
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 9 Syrah
5 Red Blend 3 Merlot
2 Chardonnay 6 Riesling
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 5 Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 4 Pinot Noir
5 Red Blend 9 Syrah
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 7 Rosé
4 Pinot Noir 5 Red Blend
4 Pinot Noir 6 Riesling
4 Pinot Noir 3 Merlot
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
4 Pinot Noir 2 Chardonnay
4 Pinot Noir 7 Rosé
0 Bordeaux-style Red Blend 4 Pinot Noir
2 Chardonnay 6 Riesling
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 9 Syrah
4 Pinot Noir 6 Riesling
4 Pinot Noir 6 Riesling
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
4 Pinot Noir 3 Merlot
5 Red Blend 1 Cabernet Sa

2 Chardonnay 8 Sauvignon Blanc
0 Bordeaux-style Red Blend 3 Merlot
4 Pinot Noir 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 7 Rosé
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
0 Bordeaux-style Red Blend 2 Chardonnay
5 Red Blend 0 Bordeaux-style Red Blend
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 7 Rosé
4 Pinot Noir 3 Merlot
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 7 Rosé
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 7 Rosé
4 Pinot Noir 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 8 Sauvignon Blanc
4 Pinot Noir 5 Red Blend
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 7 Rosé
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 6 Riesling
5 Red Blend 9 Syrah

4 Pinot Noir 5 Red Blend
0 Bordeaux-style Red Blend 4 Pinot Noir
5 Red Blend 3 Merlot
4 Pinot Noir 3 Merlot
4 Pinot Noir 5 Red Blend
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 5 Red Blend
6 Riesling 8 Sauvignon Blanc
1 Cabernet Sauvignon 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 0 Bordeaux-style Red Blend
0 Bordeaux-style Red Blend 3 Merlot
2 Chardonnay 4 Pinot Noir
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 6 Riesling
1 Cabernet Sauvignon 4 Pinot Noir
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 0 Bordeaux-style Red Blend
0 Bordeaux-style Red Blend 4 Pinot Noir
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir

5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 3 Merlot
4 Pinot Noir 9 Syrah
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 3 Merlot
5 Red Blend 1 Cabernet Sauvignon
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 7 Rosé
4 Pinot Noir 9 Syrah
5 Red Blend 7 Rosé
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 6 Riesling
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 7 Rosé
5 Red Blend 0 Bordeaux-style Red Blend
0 Bordeaux-style Red Blend 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
0 Bordeaux-style Red Blend 4 Pinot Noir
1 Cabernet Sauvignon 5 Red Blend
2 Chardonnay 6 Riesling
4 Pinot Noir 2 Chardonnay
4 Pinot Noir 

4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 5 Red Blend
5 Red Blend 9 Syrah
4 Pinot Noir 9 Syrah
4 Pinot Noir 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
4 Pinot Noir 2 Chardonnay
1 Cabernet Sauvignon 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 1 Cabernet Sauvignon
5 Red Blend 0 Bordeaux-style Red Blend
5 Red Blend 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 5 Red Blend
5 Red Blend 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
5 Red Blend 7 Rosé
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 5 Red Blend
5 Red Blend 7 Rosé
4 Pinot Noir 5 Red Blend
0 Bordeaux-style Red Blend 4 Pinot Noir
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
0 Bordeaux-style Red Blend 4 Pinot Noir
5 Red Blend 3 Merlot
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 1 Cabernet

4 Pinot Noir 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 6 Riesling
4 Pinot Noir 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
2 Chardonnay 6 Riesling
2 Chardonnay 6 Riesling
4 Pinot Noir 6 Riesling
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 6 Riesling
0 Bordeaux-style Red Blend 3 Merlot
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
5 Red Blend 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 5 Red Blend
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 9 Syrah
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
2 Chardonnay 7 Rosé
1 Cabernet Sauvignon 9 Syrah
0 Bordeaux-style Red Blend 4 Pinot Noir
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 5 Red Blend
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 6 Riesling
5 Red Blend 7 Rosé
4 Pinot Noir 9 Syrah
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chard

4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 3 Merlot
5 Red Blend 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 8 Sauvignon Blanc
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 7 Rosé
2 Chardonnay 6 Riesling
5 Red Blend 3 Merlot
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 7 Rosé
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
0 Bordeaux-style Red Blend 4 Pinot Noir
5 Red Blend 0 Bordeaux-style Red Blend
0 Bordeaux-style Red Blend 4 Pinot Noir
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 5 Red Blend
2 Chardonnay 7 Rosé
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 5 Red Blend
2 Chardonnay

2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
4 Pinot Noir 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 2 Chardonnay
2 Chardonnay 6 Riesling
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chardonnay 7 Rosé
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 7 Rosé
0 Bordeaux-style Red Blend 2 Chardonnay
4 Pinot Noir 2 Chardonnay
1 Cabernet Sauvignon 4 Pinot Noir
4 Pinot Noir 1 Cabernet Sauvignon
0 Bordeaux-style Red Blend 4 Pinot Noir
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 7 Rosé
8 Sauvignon Blanc 2 Chardonnay
4 Pinot Noir 9 Syrah
2 Chardonnay 4 Pinot

2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
0 Bordeaux-style Red Blend 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
4 Pinot Noir 6 Riesling
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 9 Syrah
5 Red Blend 9 Syrah
0 Bordeaux-style Red Blend 4 Pinot Noir
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 6 Riesling
4 Pinot Noir 7 Rosé
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 2 Chardonnay
6 Riesling 7 Rosé
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 9 Syrah
2 Chardonnay 6 Riesling
5 Red Blend 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay

5 Red Blend 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
2 Chardonnay 4 Pinot Noir
4 Pinot Noir 9 Syrah
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 9 Syrah
4 Pinot Noir 5 Red Blend
2 Chardonnay 6 Riesling
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 7 Rosé
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 9 Syrah
2 Chardonnay 7 Rosé
5 Red Blend 3 Merlot
4 Pinot Noir 9 Syrah
2 Chardonnay 6 Riesling
4 Pinot Noir 9 Syrah
4 Pinot Noir 2 Chardonnay
4 Pinot Noir 3 Merlot
4 Pinot Noir 9 Syrah
5 Red Blend 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 9 Syrah
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
0 Bordeaux-style Red Blend 4 Pinot Noir
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 5 Red Blend
2 Chardonnay 6 

4 Pinot Noir 3 Merlot
4 Pinot Noir 5 Red Blend
5 Red Blend 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 2 Chardonnay
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 8 Sauvignon Blanc
1 Cabernet Sauvignon 9 Syrah
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 3 Merlot
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 9 Syrah
4 Pinot Noir 7 Rosé
5 Red Blend 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
4 Pinot Noir 3 Merlot
4 Pinot Noir 3 Merlot
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 3 Merlot
1 Cabernet Sauvigno

4 Pinot Noir 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 9 Syrah
2 Chardonnay 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
2 Chardonnay 5 Red Blend
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 5 Red Blend
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 6 Riesling
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
4 Pinot Noir 5 Red Blend
4 Pinot Noir 7 R

0 Bordeaux-style Red Blend 4 Pinot Noir
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 9 Syrah
4 Pinot Noir 8 Sauvignon Blanc
4 Pinot Noir 7 Rosé
4 Pinot Noir 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 7 Rosé
5 Red Blend 9 Syrah
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
5 Red Blend 1 Cabernet Sauvignon
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 5 Red Blend
4 Pinot Noir 9 Syrah
2 Chardonnay 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 3 Merlot
4 Pinot Noir 3 Merlot
2 Chardonnay 4 Pinot Noir
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 3 Merlot
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 9 Syrah
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 3 Merlot
4 Pinot N

2 Chardonnay 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 5 Red Blend
4 Pinot Noir 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
5 Red Blend 1 Cabernet Sauvignon
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 7 Rosé
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 6 Riesling
2 Chardonnay 6 Riesling
2 Chardonnay 6 Riesling
4 Pinot Noir 1 Cabernet Sauvignon
5 Red Blend 1 Cabernet Sauvignon
2 Chardonnay 7 Rosé
1 Cabernet Sauvignon 3 Merlot
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 6 Riesling
4 Pinot Noir 3 Merlot
0 Bordeaux-style Red Bl

2 Chardonnay 4 Pinot Noir
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chardonnay 6 Riesling
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 7 Rosé
2 Chardonnay 6 Riesling
0 Bordeaux-style Red Blend 4 Pinot Noir
1 Cabernet Sauvignon 4 Pinot Noir
0 Bordeaux-style Red Blend 7 Rosé
4 Pinot Noir 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 5 Red Blend
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 9 Syrah
4 Pinot Noir 9 Syrah
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 5 Red Blend
5 Red Blend 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 5 Red Blend
4 Pinot Noir 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 4 Pinot Noir
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syra

2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 3 Merlot
5 Red Blend 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 9 Syrah
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 7 Rosé
5 Red Blend 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
4 Pinot Noir 9 Syrah
0 Bordeaux-style Red Blend 4 Pinot Noir
4 Pinot Noir 5 Red Blend
4 Pinot Noir 9 Syrah
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 7 Rosé
4 Pinot Noir 0 Bordeaux-style Red Blend
5 Red Blend 7 Rosé
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 4 Pinot Noir
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 3 Merlot
1 Cabern

2 Chardonnay 6 Riesling
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 9 Syrah
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 5 Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
5 Red Blend 1 Cabernet Sauvignon
5 Red Blend 1 Cabernet Sauvignon
2 Chardonnay 7 Rosé
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 7 Rosé
4 Pinot Noir 9 Syrah
0 Bordeaux-style Red Blend 3 Merlot
4 Pinot Noir 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 7 Rosé
2 Chardonnay 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 9 Syrah
2 Chardonnay 6 Riesling
4 Pinot Noir 7 Rosé
2 Chardonnay 6 Riesling
4 Pinot Noir 9 Syrah
4 Pinot Noir 7 Rosé
4 Pinot Noir 3 Merlot
4 Pinot Noir 

2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 3 Merlot
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 3 Merlot
4 Pinot Noir 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 5 Red Blend
2 Chardonnay 7 Rosé
4 Pinot Noir 0 Bordeaux-style Red Blend
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 8 Sauvignon Blanc
4 Pinot Noir 7 Rosé
4 Pinot Noir 0 Bordeaux-style Red Blend
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 1 Cabernet Sauvignon
1 Cabernet Sauvignon 4 Pinot Noir
1 Cabernet Sauvignon 4 Pinot Noir
4 Pinot Noir 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
5 Red Blend 0 Bordeaux-style Red Blend
4 Pinot Noir 7 Rosé
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 9 Syrah
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 9 Syrah
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon

1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 7 Rosé
0 Bordeaux-style Red Blend 7 Rosé
0 Bordeaux-style Red Blend 4 Pinot Noir
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 3 Merlot
1 Cabernet Sauvignon 5 Red Blend
4 Pinot Noir 9 Syrah
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 4 Pinot Noir
5 Red Blend 1 Cabernet Sauvignon
5 Red Blend 0 Bordeaux-style Red Blend
2 Chardonnay 6 Riesling
5 Red Blend 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
2 Chardonnay 7 Rosé
4 Pinot Noir 2 Chardonnay
1 Cabernet Sauvignon 5 Red Blend
5 Red Blend 9 Syrah
4 Pinot Noir 1 Cabernet Sauvignon
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 2 Chardonnay
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 1 Cabernet Sauvignon
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 5 Red Blend
4 Pinot Noir 9 Syrah
2 Chardonnay 5 Red Blend
1 Cabernet Sauvignon

0 Bordeaux-style Red Blend 2 Chardonnay
1 Cabernet Sauvignon 5 Red Blend
2 Chardonnay 8 Sauvignon Blanc
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
5 Red Blend 1 Cabernet Sauvignon
4 Pinot Noir 7 Rosé
1 Cabernet Sauvignon 3 Merlot
4 Pinot Noir 9 Syrah
4 Pinot Noir 8 Sauvignon Blanc
2 Chardonnay 6 Riesling
1 Cabernet Sauvignon 3 Merlot
1 Cabernet Sauvignon 4 Pinot Noir
2 Chardonnay 8 Sauvignon Blanc
1 Cabernet Sauvignon 9 Syrah
2 Chardonnay 8 Sauvignon Blanc
5 Red Blend 3 Merlot
2 Chardonnay 6 Riesling
5 Red Blend 9 Syrah
4 Pinot Noir 7 Rosé
4 Pinot Noir 7 Rosé
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 5 Red Blend
1 Cabernet Sauvignon 0 Bordeaux-style Red Blend
4 Pinot Noir 3 Merlot
2 Chardonnay 6 Riesling
4 Pinot Noir 2 Chardonnay
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 1 Cabernet Sauvignon
2 Chardonnay 8 Sauvignon Blanc
4 Pinot Noir 9 Syrah
4 Pinot Noir 9 Syrah
4 Pinot Noir 9 Syrah
4 Pinot Noir 3 Merlot
2 Chardonnay 6 Riesling
5 Red Blend 0 Bordeaux-style Re

Z předchozího je vidět, že klasifikátor málokdy splete bílé a červené víno. Taky je vidět, že často zaměňuje chardonnay a sauvignon, cabernet sauvignon a pinot noir, případně další dvojice červených vín.

V následující vizualizaci je vidět kompletní matice záměn, která předchozí pozorování potvrzuje a zároveň ukazuje, proč je chardonnay a pinot noir nejčastěji v předchozím výpisu. Pokud nevidíte obrázek, spusťte následující část kódu podruhé.

In [9]:
from yellowbrick.classifier import ConfusionMatrix
cm = ConfusionMatrix(model, classes=le.classes_, label_encoder=le) 

# To create the ConfusionMatrix, we need some test data. Score runs predict() on the data
# and then creates the confusion_matrix from scikit-learn.
cm.score(test_x, test_y)

# How did we do?
cm.poof()
#cm.draw()

<Figure size 800x550 with 1 Axes>

Pro klasifikaci do více tříd je zajímavé uvádět přesnost, pokrytí a F-míry pro každou třídu zvlášť. Ukáže se, na které třídy nemá cenu klasifikátor používat, zde např. merlot nebo syrah.

In [10]:
from sklearn.metrics import classification_report
print(classification_report(test_y, y_pred, target_names=le.classes_))

                          precision    recall  f1-score   support

Bordeaux-style Red Blend       0.76      0.59      0.66      2127
      Cabernet Sauvignon       0.56      0.68      0.61      2777
              Chardonnay       0.62      0.96      0.76      3539
                  Merlot       0.00      0.00      0.00       963
              Pinot Noir       0.53      0.90      0.67      3954
               Red Blend       0.71      0.74      0.72      2679
                Riesling       0.95      0.52      0.67      1570
                    Rosé       0.97      0.15      0.25      1101
         Sauvignon Blanc       0.96      0.25      0.39      1498
                   Syrah       0.96      0.02      0.04      1189

               micro avg       0.63      0.63      0.63     21397
               macro avg       0.70      0.48      0.48     21397
            weighted avg       0.68      0.63      0.58     21397



  'precision', 'predicted', average, warn_for)
