Datový soubor cigarety.sta Datový soubor obsahuje údaje o 25 značkách cigaret. Jsou sledovány tyto proměnné: X1 … obsah dehtu (v mg) X2 … obsah nikotinu (v mg) X3 … hmotnost cigarety (v g) Y … obsah oxidu uhelnatého v uvolněném kouři (v mg) Úkoly 1. Popište datový soubor pomocí číselných charakteristik a vhodných grafů. 2. Normalitu proměnných Y, Xl, X2, X3 posuďte pomocí N-P plotu a S-W testu s hladinou významnosti 0,05. 3. Závislost mezi dvojicemi proměnných (Y,X1), (Y,X2), (Y,X3) znázorněte dvourozměrnými tečkovými diagramy. 4. Vypočtěte výběrovou korelační matici všech čtyř proměnných a pro α = 0,05 otestujte významnost jednotlivých korelačních koeficientů. 5. Vypočtěte výběrové parciální korelační koeficienty ( )321 X,X.X,Yr , ( )312 X,X.X,Yr , ( )213 X,X.X,Yr a porovnejte je s výběrovými párovými korelačními koeficienty 1YXr , 2YXr , 3YXr . Na hladině významnosti a = 0,05 testujte hypotézy o nevýznamnosti parciálních korelačních koeficientu ( )321 X,X.X,Yρ , ( )312 X,X.X,Yρ , ( )213 X,X.X,Yρ . 6. V první fázi zpracování předpokládejte, že je vhodný regresní model Y = β0 + β1x1 + β 2x2 + β3x3 + ε. Vypočtěte index determinace a interpretujte ho. Proveďte celkový F-test. Odhadněte parametry regresního modelu. Proveďte dílčí t-testy pro regresní koeficienty. Zjistěte odhad rozptylu. (Hladinu významnosti volte α = 0,05.) Posuďte pomocí beta koeficientů vliv jednotlivých nezávisle proměnných veličin na regresní model. Posuďte pomocí VIF koeficientů, zda proměnné X1, X2, X3 mohou způsobit multikolinearitu v uvedeném modelu. 7. Z regresního modelu odstraňte ty proměnné, jejichž regresní koeficienty se neprokázaly významné pro α = 0,05. Sestavte nový regresní model a proveďte v něm tytéž úkoly jako v bodě 5. Normalitu reziduí v tomto novém regresním modelu posuďte S-W testem na hladině významnosti α = 0,05. V novém regresním modelu najděte 95% interval spolehlivosti pro teoretickou regresní funkci a 95% predikční interval.