Cvičení 11.: Pokročilé metody v jednoduché lineární regresi Příklad 1.: Na podzim byla uskladněna zimní jablka. Po čase bylo vždy odebráno několik kusů a u každého byla posuzována chuť, tvrdost, kvalita slupky a celkový vzhled jablka. Vyšší počet bodů odpovídá lepší kvalitě ovoce. Doba, která uplynula od uskladnění, je nezávisle proměnná veličina X, počet bodů závisle proměnná veličina Y. X Y 0 5 6 4 5 2 9 7 8 4 9 8 10 10 8 6 8 5 7 4 6 8 3 1 2 Na hladině významnosti 0,05 testujte hypotézu, že regresní přímka je vhodný model závislosti Y na X. Řešení v systému STATISTICA: Načteme datový soubor jablka.sta se dvěma proměnnými X a Y a 20 případy. Data znázorníme graficky: -1 0 1 2 3 4 5 6 7 8 9 X 0 2 4 6 8 10 12 Y Je zřejmé, že přímka nebude vhodným regresním modelem. Odhadneme parametry regresní přímky: Výsledky regrese se závislou proměnnou : Y (jablka.sta) R= ,32440757 R2= ,10524027 Upravené R2= ,05553140 F(1,18)=2,1171 p<,16288 Směrod. chyba odhadu : 2,5200 N=20 Beta Sm.chyba beta B Sm.chyba B t(18) Úroveň p Abs.člen X 7,472222 1,011487 7,38737 0,000001 -0,324408 0,222955 -0,305556 0,209998 -1,45504 0,162877 Sestavíme tabulku ANOVA: Vrátíme se do Výsledky – vícenásobná regrese – Detailní výsledky – ANOVA. Analýza rozptylu (jablka.sta) Efekt Součet čtverců sv Průměr čtverců F Úroveň p Regres. Rezid. Celk. 13,4444 1 13,44444 2,117132 0,162877 114,3056 18 6,35031 127,7500 Vidíme, že SR = 13,4444, ST = 127,75 Provedeme jednofaktorovou analýzu rozptylu, abychom získali skupinový součet čtverců: Statistiky – Základní statistiky a tabulky – Rozklad & jednofakt. ANOVA – OK – Proměnné – Závislé – Y, Grupovací - X – OK – OK – Analýza rozptylu. Analýza rozptylu (jablka.sta) Označ. efekty jsou význ. na hlad. p < ,05000 Proměnná SČ efekt SV efekt PČ efekt SČ chyba SV chyba PČ chyba F p Y 107,7500 4 26,93750 20,00000 15 1,333333 20,20313 0,000007 Zde najdeme SA = 107,75. Vypočteme testovou statistiku ( ) ( ) ( ) ( ) 576,23= 1,3333 4352,31 = 520/75,10775,127 25/4444,1375,107 =F −− −− a najdeme kritický obor W =