Cvičení 4 s návodem Příklady na využití Poissonova rozložení Příklad 1.: Při provozu balicího automatu vznikají během směny náhodné poruchy, které se řídí rozložením Po(2). Jaká je pravděpodobnost, že během směny dojde k aspoň jedné poruše? Řešení: X – počet poruch během směny, X ~ Po(2), P(X ≥ 1) = 1 – P(X < 1) = 1 – P(X = 0) = 1 - 2 0 e !0 2 − = 0,8647. V MATLABu: p = 1 – poisspdf(0,2) Příklad 2.: Telefonní ústředna zapojí během hodiny průměrně 15 hovorů. Jaká je pravděpodobnost, že během 4 minut ústředna zapojí a) právě 1 hovor, b) aspoň 2 hovory? Řešení: X – počet zapojených hovorů během 4 minut = 1/15 hodiny, X ~ Po(tλ), kde t = 1/15 a λ = 15, tedy X ~ Po(1). ad a) ( ) 36788,0e1XP 1 === − , ad b) ( ) ( ) ( ) ( ) 264242,0e210XP0XP11XP12XP 1 =−==−=−=≤−=≥ − V MATLABu: a) p = poisspdf(1,1), b) p = 1 – poisscdf(1,1) Příklad 3.: Ze zkušenosti víme, že při správné obsluze stroje je v průměru 0,1% výrobků zmetkových. Ke stroji nastoupil nový pracovník. Za týden vyrobil 5 000 kusů, z nichž 11 bylo zmetkových. Lze takto vysoký počet zmetků vysvětlit působením náhodných vlivů? Řešení: Počítáme pravděpodobnost, že pracovník vyrobil aspoň 11 zmetků za předpokladu, že stroj je obsluhován správně. X – počet vyrobených zmetků za týden, X ~ Bi(5000, 0,001). Při splnění podmínek dobré aproximace lze rozložení veličiny X aproximovat rozložením Po(5). ( ) ( ) .0137,09863,01e !t 5 110XP111XP 10 0t 5 t =−=−=≤−=≥ ∑= − Je zřejmé, že nový pracovník nepracuje správně. V MATLABu: p = 1 – poisscdf(10,5) Přesný výpočet v MATLABu: p = 1 – binocdf(10,5000,0.001) Příklad 4.: Semena rostlin určitého druhu jsou znečištěna malým množstvím plevele. Je známo, že na jedné jednotce plochy vyrostou po osetí v průměru 4 rostliny plevele. Vypočítejte pravděpodobnost, že na dané jednotce plochy: a) nebude žádný plevel, b) vyrostou nejvýše 3 rostliny plevele, c) vyroste aspoň 5, ale nejvýše 7 rostlin plevele. Řešení: X – počet rostlin plevele na jednotce plochy, X ~ Po(4) Ad a) ( ) 0183,0e0XP 4 === − V MATLABu: p=poisspdf(0;4) Ad b) ( ) 4335,0e !x 4 3XP 3 0x 4 x ==≤ ∑= − V MATLABu: p=poisscdf(3;4) Ad c) ( ) 32,0e !x 4 7X5P 7 5x 4 x ==≤≤ ∑= − V MATLABu: p=poisscdf(7;4)-poisscdf(4;4) Příklad 5.: V prodejně posunuli zavírací dobu ve všední dny z 18 na 19 hodin. Sestrojte 90% přibližný empirický interval spolehlivosti pro střední hodnotu počtu zákazníků v této době, navštívilo-li prodejnu ve 30 náhodně zvolených dnech ve sledované době celkem 225 zákazníků. Přitom předpokládáme, že počet zákazníků v určitém časovém intervalu má Poissonovo rozložení. Řešení: Meze 100(1-α)% přibližného empirického intervalu spolehlivosti pro střední hodnotu λ jsou: 2/12/1 u n m mh,u n m md α−α− +=−= V našem případě m = 225/30, n = 30, α = 0,1, u1-α/2 = u0,95 = 1,64 32,864,1 30 225 30 225 h ,68,664,1 30 225 30 225 d 2 2 =+= =−= Střední hodnota počtu zákazníků se s pravděpodobností přibližně 90 % nachází v mezích od 6,68 do 8,32. V MATLABu: d=225/30-15/30*norminv(0.95,0,1) h=225/30+15/30*norminv(0.95,0,1) Práce se systémem MATLAB Úkol 1.: Na výrobní lince se zhruba každé dvě hodiny vyskytne porucha. Sestrojte tabulku uvádějící, s jakou pravděpodobností se na této lince během osmihodinové pracovní směny nevyskytne žádná porucha, vyskytne jedna porucha, vyskytnou dvě poruchy atd. až vyskytne deset poruch. S jakou pravděpodobností nastane více než deset poruch? Určete nejpravděpodobnější počet poruch během osmihodinové směny. Řešení: X - počet poruch během osmi hodin, X ~ Po(tλ), kde t = 4 a λ = 1 , tedy X ~ Po(4). ( ) ( ) 0183,0e !0 4 00XP 4 0 ==π== − ( ) ( ) 0733,0e !1 4 11XP 4 1 ==π== − ………………………………….. ( ) ( ) 0053,0e !10 4 1010XP 4 10 ==π== − Přehledný zápis všech výsledků je v následující tabulce (včetně hodnot distribuční funkce). Všimněte si, že ačkoli jsme samozřejmě nevyčerpali všechny možné počty poruch (těch je nekonečně mnoho), dosahuje součet všech vypočtených pravděpodobností téměř 1. Najdeme ho jako hodnotu distribuční funkce Φ(10)=0,9972 a jde o pravděpodobnost, že počet poruch bude nejvýše deset. Celková pravděpodobnost, že by byl počet poruch naopak větší než deset, je tedy 1-Φ(10) a činí pouze necelá tři promile (1-0,9972 = 0,0028). n 0 1 2 3 4 5 6 7 8 9 10 π(n) 0,0183 0,0733 0,1465 0,1954 0,1954 0,1563 0,1042 0,0595 0,0298 0,0132 0,0053 Φ(n) 0,0183 0,0916 0,2381 0,4335 0,6288 0,7851 0,8893 0,9489 0,9786 0,9919 0,9972 Nejpravděpodobnější počet poruch během osmihodinové směny je tři až čtyři (protože parametr Poissonova rozložení je v našem případě přirozené číslo, budou mody existovat dva). Návod pro MATLAB: x=[0:10]'; pf=poisspdf(x,4); df=poisscdf(x,4); [x pf df] Grafické znázornění: plot(x,pf,'o') figure stairs(x,df) (Samostatný úkol: Jak nakreslit graf distribuční funkce bez svislých čar?) Jedno z možných řešení: hold on for i=1:(length(x)-2) plot([i,i],[0,1],'w'); end Úkol 2.: Pro n = 30 a ϑ = 0,1 ilustrujte aproximaci binomického rozložení Bi(n, ϑ ) Poissonovým rozložením Po(nϑ ). Vypočtené hodnoty obou pravděpodobnostních funkcí v bodech x = 0, 1, …, 30 zapište do tabulky a znázorněte graficky. Návod: x=[0:1:30]'; pf1=binopdf(x,30,0.1); pf2=poisspdf(x,3); [x pf1 pf2] plot(x,pf1,'o',x,pf2,'*') Úkol 3.: Vygenerujte 100 realizací náhodné veličiny s rozložením Po(2) a nakreslete jejich histogram. Návod: r=poissrnd(2,100,1); hist(r,x) Úkol 4.: Odhadněte střední hodnotu a vypočtěte meze 95% intervalu spolehlivosti pro střední hodnotu na základě proměnné r z předešlého úkolu. (Hodnoty uložené v proměnné r považujeme za realizace náhodného výběru rozsahu 100 z rozložení Po(2).) Návod: [m,meze]=poissfit(r) Upozornění: MATLAB počítá meze intervalu spolehlivosti pro střední hodnotu λ podle vzorce: ( )nm2 n2 1 d 2/ 2 αχ= , ( )( )1nm2 n2 1 h 2/1 2 +χ= α− , nikoliv podle vzorce 2/12/1 u n m mh,u n m md α−α− +=−= , který využívá aproximaci Poissonova rozložení normálním rozložením.