-
Vrste slucajnih spremelnjivk, primeri
- Slucajna spremenljivka X je kolicina, katere vrednosti so rezultat slucajnega poskusa
-
numericne:
- diskretne: met kovanca, met kocke, streljanje na tarco
- zvezne: verjetnost da je cas prihoda dveh zaporednih vlakov pod 3min
-
kategoricne: (imajo kategorije za vrednosti)
-
nominalne (imenske): kategorije brez vrstenga reda / urejenosti
- spol: 0 = moski, 1 = zenski
- barva las: 1 = crna, 2 = rjava, 3 = rdeca, 4 = blond, 5 = bela
-
ordinalne (urejenostne): kategorije z vrstnim redom / urejenostjo
- stopnja bolecine: 0 = ni, 1 = blaga, 2 = srednja, 3 = mocna
- stopnja izobrazbe: 1 = brez, 2 = osnovna sola, 3 = srednja sola, 4 = fakulteta
-
nominalne (imenske): kategorije brez vrstenga reda / urejenosti
-
Frekvenca porazdelitev
-
tabela skupin vrednosti (razredov) in njihovih frekvenc v podatkih
-
obstaja min, max, spodnja, zgornja meja, sirina, sredina rezreda, komulativna frekvenca, relativna frekvence
- primer zabelezili smo krvno skupino nakljucnega vzorca 100 slovencev.
Krvna Skupina 0 A B AB frekvenca f 38 40 15 7
-
-
Graficni prikaz podatkov
-
Histogram
- podatke razdelimo v razrede (intervale) in prestejemo stevilo podatkov v vsakem razredu
- z
$n$ podatkov je potrebno stevilo razredov:$\lceil \log_2(n) \rceil + 1$ - dolzina razreda:
$h = \frac{max-min}{k}$ - npr. imamo 45 podatkov o tezi (n=45)
- minimalna teza = 52.3kg, maksimalna = 86kg
- potrebujemo
$k=\lceil \log_2(45)\rceil+1=7$ rezredov - dolzina razreda:
$h=\frac{max-min}{k}=\frac{86-52.3}{7}=4.8 \approx 5$
-
tortni diagram
- vsakemu razredu priredimo krozni odsek
- kot
$\alpha_i= \frac{f_i}{n} \cdot 360\text{degrees}$
-
Skatla z brki
-
Primeri razlicnih tipov histrogramov in skatel z brkami
-
-
Grafi in opisna statistika glede na vrsto slucajne spremenljivke
- Kategoricne spremenljivke
Podatki Opisna Statistika Grafi Nominalni Modus Stolpicni diagram Ordianlni Modus, mediana, kvartili Stolpicni diagram - Numericne spremenlijvke
Podatki Opisna Statistika Grafi Diskretni povprecje, standardni odklon, povzetek s petimi stevili Malo stevilo vrednosti: stolpicni diagram, Vecje stevilo vrednosti: histogram, skatla z brki Zvezni povprecje, standardni odklon, povzetek s petimi stevili Histogram, skatla z brki -
Vzorcne statistike
-
ordinalne slucajne spremenljivke
- Lahko jim izracunamo modus, vzorcno mediano in vzorcne kvartile
- Podatke razvrstimo po vrsti
$Y_1 \leq Y_2 \leq \dots \leq Y_n$ - npr stopnje bolecine:
$0,0,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3$
- npr stopnje bolecine:
- Modus (najpogostejsa vrednost) = 2
- Mediana (drugi kvartil
$Q_2$ ) predstavlja srednji podatek = 2 - Prvi kvartil
$Q_1$ je mediana prve polovice sortiranih podatkov = 1 - Tretji kvartil
$Q_3$ je mediana druge polovice sortiranih podatkov = 2
- Podatke razvrstimo po vrsti
- Lahko jim izracunamo modus, vzorcno mediano in vzorcne kvartile
-
zvezne slucajne spremenljivke:
- Vzorcno povprecje:
$\overline{x}=\frac{1}{n} \sum\limits_{i=1}^n x_i$ - Popravljeni vzorcni standardni odklon
$s=\sqrt{\frac{1}{n-1} \sum\limits_{i=1}^n (x_i-\overline{x})^2}$ - povzetek s petimi stevili: minimum, maksimum, mediana, prvi in tretji kvartil
- Vzorcno povprecje:
-
diskretne slucajne spremenljivke:
- enako kot zvezne (vzorcno povprecje, vzorcni standardni odklon, povzetek s petimi stevili)
-
Pojasni pravili za vsoto in produkt, ki ju uporabljamo pri stetju
-
vsota:
- Kadar se pri izbiranju odlocamo za eno od
$n_1$ moznosti iz prve mnozice ali za eno od$n_2$ moznosti iz druge, .... ali za eno od$n_k$ moznosti iz tretje in so te mnozice paroma disjkunktne, potem je stevilo vseh moznih izidov$$\sum\limits_{i=1}^k n_i=n_1+n_2+n_3+\dots n_k$$ -
Primer: Iz Ajdove gore do Brezic vodi 5 poti, iz Brezic do Cvetocoega dola pa 4. Na koliko nacinov lahko pridemo
z Ajdove gore do Cvetocega dola, ce imamo med njima se 3 direktne poti?
$5\cdot 4 + 3 = 23$
- Kadar se pri izbiranju odlocamo za eno od
- produkt
- Izbiranje poteka v k korakih, na vsakem koraku imamo
$n_i$ moznosti. - Vseh moznosti:
$\prod\limits_{i=1}^{k} n_i = n_1 \cdot n_2\cdot n_3 \cdots n_k$ -
Primer: Koliko je vseh tri-mestnih stevil:
$9\cdot 10 \cdot 10$
- Izbiranje poteka v k korakih, na vsakem koraku imamo
-
vsota:
-
Definiraj permutacije (in omeni kaksen primer)
- vrstni red je pomemben
-
brez ponavljanja
- So vse mozne razporeditve n razlicnih elementov na n prostih mest
$n!=n\cdot(n-1)\cdot(n-2)\cdots 2\cdot 1$ - Primer: Imamo 5 mest in 5 stevil {1,2,3,4,5}, koliko razlicnih stevil lahko sestavimo ce moremo vsako stevko uporabiti natanko enkrat?
-
s ponavljanjem
- razporeditve
$n$ ne nujno razlicnih elementov - Elemente razdelimo v skupine enakih
- Ce je teh skupin m, in ima vsaka skupin
$k_i$ elementov $$\begin{pmatrix} n \ k_1, k_2,\dots k_m\end{pmatrix} = \frac{n!}{k_1!\cdots k_m!}$$ - Primer: Na koliko nacinov lahko razporedimo na polici 3 romane, 4 ucbenike in 2 vodica, ce knjig iste vrste ne razlikujemo? $$\begin{pmatrix} 9 \ 3,4,2 \end{pmatrix} = \frac{9!}{3!\cdot 4!\cdot 2!}=1260$$
- razporeditve
-
Definiraj variacije (in omeni kaksen primer)
- Vrstni red je pomemben
-
brez ponavaljanja
- Razporeditev
$n$ razlicnih elementov na$k$ prostih mest vsak element najvec enkrat nastopi$$\frac{n!}{(n-k)!}=n\cdot (n-1) \cdot (n-2) \cdots (n-k+1)$$ -
Primer: Imamo 3 mesta ter 5 stevil
$\left{1,2,3,4,5\right}$ . Koliko razlicnih stevil lahko sestavimo ce lahko vsako stevko uporabimo najvec enkrat?$$5\cdot 4\cdot 3$$
- Razporeditev
-
s ponavaljanjem
- Razporeditve
$n$ razlicnih elementov na$k$ mest vsak element uporabimo poljubno krat $n^k= n \cdot n \cdots n$ -
Primer: Na koliko nacinov lahko izberemo 3 izmed 5ih kroglic ce kroglice vracamo ter upostevamo vrstni red?
$$5\cdot 5 \cdot 5$$
- Razporeditve
-
Definiraj kombinacije (in omeni kaksen primer)
- vrstni red ni pomemben
-
brez ponavljanja
- So izbire k elementov izmed n razlicnih elementov (vsak element lahko izberemo najvec enkrat) $$\begin{pmatrix}n \ k\end{pmatrix}=\frac{n!}{k!(n-k)!}$$
- Imamo 4 razlicne kroglice. Na koliko razlicnih nacinov lahko izberemo 2. $$\begin{pmatrix}4 \ 2\end{pmatrix}= \frac{4\cdot 3\cdot 2!}{2! \cdot (4-2)!}=\frac{12}{2}=6$$
-
s ponavljanjem
- So izbire k elementov izmed n razlicnih elementov (vsak element lahko izberemo veckrat)
- Loterija: zreb 7 stevil izmed 39 kroglic, ki se po vsakem krogu vracajo v boben.
- Z crticami oznacimo 39 predalckov, vsakic ko vlecemo neko kroglico jo dodamo v pripadajoc predalcek (predalcek 1 = stevilka 1, predalcek 2 = stevilka 2, ...)
- S takim nizom lahko predstavimo vse mozne kombinacije (niz crtic in kroglic)
- presteti moramo vse nize take oblike k=7 krogcev, n+1=40 crtic
$\rightarrow$ prve in zadnje se znebimo ker sta fiksni$\rightarrow$ dobimo 38 crtic (n-1)) - torej izmed k+n-1 moznih mest moramo izbrati k mest kamor narisemo krogec ali pa izmed k+n-1 mest izbremo n-1 mest kamor narisemo crtico
- Torej dobimo $\begin{pmatrix} k+n-1 \ k\end{pmatrix}=\begin{pmatrix}7+38 \ 7\end{pmatrix}$
- presteti moramo vse nize take oblike k=7 krogcev, n+1=40 crtic
- $\begin{pmatrix}\begin{pmatrix}n \ k\end{pmatrix}\end{pmatrix}=\begin{pmatrix}k+n-1 \ k\end{pmatrix}$
-
Iz zgornje definicije izpelji posebna primera: permutacije, kombinacije
-
kombinacije: variacije brez vrstnega reda
- pri variacijah se znebimo ponovitev tako da v imenovalec dodamo r!
-
permutacije: so variacije kjer je (st mest) k = n
- dobimo
$\frac{n!}{(n-n)!}=n!$
- dobimo
-
kombinacije: variacije brez vrstnega reda
-
Podaj binomski obrazec in definiraj Pascalov trikotnik
-
Z limito vpelji stevilo e = 2.71 ki predstavlja osnovo za naravni logaritem
$e=\lim\limits_{n\rightarrow \infty} (1+\frac{1}{n})^n$ - Razpisemo $(1+\frac{1}{n})^n= 1 + \begin{pmatrix}n \ 1 \end{pmatrix} \frac{1}{n} + \begin{pmatrix}n \ 2 \end{pmatrix} \frac{1}{n^2} + \cdots \begin{pmatrix} n \ n \end{pmatrix} \frac{1}{n^n}$
- Vsota celotnega torej:
$1+\frac{1}{1!}+\frac{1}{2!}+\dots + \frac{1}{n!}=e$ - Taylorjeva vrsta za
$e^x= \sum\limits_{n=0}^\infty \frac{x^n}{n!}$
- Taylorjeva vrsta za
-
Podaj primer, kjer pridemo do tega stevila v kombinatoriki
- poissonova porazdelitev
- dobimo jo kot limitni primer binomske porazdelitve (binomski obrazec)
$p_k= \frac{e^{-\lambda}\cdot \lambda^k}{k!}$
- dobimo jo kot limitni primer binomske porazdelitve (binomski obrazec)
- poissonova porazdelitev
-
Definiraj prostor dogodkov (tudi nemogoc, gotov in nasproten)
-
$\Omega \equiv$ verjetnostni prostor$\equiv$ mnozica vseh izidov -
Dogodek A
$\subseteq \Omega$ (mnozica) -
Gotov dogodek:
$A\cap \Omega = \Omega$ $P(A)=P(\Omega)=1$ - dogodek ki se zgodi ob vsakem poskusu
-
Nemogoc dogodek:
$A\cap \Omega=\emptyset$ ,-
$P(A)=P(\emptyset)$ = 0 - dogodek ki se ne zgodi ob nobenem poskusu
-
-
Nasproten dogodek:
$A^C$ ,-
$A^C\cap A=\emptyset$ ,$P(A^C)=1-P(A)$ (komplementarna mnozica) - v vsakem poskusu se zgodi ali
$A$ ali$A^C$
-
-
-
Definiraj vsoto dveh dogodkov
- Vsota dogodkov je predstavljena z unijo
$A+B=A\cup B$ - ali se zgodi en ali se zgodi drug
$P(A\cup B)=P(A)+P(B)-P(A\cap B)$
- Vsota dogodkov je predstavljena z unijo
-
Definiraj Produkt dveh dogodkov
$AB=A\cap B$ - Produkt dveh dogodkov je verjetnost da se zgodita oba dogodka hkrati (presek)
$P(A\cap B)=P(A)+P(B)-P(A\cup B)$
-
Nastej lastnosti za vsoto dveh dogodkov
$P(A\cup B)= P(B\cup A)$ $P(A\cup A)= P(A)$ $P(A\cup \Omega)=P(\Omega)$ $P(A\cup \emptyset)=P(A)$
-
Nastej lastnosti za produkt dveh dogodkov
$P(AB)=P(BA)$ $P(AA)=P(A)$ $P(A\Omega)=P(A)$ $P(A\emptyset)=\emptyset$
-
Podaj pravilo o vkljucitvi/izkljucitvi
-
$P(\bigcup\limits_{i=1}^n A_i)= \sum\limits_{i=1}^n P(A_i)- \sum\limits_{1\leq i <j \leq n}P(A_i\cap A_j)+\sum\limits_{1\leq i < j < k\leq n}P(A_i\cap A_j \cap A_k)- \cdots +(-1)^{n-1}P(A_1\cap\cdots \cap A_n)$ $P(A\cup B)= P(A) + P(B) - P(A\cap B)$ $P(A\cup B \cup C)=P(A)+P(B)+P(C)-P(A\cap B)-P(B\cap C)-P(A\cap C)+P(A\cap B \cap C)$
-
-
Podaj najmanjsi popoln sistem dogodkov
-
$\Omega$ (samo 1 gotov dogodek)
-
-
Kdaj je mnozica dogodkov popoln sistem
- mnozica dogodkov
$H_1, H_2 \dots, H_n$ , kjer velja:$\bigcup\limits_{i=1}^n H_i = \Omega$ $\bigcap\limits_{1\leq i < j \leq n} H_i \cap H_j =\emptyset$
- mnozica dogodkov
-
Statisticna definicja verjetnosti
- Verjetnost dogodka A v danem poskusu je stevilo P(A) h kateremu konvergira relativna frekvenca dogodka A v velikem stevilu ponovitev poskusa
- relativna:
$f(A) = \frac{k}{n}$ , k stevilo ugodnih, n stevilo poskusov
- relativna:
- Verjetnost dogodka A v danem poskusu je stevilo P(A) h kateremu konvergira relativna frekvenca dogodka A v velikem stevilu ponovitev poskusa
-
Klasicna definicija verjetnosti (izpeljava)
$P(A)=\frac{|A|}{|\Omega|}=\frac{\text{st. izidov v A}}{\text{st. vseh izidov}}$
-
Geometricna definicija vrjetnosti
-
$P(A)=\frac{\text{mera (A)}}{\text{mera }(\Omega)}$ , mera je dolzina, ploscina, volumen, ...
-
-
Podaj zvezo med verjetnostmi dveh dogodkov ter njunima vsoto in produktom (in jo utemelji bodisi s statisticno ali geometrijsko definicjo verjetnosti)
-
Primer
- Vrzemo dve kocki
-
$A\equiv$ na prvi kocki pade 6 pik -
$B\equiv$ skupaj pade 10pik -
$P(A\mid B)$ koliksna je verjetnost da je na prvi kocki padlo 6 pik ce vemo da je bila vsota na obeh kockah 10
-
Definiraj pogojno verjetnost (s kompleksom pogojev)
$P(A\mid B)=\frac{P(A\cap B)}{P(B)}$ - Ce sta dogodka neodvisna
$\rightarrow P(A\cap B)=P(A)P(B)$ $P(A\mid B) = P(A)$
-
Podaj formulo, ki poveze obicajno in pogojno verjetnost
$P(A\cap B)=P(B)P(A\mid B)$ -
$P(A\cap B)=P(A)P(B\mid A)$ $P(A)P(B\mid A)=P(B)P(A \mid B)$
-
Zakaj je pomembna graficna predstavitev z drevesom
- TODO
-
Izpelji formulo za racunanje pogojne verjetnosti (z uporabo statisticne definicije verjetnosti in/ali geometrijske definicije verjetnosti)
- TODO
Redko nalezljivo bolezen dobi ena oseba na 1000. Imamo dober a nepopolen test za to bolezen: ce ima neka oseba to bolezen potem test potrdi to v 99% primerih
Test napacno pokaze 2% negativnih pacientov kot bolanih.
-
dogodek A: pacient je dobil nalezjlivo bolezen
-
dogodek B: pacientov test je bil pozitiven
-
$P(A)=0.001$ -
$P(B|A)=0.99$ -
$P(B|\overline{A})=0.02$ (dogodek "napacno pooizitven")
Zanima nas$P(A|B)$ , verjetnost da smo se nalezli ce je test pozitiven?$$P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{A\cap B}{P(A\cap B)+P(\overline{A}\cap B)}=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|\overline{A})P(A)}$$ -
drevesna struktura
-
nepopolna formula
- TODO
-
formula za popolno verjetnost
$A=(A_1\cap H_1) \cup (A_1\cap H_2) \cup \dots \cup (A_1 \cap H_n)$ -
$P(A)= P(A \cap H_1) + \dots + P(A\cap H_n)$ - uporabimo:
$P(A \mid H_i) = \frac{P(A\cap H_i)}{P(H_i)} \rightarrow P(A\cap H_i)= P(A\mid H_i)\cdot P(H_i)$
- uporabimo:
$P(A)=P(A|H_1)P(H_1)+P(A|H_2)P(H_2)+\dots P(A|H_n)P(H_n)=\sum\limits_{i=1}^nP(A|H_i)P(H_i)$
-
Bayesov obrazec
- za popoln sistem dogodkov
$H_i$ $P(H_i\mid A)=\frac{P(H_i)\cdot P(A\mid H_i)}{P(A)}=\frac{P(H_i)\cdot P(A\mid H_i)}{\sum\limits_{k=1}^nP(H_k)\cdot P(A\mid H_k)}$
- za popoln sistem dogodkov
-
Dokaz za Beysov obrazec in formulo za popolno verjetnost
- zgornja izpeljava samo po definiciji (mnozic)
-
primeri
- verjetnosti izidov v enem poskusu neodvisne od tega kar se je zgodilo v drugih poskusih
- V vsakem poskusu se lahko zgodi dogodek
$A$ ali pa$\overline{A}$ - mecemo kovanec:
-
$P(A)= 0.5$ (pade cifra) -
$P(\overline{A})=0.5$ (pade grb)
vecfazni poskusi
kombinacije
-
drevesna predstavitev
nepopolna formula
-
formula za racunanje verjetnosti (binomska porazdelitev)
- verjetnost da se dogodek A zgodi k krat v n zaporednih poskusih: $$P_n(k)=\begin{pmatrix}n \ k \end{pmatrix} p^k (1-p)^{n-k}$$
racunanje verjetnosti in/ali Laplacoev tockovni obrazec
zveza med binomsko in normalno porazdelitvijo i/ali Poissonovo porazdelitvijo
Dokazovanje pricakovane vrednosti z indikatorji
-
aritemticna sredina (k=1)
$$A_n = \frac{a_1+\cdots + a_n}{n}$$
-
geometrijska sredina (k=0)
$$G_n=\sqrt[n]{a_1 \cdot ... \cdot a_n}$$
-
kvadratna sredina (k=2)
$$K_n=\sqrt{\frac{a_1^2+\cdots+a_n^2}{n}}$$
-
harmonoicna sredina (k=-1)
$$H_n=\frac{n}{\frac{1}{a_1}+\cdots + \frac{1}{a_n}}$$
-
potencna sredina stopnje k
$$P_{n,k}=\sqrt[k]{\frac{a_1^k+\cdots +a_n^k}{n}}$$
-
neenakosti med njimi
- Sredine dveh stevil
$$H_2\leq G_2 \leq A_2 \leq K_2$$
- Sredine dveh stevil
-
dokaz
$A_2 \geq G_2$ (in karakterizacija enakosti)
$\frac{a+b}{2} \geq \sqrt{ab}$ $\frac{a^2+2ab+b^2}{4} \geq ab$ $a^2+b^2 - 2ab \geq 0$ $(a-b)^2 \geq 0$
-
dokaz
$K_2\geq A_2$ (in karakterizacija enakosti)
$\sqrt{\frac{a^2+b^2}{2}} \geq \frac{a+b}{2}$ $\frac{a^2+b^2}{2} \geq \frac{a^2+b^2+2ab}{4}$ $\frac{a^2+b^2-2ab}{4} \geq 0$ $\frac{(a-b)^2}{4} \geq 0$
dokaz brez besed