Synes du stadig det med stikprøver og sandsynlighed er svært?
Hvis det sidste indlæg gav dig mere forvirring end klarhed, er der ingen grund til bekymring — de fleste føler vist sådan, tror jeg.
Når faktiske observationer møder anvendt statistik i krydsfeltet af sandsynligheder, bliver alt nemlig lidt sløret.
Lad os alligevel se på kassen med blå og røde kugler og forestille os, at der er 10% røde kugler i kassen.
Det betyder, at hvis du kun tager én kugle, er der 10% chance for, at det er en rød kugle — og det spiller ingen rolle, om kassen er stor eller kæmpestor; 10% er stadig 10% (det kommer jeg tilbage til senere, men husk det lige).
Hvis du tager endnu en kugle, er der igen 10% chance for, at den er rød.
Hvis der er 10% chance for, at kuglen er rød, er der altså 90% chance for, at den er blå.
Hvorfor er det vigtigt? Fordi når du tager to kugler, kan du få forskellige kombinationer:
Den sidste kombination viser ingen røde kugler, og det fører hurtigt til konklusionen, at der ikke er nogen røde kugler i kassen!
Hvis din specifikation siger, at røde kugler er defekte, og du ikke vil sende (for mange) defekte dele til din kunde, er dette vigtigt.
Der er 90% × 90% = 81% chance for at trække to blå kugler og dermed ingen røde kugler. Så selv med 10% røde kugler er der 81% chance for, at du sender denne kasse videre.
To prøver virker som et lavt antal, hvis du ønsker gode kunderelationer. Men at kigge på alle de 650.000 kugler vil tage uger og koste en formue! En prøve et sted der imellem er nok mere fornuftig, men er det 10 eller 1000?
Derfor betyder stikprøvestørrelsen noget. Det er altid en balance mellem risiko og omkostninger.
Og om kasserne nævnt ovenfor, vil der komme mere at læse om senere, så følg med…
For yderligere information kontakt EpsilonPlus her.
For at læse flere interessante posts se denne side.
