(deel 1)
Afgelopen week heb ik weer eens een Green Belt training Six Sigma verzorgd voor de dienstverlening. Helaas komt het niet zoveel meer voor dat mensen voor Six Sigma kiezen. Op de vraag "waarom" komen dan antwoorden als "te moeilijk al die statistiek", "niet van toepassing bij ons" of "we hebben onze handen al vol aan lean". Wie ben ik om de VOC niet serieus te nemen. Jammer vind ik het wel want volgens mij is ook in de dienstverlening veel te bereiken met Six Sigma. In een komende serie blogs zal ik wat schrijven over hypothese testen, een van de belangrijke instrumenten uit het rijke six sigma arsenaal. Deze week: deel1.
Waarom Hypothese Testen?
Hypothese testen kan een organisatie helpen bij het:
- Bepalen of een verandering aan een proces input variabele (die we in de six sigma wereld een x noemen), significant bijdraagt aan de verandering van de proces output (oftewel aan de y). Oftewel: als ik aan een bepaalde knop draai, gebeurt er dan wat ik wil dat er gebeurt.
- Statistisch bepalen of er verschillen bestaan tussen 2 proces outputs (tussen 2 verschillende y-en)
Hmm, zie je wel. Veel te moeilijk en daar hebben we toch niks aan. Wat moet ik met de x-en en y-en?
Steeds willen we met een hypothese test op basis van een steekproef (een klein groepje) een uitspraak doen over de populatie (de hele groep). Ik vraag aan 100 mensen of ze roken, 6% zegt ja. En nu doen ik de uitspraak "6% van de mensen in Nederland rookt". Beetje kort door de bocht? Klopt! Maar hier komt het wel op neer. Ik controleer 20 facturen en zie 3 fouten. Conclusie: 15% van alle facturen is fout. Uiteraard mag ik dit niet zomaar zeggen. Ik moet een slag om de arm houden maar die 6% rokers is vast wel een beetje in de buurt van het echte gemiddelde percentage in de populatie.
Uit de 2 bovenstaande voorbeelden zie je al snel dat we de ene keer te maken hebben met procenten (ik rook of ik rook niet) en de andere keer met een vast aantal fouten (1, 2, 3 enz.) Naast deze 2 soorten discrete data is er nog een andere belangrijke categorie data namelijk de zogenaamde continue data. Maar eerst een terug naar het voorbeeld van het roken.
Als ik wat gegevens in Minitab invoer (dat is een statistisch pakket) dan krijg ik de volgende output

In normale mensentaal staat er dat ik een test heb gedaan met 1 steekproef en met procenten (one proportion) en dat Minitab de 'slag om de arm" heeft uitgerekend. In de statistiek noemen we dat het CI (confidence Interval). Simpel gezegd mag ik met 95% zekerheid (ook weer zo'n statistische term) zeggen dat het percentage rokers tussen de 2,24 en 12,6% ligt. Dat klinkt niet zo nauwkeurig en dat is ook niet zo nauwkeurig. Best wel een grote slag om de arm moeten we houden en dat komt uiteraard omdat ik het maar aan 100 mensen heb gevraagd. Als ik het aan 1000 mensen ga vragen, wordt die slag om de arm een stuk kleiner.
Hypothese test
Doorgaand met bovenstaande zou nu de vraag kunnen komen: het was vroeger 4%. Is het dan nu slechter geworden. Kwestie van kijken naar die slag om de arm (het confidence interval). Valt die 4% er in dan is er statistisch gezien niets veranderd. Een volgende steekproef zou gemakkelijk iets op kunnen leveren als 3% (als ik 100 steekproeven ga nemen is het in 95 van die steekproeven zo dat ik waarden vind in het confidence interval vallen, dus tussen die 2,24 en 12,6% liggen).
Ik heb nu aan minitab verteld dat het vroeger zo was dat 4% van de mensen rookten (H0: p=0,04) en gevraagd of het anders is geworden. Ik krijg een p-value terug van 0,444 en daarmee zegt minitab: nee. Pas als die p onder een bepaalde waarde komt (ingewikkeld gezegd onder een alfa waarde van meestal 0,05) dan zeggen we dat het wel veranderd is. Dan verwerpen we H-null zoals dat heet. Nu is er onvoldoende bewijs gevonden om H-null te verwerpen en we houden dus de oude waarde: 4% van de mensen rookt.
Misschien ziet het er ingewikkeld uit en toen we dit vroeger allemaal met de hand moesten uitrekenen was het ook best wel ingewikkeld. En in de Black Belt Lean Six Sigma training rekenen we wel nog wat dingen met de hand na. Leuk! Nu is het vooral invoeren in een statistisch pakket en dan de juiste conclusie trekken. En zo kan iedereen hypothese testen doen en gebruiken 🙂 .
Conclusie
En wat natuurlijk het belangrijkst is: de juiste conclusies uit de juist gebruikte statistieken trekken. Statistiek fout gebruiken en vervolgens op basis van de foute conclusie gaan handelen is misschien nog wel erger dan zonder statistiek werken.
0 comments