De variantie is één van de spreidingsmaten die je in de statistiek kunt gebruiken. Hiermee reken je de spreiding binnen een set data uit. Een grotere spreiding betekent dat de data relatief sterk verspreid zijn rondom het gemiddelde. Hoe kun je de variantie berekenen? Wanneer is dit een passende spreidingsmaat? Dat alles lees je hieronder.
Betekenis variantie
De betekenis van variantie is als volgt: het is een manier om de spreiding in een dataset weer te geven ten opzichte van het gemiddelde. Voor de variantie bereken je het rekenkundig gemiddelde van de gekwadrateerde afwijkingen ten opzichte van het gemiddelde. De variantie is dan ook afgeleid van de standaarddeviatie (een andere veelgebruikte spreidingsmaat).
Variantie of standaarddeviatie?
Zowel de variantie als de standaarddeviatie zijn manieren om de spreiding van alle waarden rondom het gemiddelde weer te geven. De standaarddeviatie wordt berekend aan de hand van de variantie. Dit is het verschil tussen beide:
- Bij de standaarddeviatie druk je de spreiding uit in de oorspronkelijke waarden (bijvoorbeeld in centimeters).
- Bij de variantie druk je de spreiding uit in grotere maten dan de oorspronkelijke waarden (zoals in vierkante centimeters).
De standaarddeviatie wordt vaker gebruikt als spreidingsmaat, omdat deze makkelijker te interpreteren is dan de variantie. Aan de andere kant geeft de variantie meer informatie die belangrijk is voor statistische berekeningen. Zo kun je uit de variantie beter afleiden of je jouw bevindingen bij de steekproef kunt generaliseren naar de hele populatie.
Welke andere spreidingsmaten zijn er?
De variantie is één van de spreidingsmaten. Andere veelgebruikte spreidingsmaten zijn:
- Bereik (“range”): het verschil tussen de laagst gemeten en de hoogst gemeten waarde binnen de complete dataset.
- Standaarddeviatie: een maat om aan te geven in hoeverre de data gemiddeld genomen afwijken van het gemiddelde.
- Interkwartielafstand: de spreiding binnen de middelste helft van alle gemeten data als je de waarden van hoog naar laag sorteert.
Variantie berekenen
De variantie kun je berekenen met twee verschillende formules. Het maakt daarbij uit of je werkt met data van alle leden uit de populatie of dat je een steekproef hebt getrokken.
Bij dataverzameling onder de totale populatie bereken je de variantie als volgt:
Daarbij staan de tekens voor het volgende:
- σ2 = de variantie binnen de populatie
- ∑ = de som van wat daarna komt
- X = elke gemeten waarde
- μ = populatiegemiddelde
- N = het aantal gemeten waarden
Meestal is er sprake van een steekproef, omdat de meeste populaties te groot zijn om bij iedereen data te kunnen verzamelen. De variantie binnen een steekproef reken je als volgt uit:
Die formule kun je interpreteren aan de hand van deze waarden:
- s2 = variantie binnen de steekproef
- ∑ = de som van wat daarna komt
- X = elke gemeten waarde
- X̄ = het gemiddelde binnen de steekproef
- n = het aantal gemeten waarden
De bovenstaande formules zien er vrij ingewikkeld uit. Gelukkig hoef je de variantie niet handmatig uit te rekenen. Hier kun je software als SPSS voor gebruiken.
Wat maakt variantie een goede spreidingsmaat?
Als je een parametrische statistische toets wilt doen, is het belangrijk dat je eerst de variantie berekent. Bij dit soort toetsen doe je namelijk bepaalde aannames, zoals dat je uitgaat van “homogeniteit van variantie”. Het is dan belangrijk dat je eerst toetst of de varianties vergelijkbaar zijn in de verschillende steekproeven. Alleen in dat geval kun je de steekproeven vergelijken. Blijkt dat er sprake is van ongelijke varianties? Dan zijn de resultaten vertekend of scheef. In dat geval kun je beter een andere statistische toets kiezen.
Daarnaast kan variantie nuttig zijn als je de verschillen tussen groepen wilt bepalen. Je gebruikt de steekproefvariantie bijvoorbeeld bij de ANOVA-toets (Analysis of Variance). Deze toets kijkt naar de varianties binnen de steekproeven om te bepalen of de populaties waar de steekproeven uit getrokken zijn overeenkomen of niet. Als de variantie binnen een groep kleiner is dan de variantie tussen de groepen, dan is de onafhankelijke variabelewaarschijnlijk de oorzaak van het verschil in resultaten. Als dat niet zo is, dan ligt het verschil hem vaak eerder aan individuele verschillen tussen steekproefleden.
Meer lezen over onderzoek doen?
Je bent nu een stuk wijzer over spreidingsmaten en statistische toetsen. Wil je daarnaast meer weten over de verschillende onderzoeksmethoden, het maken van een onderzoeksplan en het schrijven van je methodehoofdstuk? Over al dat soort onderwerpen staan artikelen in onze kennisbank. Lees zeker verder, zodat je goed voorbereid met jouw onderzoek van start kunt gaan.