Forskning for forskerspirer

Statistikk

Correlation doesn't imply causation, but it does waggle its eyebrows suggestively and gesture furtively while mouthing 'look over there'. https://xkcd.com/552/
Finn ut hva korrelasjon og kausalitet er for noe. Takk meg senere.

Når vi snakker om statistikk snakker vi ofte om et kvantitativt datamateriale bestående av tall, variabler og verdier. Statistikk kan også vise til alle de metodene, modellene og teoriene som man bruke i alle stadier av forskningsprosessen. vi kan bruke statistiske metoder for å vurdere hvor, hvor mye eller hvor mange data vi trenger i studien vår. Vi kan bruke statistikk til å vurdere hvorvidt det datamateriale vi sitter på kan si noe om en større helhet. Vi kan bruke statistikk til å kontrollere om forskjellen mellom to grupper er større enn det som kan være tilfeldig. Statistikk kan hjelpe oss til å se sammenhenger i et datamateriale som vi ikke ville funnet bare ved å se igjennom det. Statistiske metoder er også nyttige dersom vi virkelig vil sjekke om den sammenhengen vi håper og tror er der, faktisk er der.

Du trenger ikke en gang å kunne veldig mye matematikk for å jobbe statistisk (men det hjelper). Mange av de mest brukte statistiske analysene består av addisjon (+), substraksjon (-), multiplikasjon (*) og divisjon (÷). Det som kan være vanskelig i statistikk er å forstå hvordan de statistiske modellene fungerer, og det som kan være frusterende er når man blir klar over alle usikkerhetsmomentene man bør ta høyde for. Det er også det som gjør statistikk, når man gjør det skikkelig, til et fantastisk forskningsverktøy. Om man skal gjøre statistikk skikkelig tvinges man til å være grundig og avklare alle antagelser man tar i forskningen. Når det er sagt – som med alt annet – er det mange som tar snarveier eller er ukritiske i bruken av statistiske metoder. Med dataprogrammer som SPSS kan hvem som helst laste inn et datamateriale å kjøre statistiske tester uten å kunne noen av de underliggende matematiske formlene, men heller ikke de forebeholdene vi må ta. Om datamaterialet ikke er godt nok, så kan det fort bli krøll. Shit in, shit out, som det heter på fagspråket.

Selv om statistisk metode kan virke veldig vanskelig, litt fordi det har med tall å gjøre, så skal det ikke så mye trening til før man får en følelse for det. En plass må man begynne. Og så lenge dere ikke får resultatene publisert på forsiden av VG (uten å ha dem fagfellevurdert), skal det nok gå greit.

Dere trenger heller ikke å samle inn selve datamaterialet selv. Det finnes allerede gode, kvalitetsikra tall som dere kan forske på, eller bruke for å kontekstualisere eget datamateriale. Hos Statistisk Sentralbyrå finner dere statistikk for det som har med Norges befolkning å gjøre. Dette er stort sett populasjonsdata, det vil si at tallene beskriver stort sett alle i Norge. På nettsidene til Norsk samfunnsvitenskapelig datatjeneste finner dere også masse statistisk datamateriale. Her ligger det mange meningsmålinger og spørreundersøkelser. Disse har ofte tatt i bruk et representativt utvalg. Enkelt sagt betyr det at man bruker mellom 1 000 og 2 000 tilfeldig utvalgte respondenter til å si noe om befolkningen. Det er spesielt i denne type undersøkelser det blir viktig å sette seg inn i statistisk metode.

Statistikk kan være veldig spennende og fortelle oss en hel del om vår egen historie. Se for eksempel denne videoen med Hans Rosling som forsker på global helse og er kjent for å gjøre statistikk morsomt og engasjerende.

Lesetips

Det finnes mange tonn med introduksjonsbøker til statistikk. Mange av dem er skrevet for de som ikke liker matematikk eller tror at statistikk er spesielt vanskelig. Det meste er selvsagt på engelsk, men det finnes noen norske også.