Att korrelation inte innebär kausalitet är ett välkänt påpekande. Mindre uppmärksammat är att korrelationens tecken – det vill säga om sambandet är positivt eller negativt – inte heller nödvändigtvis säger något om tecknet på en eventuell kausal relation.
Två exempel kan illustrera detta.
1) Anta att individ A överväger att påbörja en viss diet och observerar att en stor andel av dem som följer dieten är överviktiga. A drar därför slutsatsen att dieten inte är effektiv. Resonemanget bortser dock från att urvalet av dem som använder dieten sannolikt inte är slumpmässigt: det är just personer med övervikt som har ett starkare incitament att påbörja en viss diet. Den positiva korrelationen mellan diet och övervikt säger därmed ingenting om dietens kausala effekt på viktnedgång.
2) Anta att individ B vill bli bättre på basket och noterar att professionella spelare i regel använder stora skor. B köper därför större skor, men upplever i stället en försämring i prestation. Här är det uppenbart att skostorleken inte orsakar de professionella spelarnas höga prestationen – snarare är båda fenomenen kopplade till en tredje faktor, nämligen kroppslängd och fysik, vilket påverkar skostorleken. Även här är det observerade sambandet inte informativt om någon kausal relation, eller tecknet på den, mellan de två variablerna.
I vardagliga sammanhang är denna typ av felslut ofta relativt lätt att identifiera. Samma logik är emellertid betydligt svårare att tillämpa när frågan gäller komplexa samhällsfenomen där de bakomliggande mekanismerna är mindre synliga och där urvalet av individer eller enheter sällan är slumpmässigt.
Ett vanligt exempel i den offentliga debatten rör relationen mellan straffnivåer och brottslighet. Resonemanget tar ibland formen att ett land med relativt stränga straff också uppvisar hög brottslighet, och att detta därmed skulle visa att strängare straff orsakar mer brott. Logiskt sett är detta en form av samma misstag som i dietexemplet. Att två fenomen samvarierar i ett givet fall innebär inte att det ena orsakar det andra. Det kan lika gärna vara så att hög brottslighet leder till politiska beslut om strängare straff, eller att båda påverkas av gemensamma, underliggande faktorer såsom sociala, ekonomiska eller institutionella förhållanden.
Ur ett metodologiskt perspektiv saknas den kausala länken som visar att förändringar i straffnivåer, allt annat lika, leder till förändringar i brottslighet. Utan en strategi för att isolera denna effekt – exempelvis genom att utnyttja exogena variationer eller experimentliknande situationer – förblir slutsatsen deskriptiv snarare än kausal.
Detta knyter an till den bredare diskussionen om självselektion och identifiering som varit central i de föregående texterna. I de flesta samhällsvetenskapliga sammanhang är individer, regioner eller länder inte slumpmässigt ”tilldelade” till olika policyregimer, beteenden eller institutionella arrangemang. De observerade utfallen är därför resultatet av både de faktorer vi är intresserade av att studera och de faktorer som påverkar vem som hamnar i vilken situation från början.
Att etablera kausalitet kräver således mer än att dokumentera samvariation. Det kräver en forskningsdesign som, åtminstone approximativt, kan besvara frågan om vad som hade hänt i frånvaro av den faktor man studerar – det kontrafaktiska utfallet. Randomiserade experiment är ett sätt att uppnå detta, men i många tillämpningar måste forskaren i stället förlita sig på naturliga experiment, institutionella trösklar eller andra källor till exogen variation.
Kausala samband i komplexa samhällsfrågor är inte omöjliga att studera, men de kräver en metodologisk stringens som går utöver jämförelser av genomsnitt och enkla korrelationer.