Visualisering Av Data

4 grafer över svensk tillit

Det här inlägget har även publicerats på forskarbloggen Politologerna “Två fakta gifva förnämligast det svenska folklynnet sin karaktär i våra dagar. Det ena är, att vi svenskar älska och intressera oss för naturen men icke för människor. Det andra: att vi sakna nationalkänsla.” Detta konstaterade Gustav Sundbärg 1911 i boken Det svenska folklynnet (som tillgängliggjorts via beundransvärda Projekt Runeberg). I dag är debatten om svensken och det svenska ånyo aktuell. En debatt som skulle främjas av tydligare definitioner och en grund av empiri.

Visualisering av vädret i Stockholm

Ett nytt år har inletts. Min förhoppning är att 2017 ska visa sig vara ett produktivt år. Jag har även tänkt börja använda statistikprogrammet R i högre grad än tidigare. Det finns ett flertal skäl till det beslutet, men framför allt finns en växande rörelse kring programmet och inom den skapas en stadigt ökande mängd av nya, spännande funktioner. Det bästa sättet att komma in i ett nytt statistikspråk är att använda det praktiskt.

QQ-plots med Pisa-resultat

Sommaren är en utmärkt tid för att experimentera lite med data, metoder och program. Bland allt har jag tänkt använda statistikprogrammet R lite mer än jag brukar (vanligtvis använder jag Stata eller SAS - se min översikt av statistikprogram här). Den här bloggposten är en kombination av ovanstående. En intressant form av grafer är så kallade QQ-plots, eller quantile-quantile plots. De är ett alternativ till histogram om man vill studera fördelningar.

Proportionella venndiagram

Häromveckan fick jag frågan om hur man på bästa sätt gör ett venndiagram där cirklarna är proportionella i förhållande till gruppernas storlek (om du inte känner till venn- och eulerdiagram, se ett av mina tidigare inlägg). Jag är inte helt säker på om jag tycker att det är en strålande idé över huvud taget. Om man vill illustrera olika gruppers storlek är cirklar inget bra alternativ (en dag kanske den insikten även kommer till DN:s grafiker, även om jag börjar ge upp hoppet).

Fler bloggar

Gratis kurser på nätet

Så här i jultider och inför det kommande året kan det vara värt att tipsa om ett antal kurser på nätet som alla är gratis: Statistics 110 Grundläggande statistikkurs med mycket om sannolikhetslära. Föreläsare är Joe Blitzstein från Harvard. Kursen består i huvudsak av ett antal videolektioner som finns tillgängliga via iTunes här. Introduction to Inforgraphics and Data Visualization. En kurs i visualisering av data som ges av Knight Center for Journalism in the Americas, University of Texas.

Gratis är gott

Uppdaterad 15 oktober 2012: Alberto Cairo har meddelat att The Knight Center har begränsat antalet deltagare i kursen av rädsla för att servrarna inte ska klara av trycket. Kursen kommer dock att ges igen i januari och vid ytterligare tillfällen senare om intresset finns. Världen förändras. Som jag tidigare har skrivit är ett av världens mest kraftfulla statistikprogram gratis. Det heter R. För den som är intresserad av att lära sig mer om R eller andra program finns mängder av resurser på nätet.

Cirkelresonemang

Cirkeldiagram (eller tårtdiagram som de också kallas) är vanligt förekommande i visualiseringar av data. Tyvärr används de ofta på ett mindre lyckat sätt. Detta har gjort att de fått ett väldigt dåligt rykte, men det finns tillfällen där cirkeldiagram fungerar riktigt bra. Jag påmindes om det häromdagen när jag läste en diskussion kring cirkeldiagram som uppstod med anledning av ett inlägg från Quora. I likhet med linjediagrammet och stapeldiagrammet så skapades cirkeldiagrammet av William Playfair.

Anscombes kvartett

Att grafiskt åskådliggöra sina data är inte bara en möjlighet att underlätta för läsaren att förstå och tolka en undersöknings resultat. Det är inte konstigt att många inflytelserika forskare inom samhällsvetenskaperna, som Gary King och Andrew Gelman, på senare tid lyft fram vilket fantastiskt verktyg visualisering av data kan vara i dessa sammanhang (även om genomslaget än så länge varit ganska litet, i alla fall i Sverige). Grafiken kan även vara till stor hjälp vid analys av data.

Venn och Euler

Med det ökande intresset för visualiseringar av data har Euler- och framför allt Venndiagrammen fått en renässans. Det har på senare tid skrivits en del bra om dessa diagram på olika håll, så jag passar på att skriva ned några rader och ge ett par länkar (se längst ned). Venndiagram är diagram som visar alla logiskt möjliga kombinationer mellan mängder (klasser). De används flitigt i mängdlära. Vanligen tar de formen av två eller tre överlappande cirklar.