Språket speglar det politiska tillståndet

Språk, historia, politik och Big data är några av beståndsdelarna i ett färskt projekt finansierat av Internetfonden.

Skribenten och opinionsbildaren Isobel Hadley-Kamptz har i samarbete med textanalysföretaget Gavagai utvecklat algoritmer och analyserat hur politiska frågor förändras över tid genom att lokalisera när nya ämnen föds. Syftet med projektet var att göra det möjligt för en bredare allmänhet att på ett begripligt sätt kunna följa hur politiska frågor behandlas i riksdagen, i redaktionella medier samt i sociala medier. På så sätt skapas en sorts spegel av det politiska tillståndet och de aktuella frågorna i Sverige.

– Man kan följa begreppens färd och se hur debatten rör sig mellan de olika arenorna, säger Isobel Hadley-Kamptz.

Idén väcktes ursprungligen för flera år sedan då Isobel Hadley-Kamptz kom i kontakt med ordmoln som illustrerade vilka ord som användes mest av republikaner respektive demokrater i den amerikanska kongressen. Hon började fundera över hur man skulle kunna analysera den politiska debatten i Sverige datalingvistiskt. Inspiration till projektet har bland annat hämtats från politiskt orienterade informationssystem som Capitol Words och Ikkieswijzer.

Material hämtat från de senaste hundra åren

För att kunna genomföra ett projekt som detta krävs det stora mängder rådata. De visste redan från början att de hade tillgång till riksdagsprotokoll eftersom riksdagstrycket är offentligt tillgängligt genom riksdagens API.

Att få fram nyhetstext visade sig dock vara svårare än väntat. Tack vare ett samarbete med Kungliga bibliotekets projekt Digidaily fick Isobel Hadley-Kamptz och hennes projektgrupp till slut tillgång till ett arkiv med texter hämtade från Aftonbladet och Svenska Dagbladet (SvD) som sträcker sig cirka hundra år tillbaka i tiden. Detta arkiv är inte släppt för allmänheten ännu.

Data från riksdagstryck, nyhetsmedier och sociala medier har sedan förts samman för parallell analys. Materialet omfattar sammanlagt över en miljard ord. Det tekniska har skötts av textanalysföretaget Gavagai och analysverktyget är baserat på deras omvärldsbevakningstjänst Ethersource. Analysmodellen som har använts bygger på att de vanligaste begreppen varje år har plockats ut genom sökningar efter de ord som ökat mest i förhållande till föregående två år. Därför uteblir sådana ämnen och ord som förekommit kontinuerligt över åren.

– Det man ser är själva födelsen av ett ämne, säger Isobel Hadley-Kamptz.

Historisk inriktning

Projektet har utvecklats efter hand och mot bakgrund av det material de fick tillgång till blev inriktningen lite annorlunda än det först var tänkt. I det första skedet har de därför tagit bort sociala medier och fokuserat på en mer språkhistorisk tillbakablick. Isobel Hadley-Kamptz tycker att språkbruket speglar tidsandan mycket tydligt och specifika ord kan härledas till stora politiska reformer eller världshändelser.

– Man kan se hur den politiska scenen förändras, säger hon.

Att mätmetoden primärt har fångat upp de ord som ökat kraftigt på kort tid ger även intressanta inblickar i dåtiden. Till exempel visar resultaten att ordet Tyskland blev viktigt i det politiska samtalet redan 1935, fyra år innan andra världskrigets bröt ut. Sannolikt fortsatte man dock att prata om Tyskland mycket även under kriget.

Följer samhällsutvecklingen

Redan 1902 diskuterade riksdagen nätet och ord som nätmyndigheten och nätkoncession användes frekvent. Detta konfunderade Isobel Hadley-Kamptz, tills hon såg att de andra orden var elektrisk, ström och anläggning och insåg att debatten handlade om utbyggnaden av elnätet.

En annan intressant aspekt är att man kan se när man börjar prata om nya tekniska innovationer som grammofon, telefax och internet. Man kan även se när e-posten gör entré under 90-talet och tidningarna börjar sätta ut sina mejladresser.

– Genom orden kan man följa utvecklingen av Sverige från ett förmodernt till ett postmodernt land, säger Isobel Hadley-Kamptz roat.

Analysen av materialet pekar även på tydliga skillnader mellan kanalerna, vilket delvis kan förklaras av att riksdagens ärendebehandling är något trögrörligare än nyhetsmediernas. Att diskussionerna i riksdagen respektive media var så skilda från varandra förvånade Isobel Hadley-Kamptz.

– Det är helt olika världar. Jag hade trott att de skulle vara mera lika, säger hon.

Kommer att lansera politiskaord.se

Projektet har dragit ut på tiden på grund av projektgruppens hektiska schema och är ännu inte fullbordat. I näste skede vill de få med sociala medier eftersom de är otroligt viktiga kanaler för den samtida diskussionen. För att få ett modernare perspektiv kommer de då att söka på begrepp och exempelvis härleda hur ordet främlingsfientlig byts ut mot invandringskritisk. Genom att titta på begrepp snarare än år tror Isobel Hadley-Kamptz att resultatet blir mer politiskt intressant.

Slutresultatet kommer att visas upp för allmänheten i form av en visualisering på webbplatsen politiskaord.se som förhoppningsvis ska lanseras innan riksdagsvalet i höst. På sajten kommer man att kunna följa hur debatter kommer och går. Eftersom nyhetstexterna från Kungliga bibliotekets arkiv inte får delas utanför deras egna system kommer man tyvärr inte ha möjlighet att göra egna sökningar. Har man förslag på en intressant sökning kommer man dock kunna kontakta de ansvariga bakom projektet för att få hjälp. För när webbplatsen väl är på plats finns tillgång till grunddata, en utarbetad metodik och verktyg för visualisering redo att användas.

Så här långt har projektet trots vissa metodologiska problem och svårigheter att få fram data varit givande och resultaten har dels visat det förväntade och dels bjudit på överraskningar.

– Jag är en riktig politiknörd så för mig har det varit oerhört skojigt att se de här långa tidslinjerna och följa färden mot moderniteten. Vi lever i ett oerhört annorlunda samhälle nu, säger Isobel Hadley-Kamptz.

Publicerad 27 augusti 2014.