';

Vello Pettai: “Andmerevolutsioon riigiteadustes: kuidas poliitikanähtusi empiirilisemalt uurida?”

Vello Pettai: “Andmerevolutsioon riigiteadustes: kuidas poliitikanähtusi empiirilisemalt uurida?”
Autor: Vello Pettai
Vello Pettai on võrdleva poliitika professor aastast 2005. Ta omandas doktorikraadi politoloogia erialal Columbia Ülikoolis (USA, 2004) ning bakalaureuseõppe läbis Middlebury College’is (USA), kus tema erialadeks olid politoloogia, vene keel ja prantsuse keel. Ta on õppinud, stažeerinud või töötanud Pariisis, Moskvas, Firenzes ja Lüneburgis. Ta on olnud riigiteaduste instituudi juhataja (2012-2015) ning praegu on ta „Demokraatia ja valitsemise („Democracy and Governance“) magistriõppekava programmijuht. E-mail: vello.pettai@ut.ee
Autor Vello Pettai

Lühikokkuvõte

Artikkel arutleb riigiteadustes järjest enam suureneva andmekogude arvu üle ning tutvustab võimalusi neid paremini integreerida õpetamisse ja uurimustesse. Esitletakse erinevaid andmeanalüüsi harjutusi, mille autor on välja töötanud ning katsetanud nii bakalaureuse- kui magistriastmes õpetades. Antud ettekanne arutleb erinevate küsimuste üle: kui hästi suudame poliitikanähtusi väljendada numbritega; kui palju andmebaase on meil lõpuks vaja; kuidas erinevad andmebaasid õpetavad erinevaid analüütilisi oskusi. Autor jõuab järeldusele, et ehkki kvantitatiivsetel lähenemistel on oma puudused süvateadusliku, ennustusliku kausaalsuse loomisel, on suurte andmekogude analüüsimine paradoksaalsel kombel vajalik just selleks, et tajuda, mida sotsiaalteadustes teha saab ja mida mitte.

Sotsiaalteadused ning andmekogud

Sotsiaalteadused tegelevad peamiselt kolme asjaga. Esiteks loovad nad mõisteid või tähendusi meie ühiskondliku elu kirjeldamiseks ning mõtestamiseks. Seejärel üritavad nad neid nähtusi mõõta, st ühe või teise juhtumi määra (mahtu) hinnata teiste samasugustega võrreldes. Ja kolmandana üritavad nad fikseeritud määrade (või nende ajas muutumiste) põhjusi seletada.

Mõõdistused või andmed, mida nende tegevuste käigus korjame, tunduvad küllaltki võimsad. Ka siis, kui need ei ole otseselt numbrid, on tegemist ikkagi meie arvates kindlaks tehtud faktidega, mille põhjal saame edaspidi opereerida või otsuseid langetada.

Kõik liigub niisiis väga hästi, kuniks meenub tõsiasi, et meie ühiskondlikus elus ei ole midagi olemas sada protsenti, vaid kõik algab uuritava-mõõdetava nähtuse konstruktsioonist. Seega nii kvalitatiivsed kui kvantitatiivsed telliskivid, mida me justkui kokku loeme ning uhkelt üksteise peale laome, rajame me tegelikult paljuski liivale ehk konstrueeritud nähtusele ning selle tinglikkusele. Selline väide ei tähenda, et telliskivist maja või müür, mida me rajame, kohe ümber kukub. Kuid aja möödudes võib see liiv nihkuda – olenevalt sellest, kuidas me oma nähtused ümber mõtestame või tõlgendame. Seejärel võivad meie ehitisse tekkida praod või mõrad. Pika peale võib see koguni kokku variseda.

On selge, et mõned sotsiaalteaduslikud nähtused on reaalsemad kui teised. Rahvusvahelistes suhetes on iseenesest mõistetav, et ühe riigi sõjalise võimsuse mõõtmine võib olla üpris konkreetne ja kindel. Kolm haubitsat või seitse sõjalennukit omavad igati reaalset (letaalset!) tähendust ning nende kokkulugemine hindamaks riigi suutlikkust kasutada sõjalist jõudu on täiesti asjakohane ning tõepärane. Kuid paljud nähtused pole nii ühemõttelised.

Võtame näiteks autoritaarsuse. Ka siis, kui me teame, et see on paljuski vastand mõistele “demokraatia”, on võimalik, et me tahame näiteks teada, milline riik on „autoritaarsem“ – kas Usbekistan või Singapur? Muammar Gaddafi Liibüa või Robert Mugabe Zimbabwe? Veel enam võib meil tekkida soov võrrelda mõndakümmet taolist režiimi. Sellisel juhul tahame oma tööd lihtsustada ning lausa numbriliselt neid määrasid kokku võtta. Tekib andmebaas.

Mil määral on andmebaasi loomine „teadus“? Tavamõistus ütleb, et kui meil on olemas kindlad kriteeriumid ning reeglid mõõtmiseks, siis peaksid andmebaasid olema igati teaduslikud, kuna nende näol on meil tegemist süsteemselt ning korrapäraselt korjatud informatsiooniga. Me saame sellega reaalselt opereerida. Kuid meenub loomulikult sotsiaalteaduste esimene funktsioon: mõistete loomine. Niisiis, isegi kui meil on kokkulepitud reeglid näiteks autoritaarsuse mõõtmiseks, ei tea me veel sellegi poolest, kuidas see nähtus täpselt „olemas on“, kuna antud konstellatsioon võimusuhetest ühes ühiskonnas ei ole ju midagi looduse poolt ette antud. See on meie tõlgendus (koos teatud normatiivse varjundiga) sellest, kuidas võimusuhted näivad olevat. Kusjuures kindlasti ei kehti need suhted kõikide elanike suhtes, igal hetkel, võrdselt ja läbivalt. Iga režiimi määratlus on tegelikult vaid selle umbkaudne ning tinglik mõõdistus, kui tahes ranged meie kriteeriumid või kodeerimisreeglid ka on.

Miks ma esitan selliseid relativistlikke või sotsiaalteaduste teaduslikkust õõnestavaid mõtteid, kui kirjutise teemaks pidi olema andmerevolutsioon riigiteadustes? Põhjuseks on soov panna lugejat seda enam üllatuma, et viimase viieteistkümne aasta jooksul on püsti pandud sedavõrd palju uusi andmebaase vaatamata nende epistemoloogilisele piiratusele (ehk võimele olla kindel mõnes teadmises). Riigiteadustes elame ajastul, mil andmemassiive on järjest enam ja enam ning nendega tuleb tegeleda, neid tuleb uurida. Kindlasti ei saa me kahe silma vahele jätta tõsiasja, et suurem osa sellest, mida me „mõõdame“, on algusest peale mõtteline konstruktsioon, mistõttu andmebaasidel on alati oma piir selle osas, mida nad meile tegelikult öelda saavad.

Andmekogude areng riigiteadustes

Suuri andmekogusid on riigiteadustes olnud pea sajand. Nii kuidas arvutitehnika revolutsioon pärast II maailmasõda võimaldas hakata talletama lõpmatut kogust arve, nii on ka sotsiaalteadlased rakendanud neid tehnoloogiaid enda andmebaaside loomiseks. Kõige esimesed sammud puudutasid arvamusküsitluste andmete kogumist, eelkõige nn poliitilise kultuuri uuringute kontekstis (Almond &Verba 1964). Need olid andmebaasid selles tähenduses, et mitmesajalt inimeselt saadi vastuseid kümnetele eri küsimustele ning seda infohulka tuli edaspidi süsteemselt töödelda.

Seejärel kerkisid esile andmebaasid, mis puudutasid omaette seisvate nähtuste kodeerimist ning kokkulugemist. Üheks taoliseks nähtuseks olid demokraatlikud valimised ning seega tekkisid esimesed valimistulemuste andmekogud (Mackie & Rose 1974). Said võimalikuks näiteks valimiste volatiilsuse mõõtmine läbi aja või erakondade tingarvu määratlemine (Pedersen 1979, Laakso &Taagepera 1979). Teisalt hakati looma andmebaase sõjalistest konfliktidest, nt projekt nimega Correlates of War (Singer & Small 1972). Siin kerkis esimest korda üles epistemoloogiline väljakutse defineerida (konstrueerida) huvipakkuv nähtus teadlaste poolt loodud parameetrite alusel. Antud juhul puudutas see nähtust „sõda“, mille definitsiooniks sai igasugune relvastatud konflikt, mille käigus hukkub sõjategevuse tulemusena vähemalt tuhat inimest kuni kaheteistkümne kuu jooksul. Tähelepanuvääriv siin ongi määratlus, et alla tuhande hukkunu puhul ei ole tegemist „sõjaga“, kuigi üks konflikt võib olla igati vägivaldne ning kahjusid tekitav.

Järgmine samm andmebaaside loomisel konstrueeritud nähtuste alusel astuti 1970ndate alguses, mil Ted Robert Gurr käis välja poliitilise režiimide mõõtmise süsteemi nimega Polity (Gurr 1974). Gurri ettevõtmine oli ambitsioonikas mitte ainult selle ajalise haarde poolest (1800-1971), vaid ka formuleeringute (indikaatorite) osas, mis pidi ära määratlema, kas ühel või teisel aastal oli mõni riik „demokraatia“, „autokraatia“ või „anokraatia“ (ehk eelneva kahe režiimi vahepealne variant). Siinkohal ei ole ruumi hakata loetletud tüüpe täpsemalt lahti seletama. Tähtis on tajuda asjaolu, et Gurr käis välja kolm ülimalt konstrueeritud nähtust (eriti anokraatia) ning et sedasi kodeeritud informatsiooni alusel on tehtud kümneid ja kümneid analüüse ning uurimustöid.

Viimane andmebaasi tüüp, mida tasub mainida, on need, kus kodeeritud on tekst (nt dokumentidest, kõnedest jne). Võrdlevas poliitikas on maailmakuulsaks saanud Ian Budge’i, Hans-Dieter Klingemanni jt juhitud Manifesto Research Group, mis alates 1979. aastast on üritanud fikseerida erakondade valimislubadusi ning muid poliitilisi seisukohti taaskord teadlaste poolt määratletud parameetrite alusel. Kusjuures tegemist ei ole ainult vasak-parempoolsuse hindamisega, vaid ka hindamine teatud liberaalsuse skaalal või nn post-materialismi mõõtmel.

Kokkuvõttes tasub igati hinnata erinevate riigiteadlaste pingutusi luua mõtlemapanevaid mõisteid ning seejärel asuda neid mõõtma. Kui aastatel 1980-1995 üritati rakendada ülal loetletud andmebaase järjest enam, siis teiselt poolt esines ka kriitika, mis puudutas mitte niisama reaalelu „numbritesse valamist“, vaid ka seda, mis on meie vahekord nähtuste ja mõõtmiste vahel.

Andmerevolutsioon

Samas aastast 2000 võib iseäranis võrdlevas poliitikas selgesti täheldada uut andmebaaside loomise lainet, kusjuures kõikide eelpool kirjeldatud alatüüpide suunal. Esmalt arendati edasi just demokraatlike institutsioonide kodeerimisi (Database of Political Institutions; Comparative Constitution Project) ning samuti nende institutsioonide baasil loodud valitsusi (ParlGov). Seejärel püüti luua sügavamaid mõisteid poliitilise arengu kohta tervikuna (Bertelsmann Transformation Index) või siis valitsemise kvaliteedi kohta (Quality of Government). Kolmandana keskenduti „valitsemise“ veelgi sügavamale konstrueerimisele läbi ingliskeelse mõiste „governance“ (World Governance Indicators). Ning lõpetuseks ei saa mainimata jätta teadlaste katseid valada sisu hägusasse anumasse nimega „korruptsioon“ läbi selliste mõõdikute nagu Transparency International’i Corruption Perception Index või Maailmapanga Enterprise Surveys. Kõikide nimetatud andmebaaside puhul on olnud tegemist kas tavapäraste poliitikatulemuste agregeerimisega või küllaltki oluliste tõlgendustega selle kohta, kuidas ühe riigi poliitilist hetkeseisu hinnata.

Veel ulatuslikumalt võib aga täheldada viimase aja andmebaaside loomise buumi demokraatia kui režiimi hindamisel. Freedom House’i vabaduse indeks Freedom in the World on ilmselt teada kõigile. Kuid nimetatud neljakümneaastasele veteranile on juurde tulnud konkurente nii erasektori analüütikutelt kui ka klassikalistelt teadlasrühmadelt. Esimeste seas on teadupärast olemas Economist Democracy Index samanimelise ajakirja toimetajatelt (Economist Intelligence Unit 2017). Selle voorus on koostajate eesmärk hõlmata ka käitumuslikke elemente, nagu inimeste rahulolu demokraatiaga või usaldus institutsioonide vastu.

Teisalt on mitmed teadlasrühmad üritanud koostada veelgi spetsiifilisemaid määratlusi demokraatia kohta, leides, et demokraatiat tuleks lahata just selle mitme seesmiselt toimiva põhimõtte järgi, nagu näiteks vabadus, õiglus, osalus, võrdsus, deliberatiivsus või õigusriiklus. Selle tulemusena hargneb kogu demokraatia idee veel arvukamateks konstruktsioonideks, millest igaühte annab eraldi mõõta, aga ka omaviisi kombineerida – nii nagu vaja on.

Samas käib antud andmebaaside loojate seas ka oluline metodoloogiline debatt selle osas, kas tugineda nimetatud mõõtmiste puhul ainult statistilistele andmetele või kasutada kohati ka eksperthinnanguid. Esimene, n-ö puristide lähenemine nõuab, et näitajad oleksid võimalikult reaalsed ehk tuletatud kindlate faktide või statistiliste allikate alusel. Hea näide sellest on Democracy Barometer, mille lõid 2011. aastal pool tosinat saksa ning šveitsi politoloogi (Bühlmann, et al. 2012). Üks demokraatia indikaatoritest selles andmebaasis on ühiskonna rahumeelsus ning sellest tulenevalt võtab demokraatia baromeeter arvesse, kui mitu tapmist on riigis aastas 100 000 elaniku kohta.

Teine, veidi paindlikum seisukoht leiab, et eksperthinnanguid (st küsitlusi sotsiaalteadlaste seas, hindamaks erinevaid demokraatia elemente ühes või teises riigis) tuleb kasutada siis, kui tahetakse andmekoguga kaugemale ajalukku tagasi minna ning samuti kui soovitakse arvestada riikide ajalooliste või muude taoliste iseärasustega. Sellisel arvamusel on kõige suurema demokraatiaindeksi Varieties of Democracy koostajad, kes on endale seadnud eesmärgiks hinnata demokraatia sisu enam kui 170 riigi puhul, pea 400 tunnuse alusel ning rohkem kui 100 aasta (1900-2015) vältel (Coppedge, et al. 2011). Just taolise andmekogu loomiseks on V-Demi võrgustik kaasanud enam kui 2500 sotsiaalteadlast üle maailma, et vastata küsimustele stiilis „kui sõltumatu oli Boliivia keskvalimiskomisjon aastal 1923?“ või „mil määral põhjendasid Indoneesia juhid vajalikke poliitikaotsuseid ühiskonna üldise heaolu nimel aastal 1961?“. Küllaltki keeruline hinnang, mida anda, aga muud teed ei ole.

Andmerevolutsioon ja meie

Andmekogusid on niisiis tänapäeva politoloogias vaat et külluseni. Mida saame aga meie nendega õppetegevuses teha? Selge on see, et suuremaid andmebaase saab „lükata“ kohe kvantitatiivsete meetodite ainetesse. V-Dem andmebaasis on 18 miljonit andmepunkti. Peaks ehk piisama mõne korraliku regressiooni läbiviimiseks. Aga ka muudes ainetes saab nendest andmebaasidest kasu, alates mõistagi elementaarsete võrdluste loomisest. Kuidas muidu saame vastuseid küsimustele: kui populistlikud on Eesti erakondade valimisplatvormid; kui verine on olnud Süüria kodusõda; kui tugev on Brasiilia presidentaalne süsteem. Ülalmainitud andmebaasid annavadki ettekujutuse.

Ühtlasi aga tasub andmebaasides näha võimalust tugevdada meie metodoloogilist teadlikkust. Kasutades ükskõik millist andmebaasi, oleme sunnitud analüüsima ka selle ülesehitust ehk küsima, milliseid kontseptuaalseid, kodeerimis- või andmekogumisvalikuid on selle koostaja teinud. Kas me oleme nende valikutega päri? Mida need valikud tähendavad minu uurimisküsimuse jaoks? Kas antud andmebaasi valikud klapivad minu uurimisküsimusega? Kui mitte, kas ma siis otsin mõne sobivama andmebaasi või ma muudan oma uurimisküsimuse ning liitun n-ö olemasoleva andmebaasiga? Kuidas ma suhtun sellistesse otsustesse? Kuidas koorub siin minu jaoks välja mingi tõde?

Kolmas kasutegur andmebaaside kasutamisest õppetöös toob meid tagasi selle kirjutise alguse juurde. Andmebaasid seavadki meid kokku sotsiaalteaduste kõige olulisema funktsiooniga – mõistete loomine. Kuna andmebaasid on sedavõrd bravuursed oma püüdega väljendada meie sotsiaalset reaalsust numbritega ning luua skaalasid, mille alusel teha riike võrreldavaks (neid „paika panna“), sunnivad nad meid tänuväärselt mõtlema üsna kriitiliselt selle üle, mida üks või teine kontseptualiseering ikkagi tähendab, kas me peame ühte või teist lähenemist valiidseks ja kuidas selle hinnangu alusel edasi liikuda. Ent need on oskused, mida meil tänapäeval hädasti vaja on: võime küsida järele, kas üks või teine fakt on tõepõhine või mitte ning kuidas selle alusel toimida.

Andmebaasid õppetöös

Kuidas saab ise nokitseda andmebaasidega, ilma et peaks raske raha eest endale STATA programmi ostma või R-i skripti pähe õppima? Õnneks on internetimaailm taas jõudnud nii kaugele, et paljudel andmebaasidel on olemas oma võrgupõhised analüüsikeskkonnad, kus saab võrdlevaid graafikuid luua ning seejärel need alla laadida kasutamiseks enda uurimistöös. Mõned kasutajasõbralikumad keskkonnad leiduvad V-Dem, Democracy Barometer, Bertelsmann Transformation Index ning Manifesto Project kodulehekülgedel. Nende baasil olengi oma õppetöös palunud üliõpilastel teostada algseid andmeanalüüse mitte ainult tutvustamaks nimetatud andmekogusid, vaid ka harjutamaks neid samu kriitilise mõtlemise oskusi, millest eelpool juttu oli. Veidi keerulisemaid portaale pakuvad World Governance Indicators, PARLINE (parlamentide kohta) või Quality of Government. Mõistagi on üldjuhul iga andmebaasi puhul võimalus laadida vastavad andmed alla Excel failina, mille kaudu saab vähemalt esmase ülevaate huvipakkuvatest indikaatoritest või riikidest. Selliselt jääb alati valik, kui „peeneks andmetöötlemiseks“ läheb.

 

 

Kasutatud kirjandus

Almond, Gabriel & Sidney Verba.  1964.  The Civic Culture.  Boston: Little, Brown and Co.

Bühlmann, Marc, Wolfgang Merkel, Lisa Müller & Bernhard Weßels.  2012.  “The Democracy Barometer: A New Instrument to Measure the Quality of Democracy and Its Potential for Comparative Research.”  European Political Science 11: 519-36.

Coppedge, Michael, John Gerring, David Altman, Michael Bernhard, Steven Fish, Allen Hicken, Matthew Kroenig, Staffan I. Lindberg, Kelly McMann & Pamela Paxton.  2011.  “Conceptualizing and Measuring Democracy: A New Approach.”  Perspectives on Politics 9: 247-67.

Economist Intelligence Unit.  2017.  “Democracy Index 2016: Revenge of the “Deplorables”.”  The Economist Intelligence Unit, 25. jaanuar.

Gurr, Ted Robert.  1974. “Persistence and Change in Political Systems, 1800–1971.”  American Political Science Review 68: 1482-504.

Laakso, Markko & Rein Taagepera.  1979.  “‘Effective’ Number of Parties: A Measure with Application to West Europe.”  Comparative Political Studies 12: 3-27.

Mackie, Thomas T. & Richard Rose.  1974.  The International Almanac of Electoral History.  London: Macmillan.

Pedersen, Mogens N.  1979. “The Dynamics of European Party Systems: Changing Patterns of Electoral Volatility.”  European Journal of Political Research 7: 1-26.

Singer, Joel David & Melvin Small.  1972.  The Wages of War, 1816-1965: A Statistical Handbook: John Wiley & Sons.

Comments
Share
Poliitikalabor

Leave a reply