Andmeajakirjandus

Andmeajakirjandus on viis uudiste edastamise täiustamiseks statistika uurimise ja andmete kasutamise abil, et anda loost põhjalikum ja täpsem ülevaade.[1]

Andmeajakirjandus on viimastel aastatel arenenud järk-järgult, sõltudes suurel määral andmete kättesaadavusest digitaalsel kujul.[2] Üheks ajakirjanduse trendiks digiajastul on avalikkusele informatsiooni edastamine andmete visualiseerimise kaudu (tabelid, graafikud, kaardid, infograafika, mikrosaidid jms).[1] Andmete visualiseerimine võimaldab ajakirjanikul keerulist lugu lihtsamalt edasi anda.[3]

Andmeajakirjandust peetakse ajakirjanduse tulevikuks.[2] Andmeanalüüs võib paljastada varjatud probleeme, mida ei ole veel ajakirjanduses käsitletud või millele ei ole piisavalt tähelepanu pööratud.[4] Andmeajakirjandus saab ajakirjandust oluliselt mõjutada: ajakirjanikud saavad kirjutada lugusid, mida toetavad täpsed ja konkreetsed andmed.[4] Andmete abil saab luua põhjalikumat teavet selle kohta, mis meie ümber toimub ja kuidas see võib meid mõjutada.[4]

Andmed võivad olla nii andmeajakirjanduse allikaks kui ka vahendiks, millega lugu räägitakse.[3]

Andmeajakirjandust saab rakendada mitte ainult ajakirjanduses, vaid paljudes valdkondades, mille vastu on avalik huvi (majanduses, tervishoius, keskkonnaküsimustes, poliitikas jpm).

Üheks varasemaks näiteks andmeajakirjanduse olemasolust peetakse Suurbritannia väljaande Manchester Guardian (praegune The Guardian) esimest numbrit. 1821. aastal avaldatud artikkel sisaldas tabelit, kus olid andmed kahes Suurbritannia linnas elavate kooliõpilaste kohta. Andmed olid abiks riigi haridussüsteemi mõistmisel.[1]

Tehnoloogia arenguga kolis andmeajakirjandus arvutisse. Esimeseks näiteks peetakse 1952. aastat, kui CBS üritas suurarvuti abiga ennustada USA presidendivalimisi. Sel kujul hakkas andmeajakirjandus laialdaselt levima alles 1967. aastal, kui USA väljaanne Detroit Free Press analüüsis Detroiti rahutuste kohta kogutud andmeid.[5]

2005. aastal hoogustus uudislugudes andmete visualiseerimine, kui USA programmeerija koostas Chicago kuritegevuse kohta andmekogu.[5]

Andmeajakirjanduse etapid

[muuda | muuda lähteteksti]

Kuigi töö kulg võib mõneti erineda, koosneb andmeajakirjanduse protsess üldjuhul viiest etapist:

  1. kogumine – infoallikatest vajalike andmete leidmine;
  2. puhastamine – andmete filtreerimine ja teisendamine soovitud kujule;
  3. kontekstualiseerimine – analüüsimine ja kontekstiga sidumine;
  4. kombineerimine – kahe või enama andmestiku kombineerimine lisamaks täpsust ja kaalukust;
  5. kommunitseerimine – väljakoorunud mustrite ja trendide illustreerimine, staatilisel või animeeritud kujul visualiseerimine ning visuaalide integreerimine teksti ja andmetega.[6]

Andmeajakirjanduse protsessi käigus läbivad andmed töötluse ning nende põhjal valmib viimistletud uudislugu. Kõikehõlmavad andmed koondatakse nii, et vastuvõtjad suudaksid näha trende ja teha nendest lähtuvalt otsuseid. Andmeajakirjaniku ülesandeks on teha väljavõtteid kogutud infost.[3]

Andmeajakirjanduse ümberpööratud püramiid

[muuda | muuda lähteteksti]

2011. aastal tutvustas Paul Bradshaw andmeajakirjanduse mudelit “Andmeajakirjanduse ümberpööratud püramiid”, mis illustreerib andmeanalüüsi etappe.[6]

Andmeajakirjanduse ümberpööratud püramiid

Andmeid on võimalik koguda paljudelt andmesaitidelt ja paljude teenuste abil. Esiteks võib andmeid hankida ametlikest andmeportaalidest, samuti võib teha päringuid info eest vastutavatele riigiorganitele. Andmete kättesaadavus oleneb paljuski riiklikust seadusandlusest, st riigid väljastavad andmeid erineval määral.[7]

Andmete kogumine andmeajakirjanduses on tänapäeval suures osas koondunud internetipõhiseks. Andmeid saab hankida otsingumootorite abil, näiteks leiab Google'i otsingumootorist Exceli andmefailid järgneva lause abil: ‘inurl:downloads filetype:xls’. Sealjuures tähistab sõna „downloads“ märget, et neid Exceli andmefaile saab ka alla laadida ja “inurl” tähistab märksõna asukohta, kuhu lisada sobilik sõna, mis otsib URL-i sees olevat märksõna.[7]

Eestis on hulgaliselt andmeid Statistikaameti andmebaasis: https://andmed.stat.ee/et/stat. Samuti leiab andmeid mitmetest välismaa andmebaasidest: http://datacatalogs.org/, https://www.theguardian.com/politics/government-data, https://www.thedatahub.org/, https://scraperwiki.com/, https://data.worldbank.org/, http://data.un.org/, https://www.data-archive.ac.uk/[7] , https://data.gov.uk/, https://data.gov.in/, https://www.data.gov/.

Lisaks võib vajalikke andmeid leida foorumitest. Näiteks http://getthedata.org/ ja https://www.quora.com/ veebifoorumites saab esitada andmeajakirjanduse kohta käivaid küsimusi. Foorumitest võib küsida kõike andmetega seotut (kust leida vastavaid andmeid, milliste vahenditega saab andmeid visualiseerida või kuidas andmeid puhastada).[7]

Hacks/Hackersi (https://www.hackshackers.com/) organisatsioon ühendab ajakirjanikke ja tehnolooge. Kommuunis on võimalik suhelda inimestega, kes tunnevad andmeajakirjandust ja ka sellest, kuidas ning kust on võimalik andmeid saada.[7]

Samuti on andmeid võimalik ise koguda vaatluste, küsitluste ja veebiküsimustike abil.[7]

Puhastamine

[muuda | muuda lähteteksti]

Andmete puhastamine ehk korrastamine tähendab andmete esialgset töötlust, kus eemaldatakse inimvead ja teisendatakse andmed ühtsele analüüsimist võimaldavasse kujule.[6] Andmete puhastamise vahendid on näiteks OpenRefine ehk GoogleRefine, TextWrangler, GoogleSpreadsheets[8].

Kontekstualiseerimine

[muuda | muuda lähteteksti]

Selles etapis esitatakse andmestiku kohta kriitilisi küsimusi ning analüüsitakse, kes, millal, kuidas ja mis eesmärgil andmed kogus ning kas sellest avaldub midagi märkimisväärset. Andmed ei pruugi alati olla usaldusväärsed – nende kogumise protsess hõlmab erinevat metoodikat, kallutatust ja eesmärke. Tihtilugu tuleb tutvuda erialakeelega, mille järgi andmed koondati. Nendeks võivad olla koodid, mis esindavad kategooriaid, klassifikatsioone või asukohti ja eksperttasemel terminoloogiat.[6]

Samuti on selles etapis vajalik statistiline pädevus, kuna tihti ei ütle eraldiseisvad andmed meile palju. Näiteks omandab kuritegevuste arv linnas tähenduse siis, kui see asetada konteksti linna populatsiooni, politseijaoskondade arvu, kuritegevusmäära, töötuse tasemega jne.[6]

Võimalikud vahendid, mis aitavad andmeid analüüsida: Django, Ruby on Rails, Microsoft Access – tabelite moodustamiseks, ESRI Arcmap – geograafilised analüüsid, SAS, PostGIS, QGIS, MapBox, CSVKit, RStudio, SPSS, Microsoft Excel, OpenOffice Calc, Scraperwiki – prototüüpimine ja tulemuste salvestamine onlainis. NitroPDF – PDF-failide teisendamine tekstiks ja Exceli failideks.[8]

Programmeerimine: Python (programmeerimiskeel), R (programmeerimiskeel), NumPy + MatPlotLib.[8]

Kombineerimine

[muuda | muuda lähteteksti]

Leidub häid näiteid andmeajakirjanduslikest lugudest, mis tuginevad vaid ühele andmestikule. Siiski võib rohkem näiteid välja tuua kombineeritud andmestikest, sest mitme allika põhjal valminud andmeajakirjanduslikud artiklid on lugejale väärtuslikumad ja usaldusväärsemad.[6]

Levinuim näide sellest on andmestiku sidumine kaardiga näitamaks, kuidas andmed ruumis jaotuvad.[6]

Kommunitseerimine

[muuda | muuda lähteteksti]

Selles etapis mõeldakse välja, milline oleks parim viis andmetöötluse edastamiseks lugejatele, ning otsustatakse, mis on andmete juures kõige märkimisväärsem või huvitavam, et seda rõhutada. Seejärel tegeletakse tulemuste visualiseerimisega. Seda võib teha näiteks kaartide, diagrammide, infograafika või animatsiooni abil.[9]

Eri viise andmeanalüüsi tulemuste kommunitseerimiseks:

  • Visualiseerimine – andmete esitamine graafiliselt;
  • Tekstiline edastamine – andmete kirjalik selgitamine;
  • Suhtlusmeedia kasutamine – suhtlusmeedia teel tulemuste jagamine;
  • Humaniseerimine – andmete avamine inimesele arusaadaval viisil, näiteks lisatakse artikli juurde intervjuu asjatundjaga, kes tulemusi selgitab;
  • Personaliseerimine – kasutaja annab sisendi ning meedium esitab andmed filtreeritult vastavalt tema kohta kehtivatele näitajatele;
  • Rakenduste väljatöötamine – andmete põhjal luuakse rakendus, populaarsemaks vormiks on kalkulaatorid.[9]

Google spreadsheet – tulemuste esitamine ning saab ühendada Google Fusion Tables ja Junar Open Data Platform.

Junar – andmete viimine sobivale kujule.

Tableau Public – interaktiivseks andmete visualiseerimiseks.

Qlikview – võimaldab analüüsida ja filtreerida suuri andmehulki.

Google Fusion Tables – kaartide visualiseerimiseks.[8]

Andmeajakirjandus muudes valdkondades

[muuda | muuda lähteteksti]

Andmeajakirjandust kasutatakse sisuturunduse valdkonnas, et kommunitseerida ja turunduda ettevõtete brändi. Samuti kasutavad andmeajakirjandust suhtekorraldajad, kes võitlevad meediakajastuse saamiseks ajakirjanike tähelepanu eest.[10]

Andmete visualiseerimist kasutatakse teadustöö tulemuste paremaks kommunitseerimiseks.[11]

Lisaks kasutatakse andmete visualiseerimist ettevõtete ja mittetulundusühingute kommunikatsioonis.[12]

Andmeajakirjanduse näiteid

[muuda | muuda lähteteksti]
  1. 1,0 1,1 1,2 Merskin, D. L. (2020). The SAGE International Encyclopedia of Mass Media and Society. SAGE Publications.
  2. 2,0 2,1 Veglis, A. ja Bratsas, C. (2017) (6(2), 225–244). "Reporters in the age of data journalism". Journal of Applied Journalism & Media Studies. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)CS1 hooldus: mitu nime: autorite loend (link)
  3. 3,0 3,1 3,2 Bounegru, L., Chambers, L. ja Gray, J. (2012). "What Is Data Journalism?". The Data Journalism Handbook. O'Reilly.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  4. 4,0 4,1 4,2 Bounegru, L., Chambers, L. ja Gray, J. (2012). "Why Journalists Should Use Data". The Data Journalism Handbook. O'Reilly.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  5. 5,0 5,1 Houston, B. (2015) (12. november). "Fifty Years of Journalism and Data: A Brief History". Global Investigative Journalism Network. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)
  6. 6,0 6,1 6,2 6,3 6,4 6,5 6,6 Bradshaw, P. (i.a). "The inverted pyramid of data journalism". Online Journalism Blog. Vaadatud 02.12.2020.
  7. 7,0 7,1 7,2 7,3 7,4 7,5 Bounegru, L., Chambers, L. ja Gray, J. (2012). "A Five Minute Field Guide". The Data Journalism Handbook. O'Reilly.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  8. 8,0 8,1 8,2 8,3 Bounegru, L., Chambers, L. ja Gray, J. (2012). "Data Journalists Discuss Their Tools of Choice". The Data Journalism Handbook. O'Reilly.{{raamatuviide}}: CS1 hooldus: mitu nime: autorite loend (link)
  9. 9,0 9,1 Bradshaw, P. (i.a). "6 ways of communicating data journalism (The inverted pyramid of data journalism part 2)". Online Journalism Blog. Vaadatud 02.12.2012.
  10. Hill, M. (2019) (29. jaanuar). "How to use data journalism in your content marketing". The Drum. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)
  11. Mason, B. (2019) (11. detsember). "Why scientists need to be better at data visualization". Knowable Magazine. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)
  12. Carlisle, A. (i.a). "Why Data Journalism Is the Secret to Engagement". Convince & Convert. Vaadatud 02.12.2020.
  13. Robles, P. (2019) (25. jaanuar). "Why your smartphone is causing you 'text neck' syndrome?". South China Morning Post. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)
  14. "What if all covid‑19 deaths in the United States had happened in your neighborhood? (i.a)". The Washington Post. Vaadatud 02.12.2020.
  15. Katz, J. ja Andrews, W. (2013) (21. detsember). "How Y'all, Youse and You Guys Talk". The New York Times. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)CS1 hooldus: mitu nime: autorite loend (link)
  16. "Proovi uut leiutist: Maailma esimene Jüri Ratase ümmarguste vastuste robot! (i.a)". Eesti Ekspress. 20. aprill. Vaadatud 02.12.2020. {{netiviide}}: kontrolli kuupäeva väärtust: |aeg= (juhend)