Data samotná nenesou žádnou informaci, o ničem nevypovídají. Jsme to my, kdo jim přisuzuje hodnotu a staví na nich příběh. S tímto sdělením zahájili lektoři Karel Minařík a Josef Šlerka praktický workshop datové žurnalistiky, kterého se zúčastnilo bezmála třicet novinářů, studentů novinařiny a zástupců watchdogových organizací. Workshop uspořádaly 25. března Národní technická knihovna a Fond Otakara Motejla. Součástí poslání Fondu je prosazování otevřených dat a podpora českých watchdogů ve využívání nových online nástrojů.
Lektoři Karel Minařík (Elasticsearch.com, StuNoMe UISK FF UK) a Josef Šlerka (Ataxo Interactive, StuNoMe UISK FF UK) si připravili dynamickou prezentaci plnou konkrétních příkladů aktuálních trendů. Zdroje a tipy pro účastníky i případné další zájemce shromáždili ve sdíleném dokumentu.
Josef Šlerka využil pro správnou datažurnalistickou práci analogii s konceptem DIKW (Data Information Knowledge Wisdom) – z dat získáváme informace a při použití specifických znalostí pak moudrost. Většina českých pokusů o datovou žurnalistiku ale takový přístup neuplatňuje a zůstává u neinvenčního překlopení dat na mapu, které nenese žádnou přidanou hodnotu.
Karel Minařík vysvětlil filozofii datové vizualizace na dvou dnes již kultovních příkladech – zobrazení Napoleonova tažení Ruskem od Charlese Minarda a mapě epidemie choleryvytvořené anglickým lékařem Johnem Snowem. Snowova grafika nebyla ilustrační, ale přesvědčovací – využila existujících dat k jasnému prokázání faktu, že ohniskem epidemie byla infikovaná pumpa.
Dobrá datová vizualizace není ilustrační obrázek, ale nástroj porozumění světu kolem nás. Důležitým prvkem profesionální datové žurnalistiky je také interaktivita. Pro čtenáře je přidanou hodnotou, že si může s infografikou hrát a zkoušet různé scénáře a možnosti. Není jen pasivním konzumentem obsahu, spoluvytváří jej. Příkladem takového počinu je 512 paths to the White House – interaktivní analýza možných výsledků prezidentských voleb z dílny The New York Times.
Součástí semináře byly i interaktivní úkoly. Na příkladu datasetu o nabízených pracovních místech, stažených z webu MPSV, si účastníci vyzkoušeli čištění a strukturování dat v programu Google Refine (slučování podobných kategorií, využití externích aplikací pro zanesení dat na mapu apod.). Aplikace Google Fusion Tables pak posloužila pro přetavení strukturovaných dat do grafů. Součástí lekce byl i krátký tutorial pro tvorbu jednoduché vizualizace s pomocí javascriptové knihovny D3.js.
V odpoledním bloku představili Jiří Skuhrovec (zIndex, IES FSV UK) a Jiří Knitl (Fond Otakara Motejla) jeden konkrétní příklad české práce s daty – investigativní případovou studii Rozkrývání veřejných zakázek. Na projektu nad rozsáhlými daty o dodavatelích veřejných zakázek (vypsaných v ČR od roku 2009 do září 2012) demonstrovali jiný přístup ke zpracování velkých objemů dat a upozornili na možná úskalí při jejich interpretaci a prezentaci.
Na prezentace navázala neformální diskuse o možnostech české datové žurnalistiky či využití datových nástrojů v projektech nevládních organizací. Z debaty vyšlo několik zajímavých poznatků:
-
prvotřídní datová žurnalistika tak, jak ji známe z New York Times, vyžaduje spíše spolupráci multidisciplinárního týmu (novinář, programátor, grafik) než “novináře nového typu”
-
náročnější infografiky přesto nepatří do říše snů, jen je třeba mít dostatek trpělivosti a chuti se učit
-
máme k dispozici pokročilé nástroje i srozumitelné manuály k jejich využití (např.coursera.org či codeacademy.com, z českých zdrojů stojí za zmínku třeba kurz Digital humanities)
-
interaktivní vizualizace jsou zajímavým prostředkem pro zviditelnění občanských kauz – v médiích je po nich velká poptávka
-
“informace jsou rozdíl, který dělá rozdíl” – hledejte v datech výrazné odchylky a pátrejte po jejich příčinách
-
neptejte se, jaký typ grafu se hodí pro která data – rozhodněte se podle toho, co chcete grafem říci
Workshop Data ve službách novinářů finančně podpořila Google Community Grants Fund of Tides Foundation. Tematicky navázal na mezinárodní konferenci Big Clean z listopadu loňského roku. Semináři předcházela třídenní série workshopů a přednášek za účasti novinářů z prestižní organizace ProPublica.org a českých odborníků organizovaná obecně prospěšnou společností Zaostřeno.
Videozáznam z akce je k dispozici zde (rozdělený do 4 částí).