Index demokracie ČR
← Metodika

Zdroje dat

Odkud index čerpá — 8 českých redakčních médií, otevřená data PSP a soudů, watchdog organizace, mezinárodní zpravodajství. Aktuální tabulka generovaná z config/sources.yaml.

Zdroje dat

Index demokracie ČR čerpá ze dvou nezávislých datových vrstev — strukturální (pomalá, ročně/kvartálně se aktualizující) a týdenní (rychlá, event-driven). Tahle stránka mapuje obě.

Zdrojem pravdy je config/sources.yaml. Tabulky níže se generují přímo z něj při buildu — ručně se nepíšou, takže nemůžou rozjet.

Strukturální baseline (kvartálně)

Strukturální skóre vychází z šesti zavedených mezinárodních indexů, které se v projektu mapují na šest pilířů (volby, vládnutí, justice, média, svobody, korupce):

Index Vydavatel Frekvence Pilíř(e)
V-Dem Democracy Report University of Gothenburg ročně (jaro) overall + electoral + civil
EIU Democracy Index Economist Intelligence Unit ročně overall
Freedom in the World Freedom House ročně (březen) electoral + civil
RSF World Press Freedom Index Reporters Without Borders ročně (květen) media
TI Corruption Perceptions Index Transparency International ročně (leden/únor) corruption
WJP Rule of Law Index World Justice Project ročně (říjen/listopad) judicial + governance

Detail toho, jak se z těchto šesti indexů složí pillarscores 0–100, popisuje strukturální mapování. Aktuální baseline je ve souboru data/structural/2026-Q2.json v repu.

Týdenní zdroje (event monitoring)

Týdenní pipeline (weekly-pipeline GitHub Actions workflow, pondělí 06:00 UTC) prochází všechny aktivní zdroje, předfiltruje články přes Claude Haiku 4.5, klasifikuje je přes Claude Sonnet 4.6 a navrhne události s odůvodněním podle rubric závažnosti. Stav „aktivní" znamená, že zdroj má funkční adapter — buď je to RSS feed (čte se přes rss-parser), nebo má dedikovaný TypeScript adapter v src/lib/. Stav „nezapojený" je placeholder — zdroj je v yamlu evidovaný pro budoucí adapter, ale momentálně se z něj nečte.

Česká média (8/8 aktivních)

Stav Zdroj Typ Poznámka
✓ aktivní Deník N RSS feed Předplatné u některých článků; pipeline pracuje s titulkem a perexem.
✓ aktivní iROZHLAS RSS feed
✓ aktivní ČT24 RSS feed URL ověřit, ČT občas přesouvá feed.
✓ aktivní Hospodářské noviny RSS feed
✓ aktivní Aktuálně.cz RSS feed
✓ aktivní Investigace.cz RSS feed Investigativní novinařina, často pomalejší kadence ale velmi vysoká relevance.
✓ aktivní A2larm RSS feed
✓ aktivní Seznam Zprávy RSS feed

Otevřená data (5/8 aktivních)

Stav Zdroj Typ Poznámka
✓ aktivní Hlídač státu — sponzoring API Adapter v src/lib/hlidac.ts (fetchPartyDonationsAsArticles).
✓ aktivní Hlídač státu — smlouvy s issues API Adapter v src/lib/hlidac.ts (fetchWatchlistSmlouvyAsArticles).
✓ aktivní Hlídač státu — dotace pro watchlist API Adapter v src/lib/hlidac.ts (fetchWatchlistDotaceAsArticles).
✓ aktivní Poslanecká sněmovna PČR HTML scraper PSP nemá RSS feed (probed 2026-04-28).
⏸ nezapojený Senát PČR HTML scraper
✓ aktivní Ústavní soud ČR RSS feed Oficiální RSS feed (nedokumentovaný, ale stabilní — vrací 30 nejnovějších položek: nálezy, přehledy jednání pléna i senátů, tiskové zprávy.
⏸ nezapojený Nejvyšší soud HTML scraper
⏸ nezapojený Nejvyšší správní soud HTML scraper

Watchdog (1/3 aktivních)

Stav Zdroj Typ Poznámka
✓ aktivní Transparency International ČR RSS feed
⏸ nezapojený Rekonstrukce státu HTML scraper
⏸ nezapojený Frank Bold HTML scraper

Mezinárodní (5/9 aktivních)

Stav Zdroj Typ Poznámka
✓ aktivní POLITICO Europe RSS feed Joint venture US Politico + Axel Springer (DE).
✓ aktivní BBC News Europe RSS feed Public broadcaster (UK).
✓ aktivní Euronews RSS feed Pan-European TV/web outlet (vlastnictví NBC + Naguib Sawiris a Mediaset).
✓ aktivní Visegrad Insight RSS feed Niche policy outlet zaměřený výhradně na V4 (CZ + SK + PL + HU).
✓ aktivní Brno Daily RSS feed English-language news o ČR (založen v Brně, postupně rozšiřuje na celou ČR).
⏸ nezapojený GRECO (Council of Europe) HTML scraper
⏸ nezapojený Venice Commission HTML scraper
⏸ nezapojený European Commission Rule of Law Report HTML scraper
⏸ nezapojený European Court of Human Rights — ČR HTML scraper

Proč právě tyhle zdroje

Česká média. Záměrně širší ideologické spektrum: od levicovějšího A2larmu přes centristický Deník N po konzervativní Hospodářské noviny. Investigace.cz má pomalejší kadenci, ale velmi vysokou per-item relevanci. Veřejnoprávní ČT24 i iROZHLAS slouží jako nezávislý referenční bod. Cílem rozmanitosti je anti-bias — žádný jeden outlet nesmí dominovat sourcům více než 50 % týdenních events.

Otevřená data státu. Strukturální events (přerušená schůze PSP, ústavní nález, proplacená sponzorská smlouva) jsou hodnotnější než mediální komentář — dají se ověřit přímo u zdroje. Hlídač státu (zdarma po registraci na hlidacstatu.cz/api) zpřístupňuje databázi sponzoringu, smluv s anomáliemi a dotací. PSP nemá RSS, čteme přehled schůzí HTML scraperem. Ústavní soud má nedokumentovaný, ale stabilní RSS feed.

Watchdog organizace. Transparency International ČR a Frank Bold jsou domácí experti na korupci a vládu zákona. Slouží primárně jako sanity-check pro pillar corruption a judicial.

Mezinárodní zdroje. Pět redakčních (POLITICO Europe, BBC News Europe, Euronews, Visegrad Insight, Brno Daily) plus čtyři instituce (GRECO, Venice Commission, EK Rule of Law, ESLP) — ty institucionální jsou zatím nezapojené, čekají na implementaci adapterů. Smysl: outside-in perspektiva, často s důrazem na CEE kontext, který lokální média někdy přehlížejí. Visegrad Insight má per-item nejvyšší CZ-relevanci ze všech zahraničních zdrojů.

Jak se zdroje mění

Přidání nového zdroje je dvouminutový commit do config/sources.yaml. Pokud má feed RSS, žádný kód se nemění — stačí ho dopsat do --sources defaultu ve weekly-pipeline.yml. Pro non-RSS zdroj (HTML scrape nebo API) je potřeba napsat dedikovaný adapter v src/lib/ a zaregistrovat ho v src/pipeline/fetch-sources.ts.

Odstranění zdroje proběhne, jakmile jeho feed přestane fungovat (typicky HTTP 5xx déle než dva týdny). Příklad: Iuridicum Remedium byl dropped 2026-04-29 po trvalém HTTP 500 — záznam zůstává v yamlu jako komentář, aby šel snadno vrátit, až svůj feed opraví.

Změny zdrojů se nelogují v methodology CHANGELOG, který je rezervovaný pro úpravy metodiky (váhy, rubric, pilíře, governance). Historii zdrojů zjistíš git log -- config/sources.yaml.