4. listopadu 2014 byl spuštěn Versologickým týmem Ústavu pro českou literaturu AV ČR velmi zajímavý projekt. Na stránkách www.versologie.cz totiž najdeme Korpus českého verše. O co se jedná a jak lze tento mocný nástroj použít ve výuce, o tom pojednává následující článek.
O co jde
Zde si pomohu citací přímo ze stránek Korpusu českého verše:
"Korpus českého verše (KČV) je lemmatizovaný, foneticky, morfologicky, metricky a stroficky anotovaný korpus české poezie 19. a počátku 20. století.
Ke každé slovní jednotce v korpusu je připojena informace o jejím základním slovním tvaru (lemma), fonetickém přepisu a gramatických kategoriích, u každého verše je určeno metrum (jamb, trochej...), rozsah (n-stopý), typ klauzule (mužská, ženská...) a metrický vzorec. (V současnosti jsou z hlediska metriky anotovány pouze verše sylabotónické.) Na vyšších rovinách jsou pak anotovány rýmové dvojice, resp. n-tice a pevné formy (sonet, rondel...). V metrickém a strofickém popisu je možné vyhledávat prostřednictvím Databáze českých meter, rovina lemmatizace je částečně zpřístupněna prostřednictvím Frekvenčních slovníků, rýmové páry lze vyhledávat v aplikaci Gunstick
KČV..."
Jedná se tedy o databázi české poezie a to až na úrovni slov. Obsahuje 78 391 básní v 1689 básnických sbírkách z 19. a 20. století (soupis všech zpracovaných textů). Aby nedocházelo k mýlce, Korpus českého verše nezpřístupňuje básně či básnické sbírky jako takové, ale podrobné informace o nich. Pokud hledáte způsob, jak se dostat k digitalizované podobě české poezie 19. a počátku 20. století, pak mohu doporučit jiný zajímavý projekt, Českou elektronickou knihovnu, z které ostatně údaje v KČV vycházejí. ČEK obsahuje 1700 digitalizovaných básnických knih a, jak sami píší, přináší kompletní veršované dílo nejvýznamnějších básníků české novodobé literatury.
Co KČV nabízí
Krom samotných statistických dat (zjistíme například, že čeští poetové byli nejaktivnější v letech 1890 - 1899, kdy napsali skoro půl milionu veršů) můžeme použít i několik velmi zajímavých nástrojů:
- Frekvenční slovník
- Gunstick - databázi rýmů
- Databázi českých meter
- Eufonometr
- Hex - klíčová slova v české poezii
- Cvičebnici
Mimo nástrojů dostupných přímo na stránkách versologie.cz přidal svou trošku do mlýna i Český rozhlas. Na svých stránkách vytvořil nástroj, který zpřístupňuje některé informace z korpusu a vizualizuje je pomocí tag cloudu. Snadno tak zobrazíme nejoblíbenější podstatné slovo Jaroslava Vrchlického (srdce) nebo nejoblíbenější přídavné jméno Karáska ze Lvovic (mrtvý).
Frekvenční slovník
Zde nalezneme databázové soubory (xls, txt) jak celého korpusu (více než 14 milionů záznamů), tak jednotlivých subkorpusů (autorů a následně i sbírek). U každého lemmatu (základního slovníkového tvaru slova - započítány jsou tedy výskyty jakéhokoli tvaru) je uvedeno pořadí, slovní druh a relativní a absolutní četnost. Nejde zde tedy o nástroj jako takový, ale spíš o zpřístupnění nadmíru zajímavých dat, která pak můžeme dále zpracovávat a porovnávat.
Gunstick - databáze rýmů
Gunstick nám umožní nahlédnout pod pokličku české poezie z hlediska rýmů. Můžeme si vyhledat rýmy k jakémukoli slovu, které nás napadne. Gunstick zobrazí graf relativní četnosti jednotlivých rýmů k zadanému slovu, počet rýmů v jednotlivých letech a konečně i tabulku s konkrétními verši, ve kterých se rým objevuje, společně s údajem o autorovi, básni, sbírce a roku vydání. Tak si například ověříme, že nejčastějším rýmem ke slovu "škola" bylo mezi lety 1800 a 1920 skutečně slovo "volá".
Vyhledávání je možné dále omezovat. Můžeme prohledávat jen některé autory, brát v potaz určitou dobu vydání nebo upřesnit metrickou klauzuli (mužský X ženský verš, ukončený X neukončený...).
Databáze českých meter
Zde je zpřístupněn metrický a strofický popis všech 1689 zpracovaných básnických sbírek. Tento nástroj však není přímo na stránkách versologického týmu a vyžaduje registraci.
Odmění nás ale mnoha zajímavými informacemi o formální stránce české poezie dané doby. Databáze českých meter nám především umožňuje vytvořit vizualizace různých dotazů. Zobrazí nám např. grafy i tabulky srovnávající Nerudovu a Hálkovu oblibu používání sonetu.
Tento nástroj je velmi mocný, nicméně je zřejmé, že je určen spíše odborníkům a entuziastům v oboru literární vědy.
Eufonometr
V druhé polovině dvacátého století vytvořili lingvisté způsob, jak spočítat zvukomalebnost básnického textu. A právě toto nabízí nástroj eufonometr. Můžeme vložit jakýkoli básnický text a nástroj nám spočítá míru zvukomalebnosti a ukáže, kterému autoru jsme nejblíže. Dozvíme se tak například, že "autor" lidové písničky Skákal pes by sdílel 33. příčku s Františkem Rajmanem.
Hex - klíčová slova v české poezii
Tento nástroj nám umožní v korpusu vyhledat určité klíčové slovo (nejde tedy o prostý výskyt slova, jeho výskyt v dané básni musí být statisticky významný). Zjistíme pak u jakého autora, v které sbírce a v jaké básni bylo kolikrát použito. Například se tak dozvídáme, že jediný, kdo významně použil (3 krát) v básni slovo "vzdělání", byl Šebestián Hněvkovský. Nástroj generuje nejrůznější grafy a také tabulku obsahující údaje o tom, v jaké básni a sbírce k výskytu došlo.
Cvičebnice
Jedná se v podstatě o interaktivní učebnici a cvičebnici doplňující publikaci Úvod do teorie verše (Akropolis 2013). Mimo samotného výkladu jsou zde také cvičení, kde poznáváme jednotlivá metra či pevné formy ukázek. Pro používání je ovšem nutná registrace.
Použití ve škole
Význam a přínos těchto nástrojů pro odborníky a o tématiku versologie se zajímající laiky je zřejmý. Jaké využití může mít ale ve školní výuce? Věřím, že pokud jste článek dočetli až sem, jistě Vás již nejedna možnost napadla.
Zcela zřejmé je využití v hodinách literatury. Od jednoduchých srovnání vhodných pro druhý stupeň ZŠ až po metra a prosodii ve vyšších ročnících středních škol. Mladší žáci ocení v hodinách slohu možnost nechat si "změřit libozvučnost" své básně. Nejrůznější mezioborové projekty mohou profitovat z dat získaných ve frekvenčním slovníku, či v Hexu. A ani informatika nepřijde zkrátka. Nejoblíbenějšími daty pro cvičení v tabulkových procesorech jsou již po léta data statistického úřadu týkající se obyvatelstva v obcích ČR. Což ale pro jednou použít jako vstupní data počty slov v básních Otokara Březiny?
Použití ve škole navíc nahrává multiplatformnost těchto nástrojů. Většina z nich bez problémů funguje v jakémkoli prohlížeči (i v zařízeních s OS Android, které nepodporují flash), takže použití na školních tabletech nebo přímo na zařízeních žáků nic nebrání. Snad jen nutnost registrace u některých nástrojů.
Závěrem
Musím napsat, že celému versologickému týmu tleskám a upřímně děkuji. Jedná se o nástroj, který významným způsobem rozšiřuje možnosti práce s poesií dané doby. A není to pouhý statistický nástroj, díky propojení s
Českou elektronickou knihovnou není od teoretického zjištění ke konkrétní básni nikdy daleko. Je rovněž skvělé, že tyto nástroje jsou přístupny široké veřejnosti a nikoli pouze odborníkům. Možná by stálo za zvážení zrušení nutnosti registrace v některých nástrojích, aby se zjednodušilo jejich používání ve výuce.
Odkazy
Poznámky:
Obrázky byly vygenerovány nástroji Korpusu českého verše a ČRo.
Tento příspěvek byl původně publikován na blogu oborových studentů KITTV PedF UK
Edunaut zde.