Domů > Spomocník > Základní vzdělávání > Korpus českého verše a jeho využití ve výuce
Odborný článek

Korpus českého verše a jeho využití ve výuce

13. 11. 2014 Základní vzdělávání Spomocník
Autor
Mgr. Jan Bouchner

Anotace

Zpráva o novém nástroji Ústavu pro českou literaturu AV ČR, který poskytuje informace o české poezii 19. a 20. st. a může být vhodným zdrojem informací pro výuku.

4. listopadu 2014 byl spuštěn Versologickým týmem Ústavu pro českou literaturu AV ČR velmi zajímavý projekt. Na stránkách www.versologie.cz totiž najdeme Korpus českého verše. O co se jedná a jak lze tento mocný nástroj použít ve výuce, o tom pojednává následující článek.

O co jde

Zde si pomohu citací přímo ze stránek Korpusu českého verše:

"Korpus českého verše (KČV) je lemmatizovaný, foneticky, morfologicky, metricky a stroficky anotovaný korpus české poezie 19. a počátku 20. století.
Ke každé slovní jednotce v korpusu je připojena informace o jejím základním slovním tvaru (lemma), fonetickém přepisu a gramatických kategoriích, u každého verše je určeno metrum (jamb, trochej...), rozsah (n-stopý), typ klauzule (mužská, ženská...) a metrický vzorec. (V současnosti jsou z hlediska metriky anotovány pouze verše sylabotónické.) Na vyšších rovinách jsou pak anotovány rýmové dvojice, resp. n-tice a pevné formy (sonet, rondel...). V metrickém a strofickém popisu je možné vyhledávat prostřednictvím Databáze českých meter, rovina lemmatizace je částečně zpřístupněna prostřednictvím Frekvenčních slovníků, rýmové páry lze vyhledávat v aplikaci Gunstick
KČV..."

Jedná se tedy o databázi české poezie a to až na úrovni slov. Obsahuje 78 391 básní v 1689 básnických sbírkách z 19. a 20. století (soupis všech zpracovaných textů). Aby nedocházelo k mýlce, Korpus českého verše nezpřístupňuje básně či básnické sbírky jako takové, ale podrobné informace o nich. Pokud hledáte způsob, jak se dostat k digitalizované podobě české poezie 19. a počátku 20. století, pak mohu doporučit jiný zajímavý projekt, Českou elektronickou knihovnu, z které ostatně údaje v KČV vycházejí. ČEK obsahuje 1700 digitalizovaných básnických knih a, jak sami píší, přináší kompletní veršované dílo nejvýznamnějších básníků české novodobé literatury.

Co KČV nabízí

Krom samotných statistických dat (zjistíme například, že čeští poetové byli nejaktivnější v letech 1890 - 1899, kdy napsali skoro půl milionu veršů) můžeme použít i několik velmi zajímavých nástrojů:

  • Frekvenční slovník
  • Gunstick - databázi rýmů
  • Databázi českých meter
  • Eufonometr
  • Hex - klíčová slova v české poezii
  • Cvičebnici

Mimo nástrojů dostupných přímo na stránkách versologie.cz přidal svou trošku do mlýna i Český rozhlas. Na svých stránkách vytvořil nástroj, který zpřístupňuje některé informace z korpusu a vizualizuje je pomocí tag cloudu. Snadno tak zobrazíme nejoblíbenější podstatné slovo Jaroslava Vrchlického (srdce) nebo nejoblíbenější přídavné jméno Karáska ze Lvovic (mrtvý).

Frekvenční slovník

Zde nalezneme databázové soubory (xls, txt) jak celého korpusu (více než 14 milionů záznamů), tak jednotlivých subkorpusů (autorů a následně i sbírek). U každého lemmatu (základního slovníkového tvaru slova - započítány jsou tedy výskyty jakéhokoli tvaru) je uvedeno pořadí, slovní druh a relativní a absolutní četnost. Nejde zde tedy o nástroj jako takový, ale spíš o zpřístupnění nadmíru zajímavých dat, která pak můžeme dále zpracovávat a porovnávat.

Gunstick - databáze rýmů

Gunstick nám umožní nahlédnout pod pokličku české poezie z hlediska rýmů. Můžeme si vyhledat rýmy k jakémukoli slovu, které nás napadne. Gunstick zobrazí graf relativní četnosti jednotlivých rýmů k zadanému slovu, počet rýmů v jednotlivých letech a konečně i tabulku s konkrétními verši, ve kterých se rým objevuje, společně s údajem o autorovi, básni, sbírce a roku vydání. Tak si například ověříme, že nejčastějším rýmem ke slovu "škola" bylo mezi lety 1800 a 1920 skutečně slovo "volá".
Vyhledávání je možné dále omezovat. Můžeme prohledávat jen některé autory, brát v potaz určitou dobu vydání nebo upřesnit metrickou klauzuli (mužský X ženský verš, ukončený X neukončený...).

Databáze českých meter

Zde je zpřístupněn metrický a strofický popis všech 1689 zpracovaných básnických sbírek. Tento nástroj však není přímo na stránkách versologického týmu a vyžaduje registraci.
Odmění nás ale mnoha zajímavými informacemi o formální stránce české poezie dané doby. Databáze českých meter nám především umožňuje vytvořit vizualizace různých dotazů. Zobrazí nám např. grafy i tabulky srovnávající Nerudovu a Hálkovu oblibu používání sonetu.
Tento nástroj je velmi mocný, nicméně je zřejmé, že je určen spíše odborníkům a entuziastům v oboru literární vědy.

Eufonometr

V druhé polovině dvacátého století vytvořili lingvisté způsob, jak spočítat zvukomalebnost básnického textu. A právě toto nabízí nástroj eufonometr. Můžeme vložit jakýkoli básnický text a nástroj nám spočítá míru zvukomalebnosti a ukáže, kterému autoru jsme nejblíže. Dozvíme se tak například, že "autor" lidové písničky Skákal pes by sdílel 33. příčku s Františkem Rajmanem.

Hex - klíčová slova v české poezii

Tento nástroj nám umožní v korpusu vyhledat určité klíčové slovo (nejde tedy o prostý výskyt slova, jeho výskyt v dané básni musí být statisticky významný). Zjistíme pak u jakého autora, v které sbírce a v jaké básni bylo kolikrát použito. Například se tak dozvídáme, že jediný, kdo významně použil (3 krát) v básni slovo "vzdělání", byl Šebestián Hněvkovský. Nástroj generuje nejrůznější grafy a také tabulku obsahující údaje o tom, v jaké básni a sbírce k výskytu došlo.

Cvičebnice

Jedná se v podstatě o interaktivní učebnici a cvičebnici doplňující publikaci Úvod do teorie verše (Akropolis 2013). Mimo samotného výkladu jsou zde také cvičení, kde poznáváme jednotlivá metra či pevné formy ukázek. Pro používání je ovšem nutná registrace.

Použití ve škole

Význam a přínos těchto nástrojů pro odborníky a o tématiku versologie se zajímající laiky je zřejmý. Jaké využití může mít ale ve školní výuce? Věřím, že pokud jste článek dočetli až sem, jistě Vás již nejedna možnost napadla.
Zcela zřejmé je využití v hodinách literatury. Od jednoduchých srovnání vhodných pro druhý stupeň ZŠ až po metra a prosodii ve vyšších ročnících středních škol. Mladší žáci ocení v hodinách slohu možnost nechat si "změřit libozvučnost" své básně. Nejrůznější mezioborové projekty mohou profitovat z dat získaných ve frekvenčním slovníku, či v Hexu. A ani informatika nepřijde zkrátka. Nejoblíbenějšími daty pro cvičení v tabulkových procesorech jsou již po léta data statistického úřadu týkající se obyvatelstva v obcích ČR. Což ale pro jednou použít jako vstupní data počty slov v básních Otokara Březiny?
Použití ve škole navíc nahrává multiplatformnost těchto nástrojů. Většina z nich bez problémů funguje v jakémkoli prohlížeči (i v zařízeních s OS Android, které nepodporují flash), takže použití na školních tabletech nebo přímo na zařízeních žáků nic nebrání. Snad jen nutnost registrace u některých nástrojů.

Závěrem

Musím napsat, že celému versologickému týmu tleskám a upřímně děkuji. Jedná se o nástroj, který významným způsobem rozšiřuje možnosti práce s poesií dané doby. A není to pouhý statistický nástroj, díky propojení s Českou elektronickou knihovnou není od teoretického zjištění ke konkrétní básni nikdy daleko. Je rovněž skvělé, že tyto nástroje jsou přístupny široké veřejnosti a nikoli pouze odborníkům. Možná by stálo za zvážení zrušení nutnosti registrace v některých nástrojích, aby se zjednodušilo jejich používání ve výuce.

Odkazy

 
 
Poznámky:
Obrázky byly vygenerovány nástroji Korpusu českého verše a ČRo.
Tento příspěvek byl původně publikován na blogu oborových studentů KITTV PedF UK Edunaut zde.

Licence

Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.

Hodnocení od uživatelů

Článek nebyl prozatím komentován.

Váš komentář

Pro vložení komentáře je nutné se nejprve přihlásit.

Článek není zařazen do žádného seriálu.