Domů > Spomocník > Základní vzdělávání > Školská data jako předmět podnikání
Odborný článek

Školská data jako předmět podnikání

Anotace

Zpráva o možném využití velkých dat ve školství založená na přednášce kurátorky vzdělávacích technologií Audrey Watters, kterou měla na Columbia University v New Yorku.

Audrey Watters patří k mým nejoblíbenějším kurátorkám vzdělávacích technologií. Už jsme se o ní zmiňovali víckrát a Filip Reindl o ní v lednu napsal samostatný článek - Audrey Watters jako kurátorka vzdělávacích technologií. Audrey má úžasný přehled, který vychází ze zkušeností s prostředím počítačových firem a vlastního, do určité míry neúspěšného studia na několika vysokých školách. Je nezávislou komentátorkou dění v oboru. Její názory můžete sledovat na blogu Hack Education. Pozvolna se propracovala tak daleko, že ji zvou k přednáškám i vysloveně prestižní instituce. 16. října měla zvanou přednášku s názvem Student Data is the New Oil: MOOCs, Metaphor, and Money na Columbia University v New Yorku [1]. Sám jsem o současných snahách investorů ovládnout využití velkých dat ve školství již také psal (Komu patří velká data ve školství?), Audrey je však rozhodně informovaná mnohem lépe a má k aktuálnímu dění o hodně blíže. Rád bych vás proto s hlavními myšlenkami jejího projevu seznámil.

Nejprve jsme se dozvěděli, že na Kolumbijské univerzitě studoval její strýc, který se stal inspirací pro to, co dnes Audrey dělá. Byl novinářem píšícím o zábavním průmyslu pro časopisy Life a People. Audrey ho vždy vnímala jako někoho, kdo se dokázal vymanit z provinčního prostředí Wyomingu, kde jejich rodina žila, a udělal „díru do světa“. Do značné míry přejímá i jeho pohled na 60. léta minulého století, kdy Ameriku (i svět) ovládly studentské protesty proti válce ve Vietnamu (u nás proti okupaci) a alespoň nakrátko se zdálo, že vítězí „pravda a láska“. Nutno připomenout, že právě Kolumbijská univerzita se stala místem, kudy se ubíraly dějiny hnutí hippies (viz Jahodová proklamace).

Pro Audrey jsou paralelou k tehdejšímu dění současné protesty mladých lidí bojujících za svobodu šíření informací (Život a smrt Aarona Swartze). Historii tohoto hnutí dokonce zpracovávala v nedokončené disertační práci v roce 2003 na University of Oregon. Není divu, že se i nadále o příčiny podobných protestů zajímá a rozumí jim. Aktuální odhalení Edwarda Snowdena ukazuje, že důvody, proč by se o tuto problematiku měla zajímat veřejnost, existují a jsou dost závažné. Navíc souvisí s využitím technologií ve školství.

Pojmy jako „analýza výukových výsledků“ (10 let Horizon Reportů, Nový pohled na schopnost technologií ověřovat výukové výsledky) či „velká data“ (Co je datafikace?) se v souvislosti s budoucností školství používají stále více. Experti se předhánějí v tom, aby nás přesvědčili o výhodách, které ukládání dat o všem, co žáci na svém osobním přístroji dělají, přináší. Většinou se mluví o možnosti individualizovat výukový proces, vyšší efektivitě přípravy, nižší míře nedokončení studia a zlepšujících se výsledcích plošného testování.

Audrey jako příklad uvádí firmu Knewton, která stojí v čele vývoje adaptivních výukových aplikací. Ve spojení s nakladateli poskytuje studentům systém, který dlouhodobě zkoumá jejich výukové výsledky a na základě analýzy těchto dat jim navrhuje postup dalšího studia včetně toho, jaké výukové materiály si mají prostudovat. Učit se přitom mohou i zcela samostatně. Analýza funguje nějak takto: „Jestliže jsi schopen se naučit téma č. 513 (typicky dané standardy) nejlépe ráno od 8:20 do 9:35 s využitím 80 % textu a 20 % multimedií za 32 minut, dá se předpokládat, že dalších 12 podobných témat zvládneš nejsnadněji opět stejným způsobem.“ Knewton se chlubí tím, že studenti v rámci jeho online platformy „vyrobí“ denně přes milion datových záznamů. Ty jsou pak analyzovány systémem a dochází k následnému individualizovanému navrhování dalšího postupu každému uživateli.

To, co Knewton ukládá, je jen zlomek všech dat, které studenti při formální či neformální online činnosti generují. Přesto je to mnohem více, než bylo tradičně zvykem zaznamenávat. Dříve škola ukládala hlavně osobní údaje, výsledky zkoušení a testů, produkty práce, záznamy o chování, závěrečná hodnocení apod. Postupně tak byl vytvářen základ pro osobní digitální záznam (evidenci) každého studujícího a v USA existuje snaha státu tuto evidenci dostat nad rámec jedné školy a realizovat ji plošně po celou dobu studia. Ani to však již dnes nestačí. Ukládá se stále více informací – jaké materiály studenti otvírají, co hledají v knihovně a půjčují si, které prostory školy na jak dlouho navštěvují, jaké poznámky si při výuce dělají, s kým a co si píší. Hodně pro analýzu výukových výsledků zajímavých dat se však nachází také na místech, které jsou pro samostatné systémy řízení výuky dosud nedostupné – obecné internetové vyhledávání, profily ze sociálních sítí, čas trávený na Facebooku (třeba během vyučování), stránky otevírané na Wikipedii, sledování videí (nejen YouTube) včetně míst zastavení, statistiky účasti v MOOC kurzech, stahování a nahrávání souborů, hraní her a dosažená úroveň … A nakonec třeba dokonce i všechny stisky kláves a kliknutí myši.

Stále více firem a startupů se zapojuje do vývoje aplikací, jejichž hlavním cílem je taková uživatelská data generovat. Své základní služby většinou poskytují na první pohled „zdarma“. Samozřejmě pouze proto, aby je později co možná nejlépe zpeněžili. Je až s podivem, kolik investorů do tohoto sektoru aktuálně vkládá peníze. A nejsou to malé částky. Audrey uvádí jako příklad několik známých případů:

  • Remind101 – nástroj pro “bezpečnou” komunikaci v rámci výuky (3.5 mil. $);
  • Codecademy – online výuka programování (12.5 mil. $);
  • Udacity – poskytovatel MOOC kurzů (20 mil. $);
  • Edmodo – systém řízení výuky s prvky soc. sítě (40 mil. $);
  • Coursera – poskytovatel MOOC kurzů se 4.3 mil. uživateli (65 mil. $). 

Skoro to vypadá, že se vytěžování dat ve školství opravdu stává novým cílem takového podnikání, které opravdu může vzdáleně připomínat ropný průmysl (New Oil podle Audrey). Nápad nahradit docházející ropu podnikáním s daty ovšem od Audrey nepochází. Je již nějakou dobu často opakovaným heslem některých kapitánů světového byznysu (jedním z prvních byl Rupert Murdoch – viz Daty řízené školství v praxi). Audrey ve svém projevu odkazuje článek Jera Thorpa (Big Data Is Not the New Oil, [2]), který se snaží s touto představou polemizovat. Tvrdí, že informace patří, na rozdíl od ropy, ke snadno obnovitelným zdrojům a jejich množství stále roste. I on ovšem určitou podobnost připouští. Tržní hodnotu totiž mají právě ta data, která pocházejí od živých organizmů (lidí) a jsou kultivována vhodným uložením. Občas se do nich někdo provrtá a nechá je vytéci, což může vést k ohrožení našeho životního prostředí.

Proto nemůže být pochyb o tom, že bychom měli svá data před nevhodným nakládáním s nimi chránit. Skoro žádný uživatel internetových služeb si to neuvědomuje. Většina z nás bez mrknutí oka odsouhlasí dokonce i takové podmínky pro „bezplatné“ užívání služeb, které přímo uvádějí, že si vyhrazují právo poskytnout informace o nás třetím stranám (Privacy Icons – Víme, jak weby nakládají s našimi daty?).

Audrey to dokládá na příkladu statupu Degree Compass, který byl založen na University of Austin Peay v Tennessee. Jedná se opět o software se zabudovaným algoritmem provádějícím adaptivní analýzu dat ukládaných systémem řízení výuky, který doporučuje, do kterých kurzů by se měl student příště zapsat, aby dosáhl cílů odpovídajících jeho studijnímu programu. Degree Compass byl na začátku roku 2013 koupen firmou Desire2Learn za neznámou cenu. Univerzita bude napříště za tyto služby platit, ale to není to nejhorší. Všechna studentská data jsou teď ukládána mimo dosah školy a firma s nimi může nakládat podle svého uvážení. Právě toto se ve skutečnosti stalo předmětem kontraktu, ale nikdo o tom nemluví. Podobných případů, kdy by se studenti (a nejen oni) měli domáhat vlastnictví svých vlastních dat, je bohužel stále více. Dobrou zprávou je snad jen to, že ministerstvo školství USA (ED.gov) si situaci, zdá se, uvědomuje (Strategie rozvoje školství v USA pod taktovkou Ed.gov).

Teoretické zdůvodnění, podle něhož je v moci analýzy výukových výsledků prováděné na velkých datech podstatně zdokonalit schopnost učitele zjistit, co se jeho žák již naučil, je jistě správné. Slibuje do budoucna dokonce i možnost do určité míry proces řízení výuky automatizovat (Kdo z našich žáků nejspíše nenajde práci?). Nejdůležitější ale je, kdo ta velká data bude vlastnit a k jakým účelům je bude chtít využít. Měli bychom si být vědomi všech důsledků. Hlavním zájmem podnikatelů v této oblasti nutně nemusí být jen zlepšení výukových výsledků. Možná se bude jednat dokonce i o víc než jen o byznys.

Analýza velkých dat pravděpodobně bude schopna mnohem dokonaleji identifikovat předem ty studenty, kteří mají dispozice zdárně studium dokončit. Totéž se dá říci o těch, u nichž existuje velké riziko studijních problémů. Bude možné provádět plošné dlouhodobé analýzy – třeba jaký dopad mají výsledky výuky algebry na celkovou úspěšnost v zaměstnání. Nebo jak se výuka historie západní civilizace promítá do volebních preferencí občanů.

Budeme schopni mnohem snadněji odhalovat ty lekce a kurzy, které jsou neefektivní (Jaká je budoucnost pedagogického výzkumu?). Třeba právě vývojáři Coursery často mluví o tom, že jsou schopni v prostředí dostatečného množství informací o tom, co studenti jejich kurzů dělají, velmi rychle identifikovat, kde výuka nefunguje.

Nakonec dospějeme až tak daleko, že budeme schopni se značnou pravděpodobností zjistit, kdo má dobré předpoklady stát se třeba vynikajícím biologem, špičkovým manažerem, úspěšným podnikatelem apod. Odvodit tak lze i to, kdo je potenciálním budoucím sponzorem schopným zpětně svou školu podporovat.

A abychom myšlenkový okruh této přednášky dokončili, je třeba konstatovat, že zjistit bude možné i to, kdo se pravděpodobně může jednou stát radikálem, disidentem či dokonce teroristou. Je docela pravděpodobné, že data toto umožňující mohou být docela zajímavým předmětem obchodu. Zatím o tom nikdo moc nemluví, ale je zřejmé, že možnost předvídat chování lidí je ideálem tajných anti-teroristických služeb všech vlád. Taková analýza by jistě značně zdokonalila současné metody založené na odposleších hovorů a obsahu internetem přenášených dat. Jak nás o tom nedávno informoval Edward Snowden, je pokušení mocných zneužít jim svěřené prostředky nad rámec oficielně jim daných pravomocí neodolatelné. A to nemluvíme o režimech totalitních ale o naší post-demokracii (Moc bezmocných dnes).

Závěr je snad jasný. Musíme pečlivě hlídat, kdo velká data shromažďuje a hlavně k čemu je chce využít. Jaký záměr stojí za návrhem algoritmu pro jejich analýzu. Stačí se zamyslet nad tím, jaké cíle mají ti, kteří přirovnávají velká školská data ke „zlatému dolu“. Čí prospěch ve skutečnosti sledují? Jde jim opravdu o studenty?

Audrey Watters - Data is the New Oil: MOOCs, Metaphor, and Money

Literatura a použité zdroje

[1] – WATTERS, Audrey. Student Data is the New Oil: MOOCs, Metaphor, and Money. 2013. [cit. 2013-11-4]. Dostupný z WWW: [http://www.hackeducation.com/2013/10/17/student-data-is-the-new-oil/].
[2] – THORP, Jer. Big Data Is Not the New Oil. 2012. [cit. 2013-11-4]. Dostupný z WWW: [http://blogs.hbr.org/2012/11/data-humans-and-the-new-oil/].

Licence

Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.

Autor
Ing. Bořivoj Brdička Ph.D.

Hodnocení od uživatelů

Článek nebyl prozatím komentován.

Váš komentář

Pro vložení komentáře je nutné se nejprve přihlásit.

Článek není zařazen do žádného seriálu.