U nás jméno lingvisty Henryho Kučery vyjma odborných kruhů nejspíš nikomu nic moc neřekne, nicméně tento rodák z Československa vytvořil spolu s kolegou W. Nelsonem Francisem právě před 55 lety vůbec první jazykový korpus na světě známý jako Brown Corpus. „Je to vlastně paradoxní, že korpus americké angličtiny nevytvořil rodilý mluvčí,“ říká slavistka Masako Fidler z americké Brownovy univerzity.
Co přineslo Kučerovi největší věhlas? Právě to, že vytvořil úplně první korpus současné americké angličtiny na světě?
Ano, nicméně věhlas nepřišel automaticky ihned. Polovina šedesátých let byla doba, která nepřála kvantitativnímu směru v lingvistice.
Byl upřednostňován proud formální lingvistiky představovaný Noamem Chomskym, jenž kladl důraz na idealizovaný, gramaticky správný tvar věty bez kontextu. Ovšem čas nakonec potvrdil, jak významný počin Kučera a Francis učinili – nejenže je Brown Corpus nejhojněji citovaným korpusem na světě, ale korpusy jsou běžně využívány ve všech jazycích včetně češtiny.
Jak složité bylo v „počítačovém pravěku“ takový korpus vytvořit?
Dnes máme spoustu softwarů a statisticky propracovaných metod, nicméně infrastruktura výpočetní techniky v tehdejší době byla v podstatě v plenkách. Pro srovnání – Brown Corpus obsahoval něco přes milion slov, dnes korpusy obsahují miliardy slov. Ale na tehdejší dobu to byl neobyčejně velký objem…
Předplaťte si Respekt a nepřicházejte o cenné informace.
Online přístup ke všem článkům a archivu