Klára Osolsobě | Přegenerování a podgenerování: Jak efektivně vyhledávat v jazykových korpusech data pro lingvistický výzkum

Přednáška se koná 4. prosince 2024 od 18:00 v rámci cyklu Kruhu přátel českého jazyka v místnosti P018 v hlavní budově FF UK.

V přednášce ukážeme na případu typu kutil (deverbativních názvů osob ‒ apelativ/proprií ‒ tvořených konverzí l-ového příčestí k deklinačnímu typu pán), jak lze při kladení dotazu v korpusově založeném výzkumu slovotvorby korigovat přegenerování (zvýšit přesnost) a zabránit podgenerování (udržet pokrytí). Ověříme meze a možnosti formálního popisu (algoritmizace). Představíme výsledky kvantitativní analýzy založené na datech získaných z korpusu (corpus based). Naznačíme, jak lze data využít pro výzkum proprií. Zmíníme se o možnostech využití v počítačovém zpracování přirozeného jazyka (natural language processing ‒ NLP), konkrétně pro oblast automatické morfologické analýzy.

Podrobnosti události

Začátek události
4. 12. 2024 18:00
Místo konání
FF UK, nám. Jana Palacha 2, Praha 1 (místnost č. 18)
Organizátor
Ústav českého jazyka a teorie komunikace FF UK
Typ události
Konference a přednášky