Informatik pro práci s textovými daty
Ústav Českého národního korpusu se zabývá především systematickým mapováním češtiny v mnoha jejích podobách a žánrech (včetně češtiny psané i mluvené) prostřednictvím vytváření, odborné anotace a zpřístupňování rozsáhlých databází autentických textů – jazykových korpusů. Ty slouží zejména jazykově orientovanému výzkumu v oblasti společenských a humanitních věd.
Nedílnou součástí těchto aktivit je také vývoj specializovaných aplikací pro uživatelskou práci s korpusy, poskytování konzultací a školení, analýza uživatelských dat a poskytování datových balíčků pro specifické účely, zejména pro počítačové zpracování přirozeného jazyka. Webová rozhraní pro práci s korpusy jsou spolu s uživatelskou podporou (manuály, kurz práce s korpusem, on-line poradna atd.) a dalšími aktivitami projektu soustředěna na portálu http://www.korpus.cz/. Projekt Český národní korpus měl ke konci roku 2016 téměř 6 500 registrovaných aktivních uživatelů, celkový počet dotazů položených do některého z rozhraní přesahuje 700 000 ročně.
Hlavní odpovědnosti
- programování nástrojů pro zpracování rozsáhlých souborů jazykových dat (převážně textů)
- možná je také spolupráce na vývoji uživatelských rozhraní
Požadujeme
- dobrá znalost linuxového prostředí a skriptování, Python nebo Perl, XML
- schopnost analyzovat problém a hledat optimální řešení
- samostatnost, spolehlivost a zodpovědnost
- ochota se neustále učit
- angličtina (alespoň pasivně)
Výhodou
- HTTP, PHP, SQL, zkušenosti s paralelním zpracováním větších dat (Hadoop/Spark)
Nabízíme:
- zajímavou práci v netradičním a perspektivním oboru
- zaškolení a příležitost k profesnímu růstu
- inspirující akademické prostředí
- stabilní zázemí největší české humanitní fakulty
- klidné pracovní prostředí v centru Prahy blízko metra
- pružnou pracovní dobu
- práci vhodnou i pro absolventy
- zaměstnanecké benefity
Možnost nástupu
Dle dohody
Pracovní smlouva se uzavírá na dobu určitou. Částečný úvazek.
Způsoby přihlášení
- Elektronicky:
Vyplňte ve formuláři níže všechny položky označené * a nahrajte všechny požadované přílohy, poté klikněte na tlačítko odeslat. Úspěšné přihlášení Vám potvrdíme e-mailem. - Písemně/osobně:
Přihlášku se všemi přílohami můžete zaslat i poštou, nebo doručit osobně na adresu osobní oddělení FF UK, nám. Jana Palacha 1/2, 116 38 Praha, na obálku napište: VŘ Informatik pro práci s textovými daty. - E-mailem:
Přihlášku v českém jazyce se všemi přílohami zašlete e-mailem na adresu michal.kren@ff.cuni.cz.
Přihlášky posílejte do 15. 10. 2017
Přiložte prosím motivační dopis a podrobný strukturovaný životopis.