Warsztaty

Dr Witold Kieraś, Instytut Podstaw Informatyki PAN

Korpusomat – tworzenie własnych korpusów

Warsztat będzie poświęcony ogólnodostępnemu narzędziu do tworzenia automatycznie znakowanych korpusów o nazwie Korpusomat (http://korpusomat.pl). Narzędzie jest rozwijane od 2016 roku w Zespole Inżynierii Lingwistycznej Instytutu Podstaw Informatyki PAN, a jego użytkownikami są zarówno studenci i doktoranci kierunków językoznawczych, jak i indywidualni badacze języka. Warsztaty będą podzielone na dwie półtoragodzinne części. Pierwsza będzie miała charakter nieco bardziej teoretyczny, dzięki czemu uczestnicy dowiedzą się, z jakich narzędzi i zasobów jest zbudowany Korpusomat, w jaki sposób przetwarzają one teksty i jakiego rodzaju informacje można dzięki nim z tekstów wydobyć. Druga część będzie miała charakter zdecydowanie bardziej praktyczny – uczestnicy za pomocą Korpusomatu zbudują przykładowy niewielki korpus, poznają język zapytań wbudowanej w Korpusomat wyszukiwarki i spróbują wykonać proste zadania polegające na wydobyciu z korpusu określonych informacji.