INESS: En infrastruktur for trebanker

Fredag 11. april 2014, 14:15 – 16:00 (HF: 217)

Victoria Rosén, Helge Dyvik, Petter Haugereid, Martha Thunes og Gyri Smørdal Losnegaard, forskergruppe LaMoRe (Language Models and Resources), UiB

INESS (Infrastructure for the Exploration of Syntax and Semantics) er et prosjekt i NFRs INFRASTRUKTUR-program.  Prosjektet bygger en infrastruktur for trebanker, som er syntaktisk annoterte korpora.  Annotasjonen gjør det mulig å finne grammatiske konstruksjoner som det er vanskelig å finne i korpora uten syntaktisk annotasjon.  Et avansert søkesystem gjør det mulig for grammatikkforskere, leksikografer og andre interesserte å søke etter eksempler i trebanken på en detaljert og fleksibel måte.

INESS-prosjektet har to hovedmål: å gjøre trebanker for mange språk søkbare og synlige gjennom en vanlig nettleser, og å bygge en omfattende norsk trebank med detaljerte syntaktiske og funksjonelle analyser for bokmål og nynorsk.  I dette seminarinnlegget vil noen av INESS-medarbeiderne presentere viktige deler av prosjektet, og da særlig hvordan den norske trebanken bygges.  Blant annet vil de vise hvordan de syntaktiske analysene ser ut, hvordan tekster preprosesseres før de analyseres automatisk, og hvordan grammatikk og leksikon revideres i møte med korpusdata.

Leave a Reply