Språkforskningsinfrastrukturer: en statusrapport

Fredag 7. mars 2014, 14:14–15:45

Koenraad De Smedt, forskergruppe LaMoRe (Language Models and Resources), UiB

Siden CLARIN ble satt på ESFRI-veikartet i 2006 har infrastruktur for språkforskning vært en aktuell målsetning i Europa, også i Norge. CLARIN (Common Language Resources and Technology Infrastructure) har etter hvert blitt til en ERIC (European Research Infrastructure Consortium) der Norge er blitt observatør med CLARINO som nasjonalt prosjekt. UiB er koordinator for CLARINO. Status for CLARINO vil bli skissert i foredraget. Samtidig har CLARIN forbindelser med det såkalte ‘cluster’prosjektet DASISH og det enda bredere prosjektet EUDAT. Etter hvert har det oppstått et variert landskap der ulike aktører bidrar med strategier og metoder for en bedre forvaltning og tilgjengeliggjøring av språklige forskningsressurser som f.eks. tekstkorpus, leksikalske og terminologiske baser, annoterte litterære tekster, historiske arkiver, osv. Det er fortsatt flere problemstillinger knyttet til bruk og gjenbruk av språkdata, bl.a. juridiske og etiske aspekter (mangel på ‘fair use’ i Europa), metadataformater og ansvar for langvarig lagring og drift.

Leave a Reply