identificationInfo [ComponentId=‘clarin.eu:cr1:c_1396012485125’]:
resourceName [xml:lang=‘nb’]: Leksikografisk bokmålskorpus
resourceName [xml:lang=‘en’]: The Lexicographic Corpus for Norwegian Bokmål
description [xml:lang=‘en’]:
The corpus consists of texts collected from available literature/prose
from 1985 to 2013. The corpus is composed of texts from five genres:
non-fiction prose (45 %) fiction (35 %) newpapers/magazines (10 %), TV
subtitles (5 %), and non-standardized, unpublished texts (5 %), all in
all 100 mill words.
The corpus is grammatically tagged with the original version of The Oslo-Bergen tagger.
description [xml:lang=‘nb’]:
Korpuset består av tekster hentet fra tilgjengelig litteratur/prosa fra
1985 til 2013. Korpuset har tekster fra fem sjangere: sakprosa (45%)
skjønnlitteratur (35%) aviser og periodika (10%), TV-teksting( 5%), og
upublisert materiale, småtrykk (5%), alt i alt 100 mill ord.
Korpuset er grammatisk merket med den opprinnelige versjonen av Oslo-Bergen taggeren.
resourceShortName [xml:lang=‘nb’]: LBK2013
resourceShortName [xml:lang=‘en’]: LBK2013
url: http://www.hf.uio.no/iln/om/organisasjon/tekstlab/prosjekter/lbk/
PID: http://hdl.handle.net/11538/0000-000B-C022-5