cmdp:identificationInfo [cmd:ref=‘ndc-treebank’]:
cmdp:resourceName [xml:lang=‘nb’]: NDC-trebanken
cmdp:resourceName [xml:lang=‘en’]: The NDC Treebank
cmdp:description [xml:lang=‘en’]:
The NDC Treebank includes 4637 speech segments and 66 042 tokens from
the Norwegian part of Nordic Dialect Corpus. The segments are taken from
30 transcribed interviews from 17 places in Norway. The treebank is
annotated with morphological and dependency-style syntactic analysis and
manually corrected. The treebank is available in two versions: A
downloadable version in conllx format and a searchable version in the
search interface Glossa.
Nordic Dialect Corpus is a corpus of Norwegian, Swedish, Danish, Faroese, Icelandic and Övdalian spontaneously spoken dialects.
cmdp:description [xml:lang=‘nb’]:
NDC-trebanken inneholder 4637 talemålssegment og 66 042 ord/token fra
den norske delen av Nordisk dialektkorpus. Segmentene er hentet fra 30
transkriberte intervjuer fra 17 stader i Noreg. Trebanken er annotert
med morfologisk og syntaktisk informasjon og manuelt korrigert.
Trebanken er tilgjengelig i to versjoner: en nedlastbar versjon i
conllx-format og en søkbar i søkegrensesnittet Glossa.
Nordisk dialektkorpus er et talespråkskorpus med spontantale fra norske, svenske, danske, islandske og færøyske dialekter.
cmdp:resourceShortName [xml:lang=‘en’]: The NDC Treebank
cmdp:resourceShortName [xml:lang=‘nb’]: NDC-trebanken
cmdp:url: http://www.tekstlab.uio.no/scandiasyn/index.html
cmdp:url: http://www.tekstlab.uio.no/nota/scandiasyn/treebank.html
cmdp:PID: https://hdl.handle.net/11538/8493fdd3-a