LIA-parseren er ein dependensparser som er trent på LIA-trebanken. Parseren er ein såkalla transition-based dependensparser, UUparser, utvikla ved Uppsala Universitet. Det er også trent ein tilsvarande parser for dialekttranskripsjoner på bokmål, NDC-parseren.
Parserane blei evaluerte ved ein 5-fald kryssvalidering slik:
Treebank | UAS | LAS |
---|---|---|
LIA | 85.23 | 80.01 |
NDC | 84.11 | 78.43 |
(UAS: unlabelled attachment score, LAS: labelled attachment score)
Last ned parserane og trebankane frå Github
Arbeidet med parserane er gjort i samarbeid med Andre Kåsen ved Nasjonalbiblioteket og finansiert av infrastrukturprosjektet Clarino+.