Oslo-Bergen-taggeren
- en grammatisk tagger for bokmål og nynorsk
Oslo-Bergen-taggeren er en robust morfologisk og syntaktisk tagger som er utviklet ved Universitetet i Oslo og Uni Computing i Bergen gjennom flere år. Taggeren består i dag av tre hovedmoduler: en preprosessor med sammensetningsanalysator og multitagger, en grammatikk-modul for morfologisk og syntaktisk disambiguering (constraint grammar) og en statistisk modul som fjerner siste rest av gjenstående morfologisk flertydighet (bare for bokmål). Grammatikk-modulen bruker en kompilator utviklet ved Syddansk universitet i Odense. Multitaggeren benytter fullformsleksikonet Norsk ordbank.
Les mer om Oslo-Bergen-taggeren, taggerens historie, evaluering og taggsett i menyen til venstre. Her er det også mulig å teste taggeren online, eller laste den ned på GPL-lisens.



