LIA Sápmi er et talespråkskorpus med samiske dialekter. Opptakene inneholder nesten 190 000 ord fordelt på 122 informanter fra 19 steder.
Opptakene er gjort i tidsrommet 1960–1987, og det er opptak fra store deler av det nordsamiske området.
Arbeidet med korpuset er gjort i fellesskap av Universitetet i Oslo og UiT Norges arktiske universitet. Korpuset har fått automatisk lingvistisk analyse av Giellatekno ved UiT, og det er dermed mulig å søke på ordklasse og lemma, i tillegg til ordform.
Korpuset er tilgjengelig for forskere og studenter gjennom innlogging med Feide, eduGAIN og Clarin.
Arbeidet med LIA Sápmi er finansiert gjennom forskningsinfrastrukturprogrammet til Forskningsrådet og av Universitetet i Oslo og UiT Norges arktiske universitet.