Norske talespråkskorpus
|
Korpusene nedenfor er en samling av ulike norske delkorpus som er helt eller delvis utviklet ved Tekstlaboratoriet - enten av Tekstlaboratoriet alene eller i samarbeid med andre. Korpusene varierer fra å være ferdigutviklet til å være under planlegging. |
NoTa-Oslo Norsk talespråkskorpus-Oslo-delen |
Kort info | |
TAUS Talemålsundersøkelsen i Oslo |
Kort info | |
BigBrother | Kort info | |
Nordisk dialektkorpus - Scandinavian Dialect Corpus | Kort info | |
UPUS Utviklingsprosesser i urbane språkmiljøer |
Kort info |
NoTa-Oslo [Norsk talespråkskorpus-Oslo-delen] Talemål fra Oslo og Oslo-området 2005 [Hjemmeside] [Søk]
- Ortografisk transkribert korpus med lenker til video- og lydfiler. Korpuset er også grammatisk tagget
- Informantene er representative mht. sosiolingvistiske variabler som kjønn, alder, utdannelse og bosted
- Tidspunkt for opptak: 2005
- Opptakssted: Oslo og kommunene omkring Oslo
- Antall informanter: 166
- Antall ord: 900 000
- Type materiale: Intervjuer og samtaler
- Status for prosjektet: noe arbeid på grensesnittet gjenstår samt litt korrekturlesing av transkripsjoner
TAUS [Talemålsundersøkelsen i Oslo] Talemål fra Oslo fra 1970-tallet [Hjemmeside] [Søk]
- Fonologisk transkribert korpus med lydfiler som ikke er lenket til transkripsjonene. Korpuset er også grammatisk tagget
- Ortografisk transkribert med
lenke til lydfiler i 2006 - 2007
- Informantene er representative mht. sosiolingvistiske variabler som kjønn, alder, utdannelse og bosted
- Tidspunkt for opptak: 1970 - 1975
- Opptakssted: Oslo (Frogner og Vålerenga)
- Antall informanter: 59
- Antall ord: ca 212 000
- Type materiale: Intervjuer
- Status for prosjektet: ferdig, men koplingen mellom fonologisk transkribert korpus og ortografisk transkribert korpus er foreløpig ikke søkbar.
Big Brother [TV-show] Talemål fra unge voksne[Hjemmeside] [Søk]
- Ortografisk transkribert korpus delvis lenket til lyd- og videofiler
- Informantene er 10 unge voksne fra flere ulike steder i Norge
- Tidspunkt for opptak: 2001
- Opptakssted: Oslo
- Antall informanter: 10
- Antall ord: ca 550 000
- Type materiale: mange ulike situasjoner i BigBrother-huset
- Status for prosjektet: de siste episodene transkriberes sommeren 2008. Ferdigstilles med nytt grensesnitt i løpet av høsten.
Nordisk dialektkorpus - Scandinavian Dialect Corpus [Hjemmeside] [Søk]
- 2007 - 2008: Tekstlaboratoriet utvikler første del av et korpus og en talespråksdatabase for nordiske dialekter. Vi samler også inn materiale til et norsk dialektkorpus fra ca 50 målepunkter (dvs ca 200 informanter) rundt omkring i Norge. Innsamlingen skjer i samarbeid med våre partnere ved UiT og NTNU.
2008 - 2009: Den norske delen av dialektkorpuset utvides med 25 målepunkter.
Det norske dialektkorpuset vil bestå av intervjuer og samtaler som skal transkriberes og kobles sammen med tilsvarende lyd- og videoopptak. Det vil også bli brukt spørreskjemaer som skal kartlegge ulike syntaktiske forhold i informantenes talemål. Korpuset vil dessuten bestå av eldre transkripsjoner og opptak, for eksempel fra Målførearkivet ved ILN, dels i samarbeid med NO2014. De øvrige nordiske dataene vil leveres av våre samarbeidspartnere i ScanDiaSyn.
Nordisk dialektkorpus og database utvikles i samarbeid med våre partnere i det nordiske nettverket ScanDiaSyn og det nordiske senteret for fremragende forskning, NORMS. Korpuset og databasen vil bli allment tilgjengelig for forskning, og vil være et viktig verktøy for språkforskere nasjonalt og internasjonalt. Den norske delen av dialektkorpuset vil kunne utgjøre en del av en framtidig norsk språkbank.
UPUS [Utviklingsprosesser i urbane språkmiljøer] [Hjemmeside] [Søk]
- Korpus under utvikling ved UPUS-prosjektet ledet av Brit Mæhlum, INL, NTNU
Søkemuligheter i korpusene
De transkriberte korpusene er søkbare og til dels grammatisk tagget. Resultatene av søk blir presentert som konkordanser med påfølgende klikkbare video- og/eller lydfiler. Korpusene er søkbare via ord, deler av ord, grammatiske tagger og ulike typer hendelser (latter, hosting osv).
Fordi korpusene er representert både ved transkripsjon, annen annotasjon, video- og lydfiler, kan de være svært nyttige for mange typer av lingvistisk forskning: syntaks, morfologi, fonologi, fonetikk, semantikk, leksikografi, språkteknologi og datalingvistikk, diskursanalyse, sosiolingvistikk osv. Fordi korpusene har blitt tatt opp i forskjellige talestiusjoner med forskjellige typer mennesker, vil korpusene også være nyttige for flere typer forskning, f.eks. forskning i kunstig intelligens, psykologi og sosiologi.
Tillatelse til å bruke korpusene
Kontakt Tekstlaboratoriet for å få tillatelse til å bruke korpusene. Normalt vil du få tilgang i løpet av 24 timer. Enhver person som ønsker å bruke korpusene til forskning, kan få tillatelse til å bruke dem.
Avis:
"Hun dama der ..." på fremmarsj (Aften 3. april 2007. Se hovedsideoppslaget og artikkelen)
Jakter på hverdagsspråket (Aftenposten 1. nov. 2005)
Jakter på hverdagsspråket (Notiser i Framtid i Nord , Bladet Tromsø , Troms Folkeblad og Harstad Tidende 31. okt. 2005)
Oslo kan miste språket (Aftenposten 29. okt. 2005)
"Bannan" på vei ut (Om NoTa-prosjektet i Aftenposten Aften 10. mai 2005)
Gjøre eller gjørra? (Akers Avis Groruddalen fredag 6. mai 2005)
Radio og TV:
Gått Norsk (Janne Bondi Johannessen analyserer språket i tekstene til tre Oslo-band. Radio Tango nov. og des. 2007. Les omtalen og hør innslagene om: Joachim "Jokke" Nielsen og Michael Krohn fra Raga Rockers. (NB: Musikken i innslagene er redigert bort pga rettighetsproblematikk)
Slang i Oslo og i NoTa-materialet (Bente Ailin Svendsen i NRK Østlandssendingen 10. april 2007. Hør innslaget)
Om Oslo-språket ( TVNorge , Oslo-TV 2. mai 2006. Les omtalen )
Om demonstrativene "han" og "hun" (NRK Språkteigen 12. mars. 2006. Hør innslaget )
Sammenlikning av to taleprøver fra TAUS og NoTa ved Unn Røyneland (NRK Språkteigen 15. jan. 2006. Hør innslaget )
Mer fra NoTa (NRK Språkteigen 6. jan. 2006. Hør innslaget )
Om NoTa-prosjektet (NRK Språkteigen 18. des. 2005. Hør innslaget )
Oslo-dialekter viskes ut (NRK Østlandssendingen 31. okt. 2005. Hør innslaget )
Oslo-dialekter viskes ut (NRK Kulturnytt 31. okt. 2005. Les omtalen , hør innslaget )
Om talemål - og grammatikk ( NRK P1 Norgesglasset , 11.mai 2005)
Publikasjoner på Internett:
Jakter på hverdagsspråket ( forskning.no 31. okt. 2005)
Les dette - for faen (iOslo.no 6. des. 2006)
Gult kort mot banning (Aften 5. des. 2006)
Banning ikke stygt lenger (Norgesglasset NRK P1 5. des. 2006. Les omtalen)
Om banning (Radioselskapet NRK P2 5. des. 2006)
Om banning (Kanal 24 4. des. 2006)
- «Faen» ikke stygt lenger (Aften 4. des. 2006. Se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Om uttalen av Oslo og ungdomsspråk (Hanne Gram Simonsen i God morgen Norge, TV2 30. nov. 2006. Se opptaket på web-TV, hør innslaget)
Oslo eller Oschlo? (Hanne Gram Simonsen i NRK Østlandssendingen 28. nov. 2006. Hør innslaget)
«Oschlo» godtas (Aften 28. nov. 2006, se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Oslo eller Oschlo? (Aften 27. nov. 2006, se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Guttene CHILLERN - Jentene får LÆTTIS (Aften 23. nov. 2006, se nettutgaven, eller hovedsideoppslaget og artikkelen i papirversjonen)
Det er stor forskjell på "han kelneren" og "den kelneren"/"Ikke sant"? (Janne Bondi Johannessen og Jan Svennevig i Lang lunsj i NRK Østlandssendingen 20. nov. 2006. Hør innslaget)
Ikke sant? (Aften 16. nov. 2006, se hovedsideoppslaget og artikkelen i papirversjonen)
Avis:
Forsker på språket i "Big Brother" (Aftenposten 20. september 2001)
Forsker på Big Brother (Uniforum 20. september 2001)
Radio og TV
Om talespråkskorpus, spesielt Big Brother (Kanal24, Rett hjem, 3. nov. 2005. Hør innslaget )
Big Brother-korpuset (NRK1 TV, Typisk norsk, 31. mars 2005. Les omtalen , se sendingen )
Om Big Brother (NRK Petre, Pullover, 1. november 2001)
Om Big Brother NRK P2, Språkteigen , 8. november 2001)
Se under prosjektets hjemmeside her.
Se under prosjektets hjemmeside her.
Kontakt tekstlab-post ved @iln.uio.no for mer informasjon.