Transkripsjonsveiledning
- Skrevet av Janne Bondi Johannesen. I stor grad bygd på
Transkripsjonsveiledningen til Gjert Kristoffersen og Ann-Kristin Molde, UiB, og
har elementer fra transkripsjonssystemet til Du Bois et al, University of
California, Santa Barbara.
- Oppdatert oktober 2001 av Pål Kristian Eriksen
- Oppdatert mars 2002 av Lars Nygaard
- Oppdatert august 2002 av Lars Nygaard
1. Introduksjon
1.1 Formålet med et talemålskorpus
For at man skal kunne forske på norsk språk, er det viktig
å ha et godt datagrunnlag. Det er upraktisk og tidkrevende å lage
spørreskjemaer og andre typer undersøkelser hver gang man er
interessert i å finne ut noe bestemt om et særtrekk ved
språket. Derfor er det en utpreget fordel å ha store datamengder
lagret elektronisk, slik at de lett kan søkes i - såkalte
tekstkorpus. For slike korpus har vi i dag gode søkesystemer og gode
systemer for grammatisk merking (tagging). Vi har også
skriftspråkskorpus av en viss størrelse, men for talemål har
vi knapt noe. Skal man studere lydlige forhold, er selvsagt et
talemålskorpus det eneste som nytter, men det er grunn til å tro at
talespråket ofte skiller seg fra skriftspråket også på
andre plan. Vi ønsker derfor å lage et talespråkskorpus for
ikke bare lydlig (fonetisk-fonologisk) analyse, men også for morfologisk,
syntaktisk og leksikalsk analyse. Dessuten vil vi at det skal være mulig
å studere språklig samhandling (dialog) gjennom korpuset (se f.eks.
Svennevig, Sandvik og Vagle 1995). Av sistnevnte grunn tar vi med flere
utenom-språklige opplysinger enn Kristoffersen og Molde har gjort - vi
inkluderer en del informasjon i tråd med Santa Barbara-transkripsjonen,
som er velkjent og mye brukt internasjonalt.
I første rekke vil talespråkskorpuset kun inneholde
BigBrother-opptak, men vi håper å utvide repertoaret senere, med
opptak fra naturlige situasjoner, og med flere variabler representert, som
alder, utdannelse, status og geografisk tilhørighet.
1.2. Hvorfor transkripsjon?
Hensikten med å transkribere innspilt og digitalisert tale er at
transkripsjonen i neste omgang kan danne grunnlaget for å lage et raskt og
effektivt søkeverktøy som kan identifisere alle eller en vesentlig
del av de passasjer i lydmaterialet som inneholder realisasjoner av ett eller
flere fonologiske, morfologiske, leksikalske, syntaktiske eller pragmatiske
trekk som en ønsker å granske. Den transkriberte teksten vil derved
få to funksjoner. Det vil inneholde opplysninger om strukturen i det
innspilte materialet, og den vil gjøre det mulig å søke i
materialet.
Formålet med transkripsjonen er med andre ord å skape en
struktur som består av to sammenkoblete elementer: et
talemålsmateriale i form av en innspilling (på lydband eller
digitalisert) og en søkbar tekst i form av en transkripsjon av denne
innspillingen.
Transkripsjonene må inneholde tilstrekkelig fonologisk og morfologisk
informasjon til at en raskt og effektivt kan identifisere alle passasjer i
lydmaterialet som inneholder realisasjoner av det trekket en ønsker
å granske.
1.3. Ortografisk transkripsjon
Når en har villet overføre innspilt tale til skrift for
å gjøre den mer tilgjengelig for vitenskapelig analyse, har det
vært vanlig å bruke fonetisk transkripsjon. I forhold til analyse av
fonologiske og morfologiske fenomener i teksten, har dette imidlertid klare
begrensninger. I tillegg til at fonetisk og fonemisk transkripsjon er
tidkrevende, og derved kostbar, er det ikke mulig å lese ut grammatisk
informasjon av den, og det er i tillegg en del fonologisk informasjon som kan
gå tapt. Transkripsjonen av materialet skal derfor være ortografisk.
En ortografisk tekst kan for det første gjøres til gjenstand for
automatisk, morfologisk analyse, såkalt tagging. I tillegg kan svært
mye segmentalfonologisk struktur avledes fra en ortografisk representasjon. Men
for at en i forskningsøyemed skal få maksimalt utbytte av
transkripsjonene, må det da legges en del tilleggsbegrensninger på
dem som normalt ikke gjelder i vanlig ortografi. Transkripsjonene vil derfor
skille seg fra vanlige tekster på enkelte punkter.
Det er disse spesifikasjonene som vi har forsøkt å legge inn i
reglene. Det vil likevel sikkert oppstå situasjoner der den som
transkriberer vil ha behov for å avvike noe fra reglene, eller legge inn
tilleggskonvensjoner. Men skal transkripsjonene få maksimal nytte,
bør avvik bare gjøres når det føles strengt
nødvendig, og de må aldri gjøres på en måte som
gjør at det som da vil skille transkripsjonene fra andre transkripsjoner,
ikke lar seg identifisere ved enkle, automatiske søk i teksten.
En ortografisk transkripsjon kan ses på som en middelvei mellom en
fonetisk transkripsjon og en oversettelse av et innhold fra tale til skrift.
Mens fonetikerens oppgave er å skrive ned de lydene han/ hun faktisk
hører uavhengig av hvordan de fungerer som en del av språksystemet,
og hvilken betydning de har, så vil en oversettelse styres av innholdet.
Når innholdet i en talt tekst skal omformes til en skrevet tekst, kan
forskjellen mellom den muntlige teksten som ligger til grunn for oversettelsen,
og en opplesning av den skrevne teksten som er resultatet av oversettelsen, bli
stor dersom både kravet til rett gjengivelse av innholdet og kravet om
formell språkriktighet skal overholdes.
Den type transkripsjon det her dreier seg om, er verken en fonetisk
transkripsjon eller en omformulering av informantens talemål til en typisk
skriftmålsstil. Transkripsjonen skal gjengi informantens tale så
godt det lar seg gjøre innenfor det skriftnormalen tillater. Den skal med
andre ord være et best mulig kompromiss mellom krav om nøyaktig
gjengivelse av det talte, og skriftmålets normer.
2. Reglene
2.1 Om disse reglene
For at det skal kunne fungere som et slikt søkeredskap, må de
som skal bruke det, kunne være sikre på at teksten tilfredsstiller
bestemte spesifikasjoner, som er de samme fra tekst til tekst. Enda viktigere
blir dette dersom tekster transkribert av ulike personer skal bygges sammen til
større korpus.
2.2 Utvalg:
Følgende skal ikke med:
- monologer deltakerne har i "BigBrother"-rommet
- Live-sendingene der deltakerne snakker med programlederen
- scener hvor det er så mye lyd , for eksempel musikk, sang, alle
skravler samtidig, at det nesten er umulig å høre hva
enkeltpersoner sier.
- scener der det ikke er noen dialog, kun enkeltord/utbrudd (for eksempel
ballspill).
2.3 Markering av ekstrainformasjon:
All slags ekstrainformasjon som skal angis i tekstene, må gis i
spissklammer. Tre typer informasjon skal gis angis med spissklammer:
1) informasjon om mer enn ett ord: <utenlandsk> We are the
world </utenlandsk> (=det som omsluttes av klammene,
inneholder et utenlandsk uttrykk)
2) informasjon om ett enkelt ord, eller som utgjør en selvstendig
informasjonsenhet uavhengig av ord: Yes <utenlandsk>.
3) Informasjon som står uavhengig av ord: <lyd:
hoster> (=lyden av hosting).
Det skal alltid være mellomrom før og etter
spissparentesene.
Det er ikke meningen at teksten skal ikke leses alene (altså uten lyd og bilde), så
det er ikke nødvendig å ta med "teateraktig" tekst ("snur seg", "går ut", "i stuen"
og så videre).
2.4 Språkform
Transkripsjonen skal gjengi informantens tale så godt det lar seg
gjøre innenfor det skriftnormalen tillater. Den skal med andre ord
være et best mulig kompromiss mellom krav om nøyaktig gjengivelse
av det talte, og skriftmålets normer.
Dersom et system som det som presenteres nedenfor overhodet skal ha noen
hensikt, må reglene følges, selv om resultatet i enkelte tilfeller
skulle stride mot språkfølelse eller det du ellers har lært
om hvordan en tekst skal utformes. Husk at resultatet ikke først og
fremst skal bli en mest mulig lesbar tekst, men et teknisk søkeredskap i
forhold til de digitaliserte innspillingene de er transkripsjoner av.
Man overser instinktivt gjentagelser og grammatisk inkonsekvens i tale, og det
krever litt trening å "undertrykke" den impulsen og høre hva informantene
faktisk sier.
2.4.1 Norm: Ortografi
Vi skal transkribere med bokmål, og følge Bokmålsordboka
(http://www.dokpro.uio.no/ordboksoek.html), med hensyn til både
hovedformer og sideformer. Det er altså ikke lov til å skrive "sne",
men det er lov å skrive "mjølken", "åssen" og "trur"). Velg
alltid den formen som ligger tettest opp til det originalt uttalte ordet,
brukfor eksempel a-endelser der det sies.
Når et ord er avbrutt, skal de delene som er uttalt allikevel gjengis
i ortografi. Da markerer du det ved hjelp av en bindestrek (-), som skrives uten
mellomrom rett etter den siste bokstaven, for eksempel han viss- eller
han s-. Det avbrutte ordet skal ikke skrives mer ortofont enn det ville
blitt skrevet dersom det ikke hadde blitt avbrutt. Du skal derfor ikke skrive
vo-, vo-, hvordan, men hvo-, hvo-, hvordan.
Følg ellers vanlig konvensjoner for norsk. For eksempel skrives tall
til og med ti med bokstaver, fra og med 11, med tall.
2.4.2 Norm: Syntaks
De syntaktiske reglene for bokmål tas ikke hensyn til. Ordene skal
skrives ned i den orden de blir uttalt:
Ramsy: Hva du sa, jeg skulle skylle ferdig før du pussa
det?
2.4.3 Norm: Tegnsetting
Spørsmålstegn og utropstegn brukes som vanlig, semikolon og kolon brukes ikke.
Komma og punktum brukes for å markere pause, der det er grammatisk mulig. Ellers brukes -taggen for å markere opphold (jfr. 2.5.3).
Altså: Monica: Jeg, jeg <pause> tok meg en bolle.
Man følger ikke kommareglene. For eksempel skal det bare være komma foran men hvis det er en pause der.
Et annet eksempel: hvis det ikke er noen pauser skriver vi Ja nei ikke jeg , selv om det i skriftspråk skulle stått "Ja, nei, ikke jeg. "
Tegnsetting er ofte svært vanskelig å avgjøre. Man kan trøste seg med at det ikke er det
aller viktigste.
2.4.4 Markering av normbrudd: dialekt
Vi er også interessert i uttale, ordbruk og ordvalg som avviker fra
ordboksnormalen. Disse avvikene vil vi gjerne ha med, og da i spiss-klammer
etter ordet i sin vanlige ortografiske form. For å eksemplifisere:
Dersom en deltager bruker et ord som oppafør i stedenfor
ovenfor:
Randi: Jeg skulle dra til huset ovenfor <variant: oppafør>
veien, for å hente avisa, da jeg så noen kjekke gutter <variant:
guttær> nedpå veien.
Dersom flere ord til sammen har en unormert variant, og det er velkjent
hvilke ord dette er, er det greit å bare avmerke det etter siste ord. For
eksempel:
Per: Nei da, det har ikke <variant: hakke> noe å si.
Unntak:
- Systematiske avvik mellom tale og : at "jeg" uttales "jei",
- systematiske normavvik: for eksempel at noen av deltakerne ikke
bruker "kj"-lyden (sier "sjærlihet" "sjole" osv.)
- For Anne Mona og Ramsy skal vi ikke nedtegne avvik fra normen, siden
deres dialekter avviker kraftig fra begge de norske målformene. Deres
replikker skal kun gjengis med de bokmålsformene som ligger tettest opp
til det originalt sagte. Men særegne leksemer skal gjengis direkte med
skrift, men skal markeres med den påfølgende spissklammekoden
<dialekt>. (For eksempel når Anne Mona bruker adjektivet
"nøden").
2.4.5 Markering av normbrudd: utenlandsk
Dersom det utenlandske uttrykket derimot er brukt i en ellers norsk dialog
som et alternativ til norsk tale, skal ordet eller uttrykket avmerkes
slik:
Randi: Yes <utenlandsk>. Dette er <utenlandsk> just
bullshit </utenlandsk>.
Markeres ikke som utenlandsk:
- terminologi: Utenlandske uttrykk som betegner en term (slik som
musikkgenre): PM: Kan noen sette på litt hip hop?
- titler: merkes vi i anførselstegn: Randi: Jeg elsker "Blow
with the whistle".
2.5. Annen informasjon
2.5.1 Overlappende passasjer:
Når to av talerne snakker i munnen på hverandre, skal de
overlappende passasjene markeres med firkantklammer, som igjen omsluttes av
spissklammer (se eksemplene nedenfor). Dersom en annen person bekrefter med et
kort, overlappende "ja" eller lignende, mens den første taleren
fortsetter å snakke, skal alt den første taleren sier, stå i
samme replikk:
Anne: Har dere sett noen gode filmer i det siste?
Randi: Nei, jeg har ikke det. Jo, jeg så da en film på
lørdag, hva var det <[> ... <]1> den het? Ja, Grease,
ja.
Anne: <[> Grease. <]1>
Spissklammene alltid settes med mellomrom rundt. Sekvenser indekseres,
sånn at flere overlappinger er mulig.
Overlappende kommentarer kan forekomme både i en pause hos den
første taleren, og samtidig med med ord og uttrykk hos den
første taleren. Uansett markeres det bare stedet den overlappende
kommentaren begynner.
2.5.2 Lyder
Ikke-språklige lyder som latter, hosting og lignende som er
del av en ytring, skal være med i transkripsjonen. Et ukontrollert host
skal altså ikke være med, men et host som markerer uenighet skal
med. Ta også med bekreftende "mm", sprørrende "hm?" og de
nølende "eh"- og "øh"-lydene.
Lyder skal spesifiseres spesielt i spissklammer: <lyd: hoster>,
<lyd: gjesper>, <lyd: gledesskrik>, etc..
Ikke-språklige lyder som går sammen med en replikk
(f.eks. lattermild stemme, gjespende stemme, etc., skal markeres i omsluttende
spissklammer:
Jens: <gjespende stemme> Syns ikke jeg. </gjespende
stemme>
Latter markeres med alfakrøller. Som en tommelfingerregel
skal antallet alfakrøller gjenspeile styrke og lengde på latteren -
jo flere, jo sterkere og lengre.
Randi: @@@ Du verden, for en spilloppmaker han er!
AM: <@> Hver jævla gang. Herregud!
</@>
2.5.3 Pauser:
Pauser markeres med <pause>.
LJ: Har du har du drukket <variant: drikki> opp all
rødspriten min?
<pause> betyr forskjellig lengde om det er inne i en setning, mellom setninger eller mellom replikker.
2.5.4. Trykk:
Trykk markeres bare der det har en kontrastiv og/eller emfatisk funksjon. Vanlig setningstrykk markeres
altså ikke.
Det gjøres med spissklammekoden <emfase> etter ordet:
Roy: Jammen, han er <emfase> gæren!
2.5.5 Sitater:
Sitater settes i anførselstegn. Dette gjelder også hypotetiske
sitater:
Anne: Da kjørte jeg den: "Jeg? Hæ?" Da juger
jeg.
2.5.6 Avbrutte setninger
Dersom en setning er avbrutt, og en annen taler overtar, for eksempel ved
avbrytelse o.a., skal den avbrutte setninga avsluttes med tre punktum:
Rodney: Hold den kniven vekk fra...
LJ: Der fikk du den!
Men hvis en setning avbrytes, og samme taler fortsetter ved hjelp av en
annen setning, skal de to setningene bare atskilles av et komma (så fremt
det ikke er en merkbar pause mellom dem (se avsnittet om pauser)).
Anette: Du har drept, du har, du har drept ham!
Stor bokstav brukes på begynnelsen av hver replikk, selv om den innholdsmessig
er en fortsettelse på en tidligere setning som ble avbrutt.
2.5.7 Passasjer som er vanskelige å forstå
Uforståelig: Skulle det, etter at du har lyttet både
fonetisk (utfra hvilke lyder som er der), morfologisk (utfra hvilke ord det kan
være), syntaktisk (utfra hvilke ord og former man kan forvente utfra
syntaksen) og pragmatisk (hva det er sannsynlig at informanten kan ha sagt i den
aktuelle situasjonen), fremdeles være lydkombinasjoner som du ikke klarer
å forstå, markerer du området slik i transkripsjonen:
<uforståelig>
Rodney: Men takk for at du <uforståelig>.
Uklart: Skulle det være passasjer som du tror du
forstår, men som du ikke er sikker på, setter du <uklart>
foran og </uklart> etter, for eksempel:
Randi: Han sa at <uklart> han visste </uklart> at de skulle
komme.
Er du usikker på hvem det er som snakker, setter du et
spørsmål etter navnet:
Randi?: Hei!
2.5.8 Replikkgrenser
Det er ikke alltid innlysende hvordan man skal dele inn i replikker. Det er ikke nødvendigvis *en* replikk bare fordi ingen snakker i mellomtiden, men det er ikke nødvendig å snakke om det samme, heller. Man må bruke språkfølelsen sin, og føle seg fram til hvem sin tur det er til å snakke.
3. Referanser
Du Bois, John, Stephan Schuetze-Coburn, Susanna Cumming, and
Danae Paolino. 1993. Discourse Transcription. Santa Barbara
Working papers in Linguistics, Vol. 4.
Kristoffersen, Gjert og Ann-Kristin Molde. Norsk Talemålskorpus:
Transkripsjonsveiledning. (http://gandalf.hit.uib.no/vol/ntk/Transkripsjonsveiledning.htm)
Svennevig, Jan, Margareth Sandvik & Wenche Vagle. 1995.
Tilnærminger til tekst. Modeller for språklig
tekstanalyse. Oslo: LNU/Cappelen Akademisk Forlag.
Bokmålsordboka og Nynorskordboka.
(http://www.dokpro.uio.no/ordboksoek.html)