German Normalization

(in German)

Grundlegendes

  • Orthografische Normalisierung
  • Syntax bleibt
  • Grammatik wird nicht verändert, d.h. z.B. keine Normalisierung von Genus- und Deklination: "schön guten tag", "mit ein hund", "so ein klein hund"
  • Abbrüche und Pausen werden gelöscht und bekommen ein leeres Event (auf language-Ebene wird der Wert für Abbrüche und Pausen gelöscht --> leeres Event); AUSNAHME bei wortinternen Abbrüchen (dipl: vorbeige$le$ rollt, norm: vobeigerollt)
  • Wiederholungen bleiben
  • spoken: non-verbales Material, wie [laughing], wird nicht übernommen --> leeres Event
  • Satzzeichen werden nicht hinzugefügt

Hesitation marker / Gefüllte Pausen

  • Hesitation marker werden einheitlich zu „äh“ normalisiert, darunter fallen äh, ähm, öh, hm etc.
dipl norm
äh, öh, ähm, hm etc. äh

Keine lexikalischen Änderungen

  • bei eindeutig gleichbleibender Bedeutung, einen Standard festlegen und dokumentieren, wie:
dipl norm
aufgrund, auf Grund aufgrund
andren,anderen anderen
Dicker, Digger Dicker (29.05.2019)
etwas, was etwas
grad, grade, gerade gerade
gern, gerne gerne
habe, hab habe
hey, hi, hei(als Begrüßung, nicht als Ausruf) hi
langlaufen entlanglaufen
mache , mach (Imperativ) mach
nichts, nix nichts
noch mal, nochmal nochmal (28.05.2019)
rumspielen herumspielen
rum herum
runterfallen herunterfallen
sodass, so dass (wenn Konjunktion) sodass
vorn, vorne vorne
  • bei möglicher Bedeutungsänderung bzw. Kontextrestriktionen, Lexeme so belassen, Varianten bleiben:
    • daran, dran
    • darin, drin, drinnen
    • drauf, darauf
    • sone (wie "sone autos", also nur bei Substantiv im Plural), solche
    • reinfahren, hereinfahren, hineinfahren
    • auffahren, rauffahren, drauffahren
    • reinpacken, einpacken, hineinpacken

Foreign Language Material (FM) und translinguale Elemente

  • FM mit deutscher Flexion, z.B.:
dipl norm lang
gecrasht gecrasht eng/deu
  • im Duden aufgenommenes Material, wie sorry, Van etc. werden auf language-Ebene als deu markiert

Zahlen...

  • bis zwölf werden ausgeschrieben
  • ab 13 werden als Ziffern geschrieben
  • in den schriftlichen Texten, Variante beibehalten, die der/die Proband*in gewählt hat

Einzelentscheidungen

dipl norm
pekawe PKW
ef sechzehn F16
  • 'nen' zu 'ein' normalisieren in Fällen von Nominativ Maskulin und Nom./Akk. Neutrum, z. B.:

    • dipl: "da is nen auto um die ecke gebogen". norm: "da ist ein auto..."
    • dipl: "ich hab nen auto gesehen". norm: "ich habe ein auto..."

    ABER nicht in: dipl: "nen ne vollbremsung" zu norm: "einen eine vollbremsung"

  • so=n entweder zu "so ein" oder zu "so einen" je nach Kontext:

    • dipl: "so=n typ hat mitm ball...". norm: "so ein Typ hat mitm Ball"
    • dipl: "die frau hat so=n hund dabei". norm: "die Frau hat so einen Hund dabei"

    ABER:

    • dipl: "sie hatte so ein hund dabei" bleibt auf norm: "sie hatte so ein Hund dabei"
  • gender gap

    • dipl: Fußgänger innen; norm: Fußgänger_innen

Language Values

dipl norm
deu deutsch
eng englisch
ara arabisch
tur türkisch
spa spanisch

Schriftliche Texte

  • CU-Ebene hinzufügen
  • Satzzeichen:

    • Keine einfügen, nicht korrigieren, außer bei fehlendem Leerzeichen:
    dipl norm
    eingepackt.auf eingepackt / . / auf
    • mehrere Satzzeichen hintereinander ohne Leerzeichen, z.B. drei Punkte: … in einem Event lassen
    dipl norm
    ... / ... /
    • wenn Leerzeichen dazwischen, dann auch so lassen, z.B. . /. / .
    dipl norm
    . . . /. / . / . /
  • Emojis

    • Emojis wie :) und Acronyme wie lol werden auf norm übernommen und in einem Segement belassen