German Normalization
(in German)
Grundlegendes
- Orthografische Normalisierung
- Syntax bleibt
- Grammatik wird nicht verändert, d.h. z.B. keine Normalisierung von Genus- und Deklination: "schön guten tag", "mit ein hund", "so ein klein hund"
- Abbrüche und Pausen werden gelöscht und bekommen ein leeres Event (auf language-Ebene wird der Wert für Abbrüche und Pausen gelöscht --> leeres Event); AUSNAHME bei wortinternen Abbrüchen (dipl: vorbeige$le$ rollt, norm: vobeigerollt)
- Wiederholungen bleiben
- spoken: non-verbales Material, wie [laughing], wird nicht übernommen --> leeres Event
- Satzzeichen werden nicht hinzugefügt
Hesitation marker / Gefüllte Pausen
- Hesitation marker werden einheitlich zu „äh“ normalisiert, darunter fallen äh, ähm, öh, hm etc.
dipl | norm |
---|---|
äh, öh, ähm, hm etc. | äh |
Keine lexikalischen Änderungen
- bei eindeutig gleichbleibender Bedeutung, einen Standard festlegen und dokumentieren, wie:
dipl | norm |
---|---|
aufgrund, auf Grund | aufgrund |
andren,anderen | anderen |
Dicker, Digger | Dicker (29.05.2019) |
etwas, was | etwas |
grad, grade, gerade | gerade |
gern, gerne | gerne |
habe, hab | habe |
hey, hi, hei(als Begrüßung, nicht als Ausruf) | hi |
langlaufen | entlanglaufen |
mache , mach (Imperativ) | mach |
nichts, nix | nichts |
noch mal, nochmal | nochmal (28.05.2019) |
rumspielen | herumspielen |
rum | herum |
runterfallen | herunterfallen |
sodass, so dass (wenn Konjunktion) | sodass |
vorn, vorne | vorne |
- bei möglicher Bedeutungsänderung bzw. Kontextrestriktionen, Lexeme so belassen, Varianten bleiben:
- daran, dran
- darin, drin, drinnen
- drauf, darauf
- sone (wie "sone autos", also nur bei Substantiv im Plural), solche
- reinfahren, hereinfahren, hineinfahren
- auffahren, rauffahren, drauffahren
- reinpacken, einpacken, hineinpacken
Foreign Language Material (FM) und translinguale Elemente
- FM mit deutscher Flexion, z.B.:
dipl | norm | lang |
---|---|---|
gecrasht | gecrasht | eng/deu |
- im Duden aufgenommenes Material, wie sorry, Van etc. werden auf language-Ebene als deu markiert
Zahlen...
- bis zwölf werden ausgeschrieben
- ab 13 werden als Ziffern geschrieben
- in den schriftlichen Texten, Variante beibehalten, die der/die Proband*in gewählt hat
Einzelentscheidungen
dipl | norm |
---|---|
pekawe | PKW |
ef sechzehn | F16 |
-
'nen' zu 'ein' normalisieren in Fällen von Nominativ Maskulin und Nom./Akk. Neutrum, z. B.:
- dipl: "da is nen auto um die ecke gebogen". norm: "da ist ein auto..."
- dipl: "ich hab nen auto gesehen". norm: "ich habe ein auto..."
ABER nicht in: dipl: "nen ne vollbremsung" zu norm: "einen eine vollbremsung"
-
so=n entweder zu "so ein" oder zu "so einen" je nach Kontext:
- dipl: "so=n typ hat mitm ball...". norm: "so ein Typ hat mitm Ball"
- dipl: "die frau hat so=n hund dabei". norm: "die Frau hat so einen Hund dabei"
ABER:
- dipl: "sie hatte so ein hund dabei" bleibt auf norm: "sie hatte so ein Hund dabei"
-
gender gap
- dipl: Fußgänger innen; norm: Fußgänger_innen
Language Values
dipl | norm |
---|---|
deu | deutsch |
eng | englisch |
ara | arabisch |
tur | türkisch |
spa | spanisch |
Schriftliche Texte
- CU-Ebene hinzufügen
-
Satzzeichen:
- Keine einfügen, nicht korrigieren, außer bei fehlendem Leerzeichen:
dipl norm eingepackt.auf eingepackt / . / auf - mehrere Satzzeichen hintereinander ohne Leerzeichen, z.B. drei Punkte: … in einem Event lassen
dipl norm ... / ... / - wenn Leerzeichen dazwischen, dann auch so lassen, z.B. . /. / .
dipl norm . . . /. / . / . / -
Emojis
- Emojis wie :) und Acronyme wie lol werden auf norm übernommen und in einem Segement belassen