German Normalization
(in German)
Grundlegendes
- Orthografische Normalisierung
- Syntax bleibt
- Grammatik wird nicht verändert, d.h. z.B. keine Normalisierung von Genus- und Deklination: "schön guten tag", "mit ein hund", "so ein klein hund"
- Abbrüche und Pausen werden gelöscht und bekommen ein leeres Event (auf language-Ebene wird der Wert für Abbrüche und Pausen gelöscht --> leeres Event); AUSNAHME bei wortinternen Abbrüchen (dipl: vorbeige$le$ rollt, norm: vobeigerollt)
- Wiederholungen bleiben
- spoken: non-verbales Material, wie [laughing], wird nicht übernommen --> leeres Event
- Satzzeichen werden nicht hinzugefügt
Hesitation marker / Gefüllte Pausen
- Hesitation marker werden einheitlich zu „äh“ normalisiert, darunter fallen äh, ähm, öh, hm etc.
| dipl | norm |
|---|---|
| äh, öh, ähm, hm etc. | äh |
Keine lexikalischen Änderungen
- bei eindeutig gleichbleibender Bedeutung, einen Standard festlegen und dokumentieren, wie:
| dipl | norm |
|---|---|
| aufgrund, auf Grund | aufgrund |
| andren,anderen | anderen |
| Dicker, Digger | Dicker (29.05.2019) |
| etwas, was | etwas |
| grad, grade, gerade | gerade |
| gern, gerne | gerne |
| habe, hab | habe |
| hey, hi, hei(als Begrüßung, nicht als Ausruf) | hi |
| langlaufen | entlanglaufen |
| mache , mach (Imperativ) | mach |
| nichts, nix | nichts |
| noch mal, nochmal | nochmal (28.05.2019) |
| rumspielen | herumspielen |
| rum | herum |
| runterfallen | herunterfallen |
| sodass, so dass (wenn Konjunktion) | sodass |
| vorn, vorne | vorne |
- bei möglicher Bedeutungsänderung bzw. Kontextrestriktionen, Lexeme so belassen, Varianten bleiben:
- daran, dran
- darin, drin, drinnen
- drauf, darauf
- sone (wie "sone autos", also nur bei Substantiv im Plural), solche
- reinfahren, hereinfahren, hineinfahren
- auffahren, rauffahren, drauffahren
- reinpacken, einpacken, hineinpacken
Foreign Language Material (FM) und translinguale Elemente
- FM mit deutscher Flexion, z.B.:
| dipl | norm | lang |
|---|---|---|
| gecrasht | gecrasht | eng/deu |
- im Duden aufgenommenes Material, wie sorry, Van etc. werden auf language-Ebene als deu markiert
Zahlen...
- bis zwölf werden ausgeschrieben
- ab 13 werden als Ziffern geschrieben
- in den schriftlichen Texten, Variante beibehalten, die der/die Proband*in gewählt hat
Einzelentscheidungen
| dipl | norm |
|---|---|
| pekawe | PKW |
| ef sechzehn | F16 |
-
'nen' zu 'ein' normalisieren in Fällen von Nominativ Maskulin und Nom./Akk. Neutrum, z. B.:
- dipl: "da is nen auto um die ecke gebogen". norm: "da ist ein auto..."
- dipl: "ich hab nen auto gesehen". norm: "ich habe ein auto..."
ABER nicht in: dipl: "nen ne vollbremsung" zu norm: "einen eine vollbremsung"
-
so=n entweder zu "so ein" oder zu "so einen" je nach Kontext:
- dipl: "so=n typ hat mitm ball...". norm: "so ein Typ hat mitm Ball"
- dipl: "die frau hat so=n hund dabei". norm: "die Frau hat so einen Hund dabei"
ABER:
- dipl: "sie hatte so ein hund dabei" bleibt auf norm: "sie hatte so ein Hund dabei"
-
gender gap
- dipl: Fußgänger innen; norm: Fußgänger_innen
Language Values
| dipl | norm |
|---|---|
| deu | deutsch |
| eng | englisch |
| ara | arabisch |
| tur | türkisch |
| spa | spanisch |
Schriftliche Texte
- CU-Ebene hinzufügen
-
Satzzeichen:
- Keine einfügen, nicht korrigieren, außer bei fehlendem Leerzeichen:
dipl norm eingepackt.auf eingepackt / . / auf - mehrere Satzzeichen hintereinander ohne Leerzeichen, z.B. drei Punkte: … in einem Event lassen
dipl norm ... / ... / - wenn Leerzeichen dazwischen, dann auch so lassen, z.B. . /. / .
dipl norm . . . /. / . / . / -
Emojis
- Emojis wie :) und Acronyme wie lol werden auf norm übernommen und in einem Segement belassen