• Aucun résultat trouvé

Das luxemburgischsprachige Oeuvre von Michel Rodange (1827-1876). Editionsphilologische und korpuslinguistische Analyse

N/A
N/A
Protected

Academic year: 2021

Partager "Das luxemburgischsprachige Oeuvre von Michel Rodange (1827-1876). Editionsphilologische und korpuslinguistische Analyse"

Copied!
1
0
0

Texte intégral

(1)

Das luxemburgischsprachige Oeuvre von Michel Rodange (1827-1876)

Editionsphilologische und korpuslinguistische Analyse

Texterfassung

I Renert oder de Fuuß am Frack an a Ma‘nsgrëßt, erschienen 1872 in Luxemburg, ca. 40.000 Tokens. Älteste Ausgabe vollständig

eingescannt und erfasst.

I D‘Lëerchen (Dem Leiwäckerche sei Lidd), ca. 5.000 Tokens. Das

Manuskript wurde in der BNL fotografiert und im Rahmen dieses Projekts transkribiert.

I Dem Grow Sigfrid seng Goldkuommer, erschienen 1929 in Luxemburg, ca. 15.000 Tokens. Älteste Ausgabe vollständig eingescannt und erfasst.

Auszug aus der Transkription

Manuskript des Lerchenlieds, 3v

I Mit historisch-kritischen Kommentaren versehen

I Mit früheren Editionen des Werks verglichen

Aus den Ergebnissen wurde eine elektronische Edition erstellt:

TEI-Auszeichnung

<lg type="stanza">

<l>Wäll de Besch mam grengen Hittchen <app>

<rdgGrp>

<rdg><quote>d</quote> in <quote>Hittchen</quote> wurde zum ersten <quote>t</quote>

verbessert</rdg>

<rdg> Atten glaubt, <quote>Hutt</quote> sei zu

<quote>Hittchen</quote>

verbessert</rdg>

</rdgGrp>

</app>

</l> ....

</lg>

EDV-Technologien

I XML bzw. TEI; TUSTEP, Scriptsprache Perl, Reguläre Ausdrücke

I Programmiersprache Java für linguistischen Tools (z.B. POS-Tagger)

I Konvertierung XSLT, X-Path, Ausgabe ist beispielsweise HTML

I Für das Internet-Portal PHP und AJAX

Das Michel-Rodange-Portal

I Alle Ergebnisse dieser Analysen werden dynamisch und verlinkt in einem Online-Portal dargestellt:

POS-Tagging

I Tagger trainieren /

Wahrscheinlichkeiten extrahieren

I Wahrscheinlichkeiten bei der Entscheidung

verwenden

wi = ?

p + p + p + p + p + p Syntaktische

Wortstellung

Morphologische Analyse

Groß- und Kleinschreibung Zahlen/

Buchstaben Satzzeichen

Lexikon POS-Trainer

Syntaktische Wortstellung

Morphologische Analyse

Groß- und Kleinschreibung Manuell

getaggter Text

Syntaktische Wortstellung beim Taggen

I Die Bigramm- und Trigramm-

Wahrscheinlichkeiten besagen, mit welcher

Wahrscheinlichkeit eine

Wortklasse auf eine andere folgt.

I Die 5 höchsten Bigramm- Wahrscheinlichkeiten:

INFTO VERB 1,0 DET NOUN 0,81 PREPA NOUN 0,76 NUM NOUN 0,66 VERBZ PUNC 0,62

tn-2

wn-2 wn-1 tn-1 wn tn wn+1 tn+1 wn+2 tn+2

Bigramm

Trigramm

Algorithmen in der phraseologischen Analyse

I Feste Wortverbindungen können mit statistischen Verfahren

automatisch extrahiert werden, z.B. Chi-Quadrat-Test, Fischers Exakter Test, t-Test, z-Test, etc. Viele dieser Tests basieren auf der Annahme, dass die sprachlichen Zeichen nicht gleich verteilt sind:

0 100 200 300 400 500 600 700 800 900 1000

0 1000 2000 3000 4000 5000 6000

Häufigkeiten

Anzahl der Zeichenkettentypes

Häufigkeitsverteilung im RENERT

I Chi-Quadrat-Test: χ2 = Pn

i=1

(OiEi)2 Ei

I Fishers Extakter Test: ϕ(a) = (a+b)!(c+d)!(a+c)!(b+d)!

n!a!b!c!d!

Kulturhistorische Implikationen

Viele der automatisch extrahierten

Phraseologismen aus dem RENERT sind auch in anderen Bereichen von Kunst

und Kultur zu finden:

(6, 489)*Fuuss, o falsche Judas?

(6, 490)Sou rifft mat haarder Stëmm (6, 491)Voll Rei a Leed de Kinnek,

(6, 492)O hätt ech dech erëm!

(13, 617)Jo, d’Steng an d’Wolke ruffen:

(13, 618)Kuckt dee mam roude Baart, (13, 619)Ma kuckt deem falsche Judas (13, 620)Dajch endlech nun an d’ Kaart!

*Die erste Zahl in Klammern verweist auf die Gesangsnummer, während die zweite Zahl die Versnummer innerhalb der einzelnen Gesänge darstellt.

*Die Abbildung: Der Kuss des Judas Ischariot; 12. Jahrhundert, unbekannter Künstler; heutiger Standort: Uffizien, Florenz

Dipl.-Math. Martin Sievers

sievers@uni-trier.de +49 651 201-3017

Fachbereich II Universitätsring 15 54286 Trier www.kompetenzzentrum.uni-trier.de

Joshgun Sirajzade, Betreuung Frau Prof. Dr. Claudine Moulin. Universitätsring 15, D-54286 Trier, email: sirajzad@uni-trier.de

Références

Documents relatifs

Hiermit sollte deutlich geworden sein, dass angesichts dieser dritten möglichen Gewichtung eine bereits zu Anfang dieser Untersuchung gemachte Feststellung (siehe

Vergleicht man die Teilnehmer der Quality of Work In- dex Luxembourg Umfrage mit anderen europäischen Arbeitnehmern, zeigen die Teilnehmer aus Luxemburg im Durchschnitt ein

Die Koppelung der, an der Nachfrage orientierten Dienstleistung der Kleinkindbetreuung mit dem wachsen- den Anspruch der Bildungsförderung von Kindern (der Shift von einem

Zum anderen wird deutlich, dass die Grenzgänger weitgehend das in Luxemburg ange- strebte Bild einer pluralen und offenen Gesellschaft stützen (sollen),

Auch Arbeitnehmer mit einer Betriebs- zugehörigkeit von über 20 Jahren weisen über alle drei Erhebungsjahre eine unterdurchschnittliche Burnout- prävalenz auf.. Entwicklung

Ausgehend vom Gedanken einer echten und wahren Volksgemeinschaft wird nun der Stillhaltekommissar alle Vereine, Verbände und Organisationen nach nationalsozialistischen

Mehr als die Hälfte der Kinder und Jugendlichen erfüllen die Empfehlung der WHO von täglich mindestens 60 Minu- ten körperlicher Aktivität nicht.. • Negativer Alterseffekt: Je

[r]