Tröten statt tweeten: Kommt auf unsere Mastodon-Instanz linguisten.info.
th59kami > 19.04.2020, 17:36:56
thf > 19.04.2020, 18:30:08
th59kami > 19.04.2020, 18:44:25
janwo > 20.04.2020, 06:19:08
lingucat > 20.04.2020, 07:50:25
(19.04.2020, 17:36:56)th59kami schrieb: Guten Abend,
Ich arbeite derzeit mit dem DWDS Kernkorpus 1900-1999 an der Thematik der Diminutivsuffixe -chen und -lein. Nun ist es ja eigentlich so, dass -chen viel produktiver als -lein ist. Bei meinen Suchanfragen "*chen WITH $p=NN" und "*lein WITH $p=NN" ist es jedoch so, dass -lein deutlich produktiver ist, da eigentlich nur passende Diminutive angezeigt werden. Ich bekomme die -chen Anfrage nicht soweit eingegrenzt, dass Tausende Ergebnisse wie "Verbrechen, Jugendlichen, Ostdeutchen...etc" herausfallen. Könnte mir da jemand weiterhelfen? An sich wäre das kein Problem. Sortiere ich die Treffer händisch aus, habe ich nur die Problematik, dass -chen deutlich weniger Diminutive bildet, als -lein. Das Ergebnis ist komplett verfälscht. Als Basis habe ich 500 Einträge ausgewertet. Die Basiszahl ist auch so festgelegt worden. Die Sortierung habe ich auf zufällig gestellt, um ein möglichst breites Trefferfeld zu erzielen.
Für Anregungen zu Suchanfragen wäre ich sehr dankbar.
Vielen Dank :)
Zitat:Ein erster Teilschritt ist es, zu überprüfen, dass -chen produktiver als -lein ist.
Zitat:Mein Ergebnis wäre daher, dass -lein produktiver als -chen ist, was ja nicht stimmt. Deswegen müsste ich irgendwie die Suchabfrage weiter eingrenzen, außer, dass mir Suffixe und nur Substantive angezeigt werden.
blv > 22.04.2020, 09:18:30
(20.04.2020, 06:19:08)janwo schrieb: Sofern möglich (getaggt), könntest Du Plurale herausfiltern, das würdezumindest einige falsche Treffer wie "Menschen" und "Jugendlichen" bei -chen vermeiden. Andere nicht-diminutive Nomina könnte man über die Wortlänge herausfiltern, indem vor dem -chen mehr als 2 Buchstaben stehen müssen, das vermeidet falsche Treffer wie "Rachen", "Kuchen", "Sachen". Wir haben so wenige zweibuchstabige Substantive, die -chen tragen können (mir fällt gerade nur "Ei" ein), dass das nicht ins Gewicht fallen sollte.