Metainformationen zur Seite
Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
de:eaqua:significance [2023-03-03] – angelegt Jens Wittig | de:eaqua:significance [2023-03-30] (aktuell) – [Signifikanzmaße bei der Beurteilung von Kookkurrenzen] Sylvia Kurowsky | ||
---|---|---|---|
Zeile 8: | Zeile 8: | ||
^ Korpus ^ Anzahl Kookkurrenzen^ Kookkurrenzen freq = 1^ in Prozent ^ | ^ Korpus ^ Anzahl Kookkurrenzen^ Kookkurrenzen freq = 1^ in Prozent ^ | ||
- | |BTL ((Bibliotheca Teubneriana Latina, Online-Version, | + | |BTL ((Bibliotheca Teubneriana Latina, Online-Version, |
- | |MPL ((Patrologia Latina Database, CD-ROM Version, November 1995c)) | 580.247.568| | + | |MPL ((Patrologia Latina Database, CD-ROM Version, November 1995c.)) | 580.247.568| |
- | |Perseus Shakespeare ((William Shakespeare in Perseus Digital Library, Renaissance Materials, Stand vom Mai 2013)) | 6.746.602| | + | |Perseus Shakespeare ((William Shakespeare in Perseus Digital Library, Renaissance Materials, Stand vom Mai 2013.)) | 6.746.602| |
- | |TLG ((TLG-E, CD-ROM Version aus dem Jahre 1999)) | 355.021.014| | + | |TLG ((TLG-E, CD-ROM Version aus dem Jahre 1999.)) | 355.021.014| |
Wie aus der kleinen Übersicht zu erkennen ist, sind ein Großteil der gefundenen Kookkurrenzen eher als niedrigfrequent zu bezeichnen. Um daraus die wichtigen zu filtern, sind Berechnungsmethoden erforderlich, | Wie aus der kleinen Übersicht zu erkennen ist, sind ein Großteil der gefundenen Kookkurrenzen eher als niedrigfrequent zu bezeichnen. Um daraus die wichtigen zu filtern, sind Berechnungsmethoden erforderlich, | ||
Zeile 32: | Zeile 32: | ||
|a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | |a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | ||
- | Bei der Bewertung von Kokkurrenzen | + | Bei der Bewertung von Kookkurrenzen |
< | < | ||
- | Aus der oben angeführten Berechnung ergeben sich relativ einfache Bewertungsmaßstäbe. Je frequenter die beiden Begriffe gemeinsam benutzt werden, | + | Aus der oben angeführten Berechnung ergeben sich relativ einfache Bewertungsmaßstäbe. Je frequenter die beiden Begriffe gemeinsam benutzt werden, |
===== Jaccard ===== | ===== Jaccard ===== | ||
Zeile 53: | Zeile 53: | ||
|a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | |a = { §S, Sp, pi, ie, eg, ge, el, l§ }\\ b = { §S, Sp, pa, ar, rg, ge, el, l§ }\\ < | ||
- | Für die Bewertung von Kokkurrenzen | + | Für die Bewertung von Kookkurrenzen |
^ < | ^ < | ||
Zeile 81: | Zeile 81: | ||
===== Log-Likelihood-Maß ===== | ===== Log-Likelihood-Maß ===== | ||
- | Eine der populärsten Signifikanzmaße bei der Analyse großer Textcorpora ist nach //Dunning// (([Dunning 93]. Dunning, T. " | + | Eine der populärsten Signifikanzmaße bei der Analyse großer Textcorpora ist nach //Dunning// (([Dunning 93]. Dunning, T. " |
< | < |