TEST CHÍ KVADRÁT (χ2 test, test k určení signifikance)
Test užívaný k určení statistické významnosti kvantitativního rozdílu v datech. V ↗korpusové lingvistice se používá zejména pro porovnání ↗frekvencí jednotky ve dvou textech n. korpusech. Principem χ2t. je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Takovéto porovnání je v základu identifikace ↗klíčových slov. Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, že zkoumaný rozdíl není náhodný a vyjadřuje skutečnou odlišnost mezi daty. χ2t. se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů ↗log‑likelihood n. Fischerova exaktního testu. χ2t. přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), vycházejí testy téměř vždy jako statisticky signifikantní, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní, uchopitelný n. interpretovatelný.
- Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
- Cvrček, V. & V. Kodýtek. Ke klasifikaci morfologických variant. SaS 74, 2013, 139–145.
- Čermák, F. (ed.) Slovník Karla Čapka, 2007.
- Gries, S. T. Null-Hypothesis Significance Testing of Word Frequencies: A Follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1, 2005, 277–294.
- Kilgariff, A. Language is Never, Ever, Ever, Random. Corpus Linguistics and Linguistic Theory 1–2, 2005, 263–275.
- Oakes, M. P. Statistics for Corpus Linguistics, 1998.
URL: https://www.czechency.org/slovnik/TEST CHÍ KVADRÁT (poslední přístup: 21. 11. 2024)
Další pojmy:
korpusová lingvistikaCzechEncy – Nový encyklopedický slovník češtiny
Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020
Provozuje Centrum zpracování přirozeného jazyka