TEST CHÍ KVADRÁT | Nový encyklopedický slovník češtiny

TEST CHÍ KVADRÁT (χ2 test, test k určení signifikance)

▲

►

Základní

▲

►

Rozšiřující

Test užívaný k určení statistické významnosti kvantitativního rozdílu v datech. V ↗korpusové lingvistice se používá zejména pro porovnání ↗frekvencí jednotky ve dvou textech n. korpusech. Principem χ2t. je porovnání frekvence jednotky naměřené v jednom korpusu (observed) s hodnotou očekávanou na základě pravděpodobnosti zjištěné v druhém korpusu (expected). Takovéto porovnání je v základu identifikace ↗klíčových slov. Pokud je rozdíl těchto hodnot velký, je značná pravděpodobnost, že zkoumaný rozdíl není náhodný a vyjadřuje skutečnou odlišnost mezi daty. χ2t. se ukazuje jako nespolehlivý v případě, že zkoumané jednotky nabývají malých frekvencí (menší než 5); z toho důvodu se užívá analogických testů ↗log‑likelihood n. Fischerova exaktního testu. χ2t. přitom neslouží k určení míry odlišnosti (effect size), měří pouze, zda je k dispozici dostatek dat, abychom významnost rozdílu mohli konstatovat s určitou mírou jistoty. V případě, že poměřované hodnoty jsou velmi vysoké (např. v řádu desetitisíců), vycházejí testy téměř vždy jako statisticky signifikantní, ačkoli relativní rozdíl mezi hodnotami není lingvisticky relevantní, uchopitelný n. interpretovatelný.

Literatura

Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
Cvrček, V. & V. Kodýtek. Ke klasifikaci morfologických variant. SaS 74, 2013, 139–145.
Čermák, F. (ed.) Slovník Karla Čapka, 2007.
Gries, S. T. Null-Hypothesis Significance Testing of Word Frequencies: A Follow-up on Kilgarriff. Corpus Linguistics and Linguistic Theory 1, 2005, 277–294.
Kilgariff, A. Language is Never, Ever, Ever, Random. Corpus Linguistics and Linguistic Theory 1–2, 2005, 263–275.
Oakes, M. P. Statistics for Corpus Linguistics, 1998.

Citace

Václav Cvrček (2017): TEST CHÍ KVADRÁT. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/TEST CHÍ KVADRÁT (poslední přístup: 21. 11. 2024)

CzechEncy – Nový encyklopedický slovník češtiny

Provozuje Centrum zpracování přirozeného jazyka

TEST CHÍ KVADRÁT (χ2 test, test k určení signifikance)

Další pojmy: