PRECISION & RECALL

Základní

Pojmy původně převzaté z informatiky; je možné je přeložit jako přesnost (p.) a výtěžnost (r.) pokrytí zkoumaných dat daným přístupem. Využívají se zejména při hodnocení úspěšnosti automatických nástrojů na analýzu textu (např. ↗taggerů). Míra precision je definována jako procentuální poměr relevantních výsledků analýzy ke všem výsledkům analýzou získaným, zatímco recall je poměr relevantních výsledků analýzy ke všem relevantním výsledkům ve zkoumaném vzorku bez ohledu na to, zda byly analýzou identifikovány. Pokud bychom se např. snažili v korpusu vyhledat všechny výskyty slov patřících k paradigmatu stavení pouze pomocí dotazu, který nachází tvary končící na ‑í, bez jakékoliv další specifikace, byla by míra p. snížena (z maximálních 100 %) tím, že by se ve výsledku objevovaly i formy z jiných paradigmat (paní, mladí, trpí apod.), míra r. by byla nižší (než maximálních 100 %) v důsledku absence tvarů stavením, náměstími apod., které dotaz nepodchytil, avšak do výsledku měly být podle zadání započítány.

Rozšiřující
Literatura
  • Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
Citace
Václav Cvrček (2017): PRECISION & RECALL. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/PRECISION & RECALL (poslední přístup: 23. 11. 2024)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka