ANONYMIZACE
▲
►
Základní
V korpusové lingvistice odstranění osobních údajů z korpusových dat. Týká se především korpusů mluveného jaz., ve kterých jsou osobní data ze zvukového záznamu odstraněna a v přepise jsou dohodnutým způsobem kódována. Jedná se zejména o příjmení, přezdívky, místní jména, adresy, telefonní čísla apod. Kódování v přepise může být buď formou číselného či písmenného kódu, n. zde může být použito „univerzální“ příjmení, místní jméno apod. Tento druhý způsob je výhodný pro následnou morfologickou analýzu, protože zachovává gramatické kategorie původního jména.
▲
►
Rozšiřující
Literatura
- Viz Mluvený korpus.
Citace
Marie Kopřivová
(2017): ANONYMIZACE.
In: Petr Karlík, Marek Nekula,
Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/ANONYMIZACE (poslední přístup: 21. 11. 2024)
URL: https://www.czechency.org/slovnik/ANONYMIZACE (poslední přístup: 21. 11. 2024)
Další pojmy:
korpusová lingvistikaCzechEncy – Nový encyklopedický slovník češtiny
Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020
Provozuje Centrum zpracování přirozeného jazyka