ŘETĚZEC

Základní

V korpusové lingvistice posloupnost nějakých jaz. jednotek, nejběžněji znaků, ale i slov apod. Ř. je typicky posloupnost diskrétních znaků, tj. „od mezery k mezeře“: písmen, číslic či jiných symbolů, obvykle krátká (cca max. 25 znaků). Ř. tedy neobsahuje mezery a obvykle neobsahuje zároveň písmena/číslice a interpunkční znaménka; v tomto případě jej lze ztotožnit s ortografickým slovem: ↗tokenem. Ř. znaků se vymezuje ↗tokenizérem.

Rozšiřující
Literatura
Citace
Vladimír Petkevič (2017): ŘETĚZEC. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/ŘETĚZEC (poslední přístup: 21. 11. 2024)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka