DOTAZOVACÍ JAZYK

Základní

Jazyk používaný v informatice k dotazování databázových a dalších systémů; každý takový jazyk má zpravidla vlastní přesně definovanou syntax. V korpusové lingvistice se d.j. používají pro zadávání dotazů v korpusových manažerech, konkordančních programech apod. (viz ↗korpusový a lingvistický software). I tady se jednotlivé d.j. většinou liší, přestože typicky vycházejí z regulárních výrazů, které dále rozšiřují a adaptují pro svoje potřeby. Regulární výrazy (pojem pochází z teorie formálních jaz., jeho význam běžně používaný v informatice je však poněkud odlišný) umožňují exaktně popsat množinu textových řetězců odpovídající danému výrazu. Pro tyto účely používají zástupné znaky se speciálním významem (wildcard): např. tečka ‚.‘ nahrazuje libovolný jeden znak, hvězdička ‚*‘ libovolný počet opakování předchozího znaku apod. Tyto zástupné znaky většinou přebírají i konkrétní d.j.

Následující příklad v d.j. korpusového manažeru Manatee/Bonito (viz ↗korpusový a lingvistický software) najde všechny doklady spojení typu „bez chuti a bez zápachu“, „bez práce, bez peněz“ apod. vyskytující se v korpusu uvnitř jedné věty (struktura s, viz ↗značkovací jazyky):

[lemma="bez"] [tag="N.*"] []{0,1} [lemma="bez"] [tag="N.*"] within <s/>

Při práci s korpusovým manažerem je vhodné znát použitý d.j. a jeho možnosti. Ačkoli některá uživatelská rozhraní umožňují zadávat dotaz i bez znalosti konkrétního d.j., bývají v tomto případě možnosti práce s korpusem omezeny, což je dáno snahou o uživatelský komfort a srozumitelnost rozhraní.

Rozšiřující
Citace
Michal Křen (2017): DOTAZOVACÍ JAZYK. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/DOTAZOVACÍ JAZYK (poslední přístup: 21. 11. 2024)

Další pojmy:

korpusová lingvistika

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka