DOTAZOVACÍ JAZYK
Jazyk používaný v informatice k dotazování databázových a dalších systémů; každý takový jazyk má zpravidla vlastní přesně definovanou syntax. V korpusové lingvistice se d.j. používají pro zadávání dotazů v korpusových manažerech, konkordančních programech apod. (viz ↗korpusový a lingvistický software). I tady se jednotlivé d.j. většinou liší, přestože typicky vycházejí z regulárních výrazů, které dále rozšiřují a adaptují pro svoje potřeby. Regulární výrazy (pojem pochází z teorie formálních jaz., jeho význam běžně používaný v informatice je však poněkud odlišný) umožňují exaktně popsat množinu textových řetězců odpovídající danému výrazu. Pro tyto účely používají zástupné znaky se speciálním významem (wildcard): např. tečka ‚.‘ nahrazuje libovolný jeden znak, hvězdička ‚*‘ libovolný počet opakování předchozího znaku apod. Tyto zástupné znaky většinou přebírají i konkrétní d.j.
Následující příklad v d.j. korpusového manažeru Manatee/Bonito (viz ↗korpusový a lingvistický software) najde všechny doklady spojení typu „bez chuti a bez zápachu“, „bez práce, bez peněz“ apod. vyskytující se v korpusu uvnitř jedné věty (struktura s, viz ↗značkovací jazyky):
[lemma="bez"] [tag="N.*"] []{0,1} [lemma="bez"] [tag="N.*"] within <s/> |
Při práci s korpusovým manažerem je vhodné znát použitý d.j. a jeho možnosti. Ačkoli některá uživatelská rozhraní umožňují zadávat dotaz i bez znalosti konkrétního d.j., bývají v tomto případě možnosti práce s korpusem omezeny, což je dáno snahou o uživatelský komfort a srozumitelnost rozhraní.
- Corpus Query Language http://sketchengine.co.uk/corpus-querying/.
- https://wiki.korpus.cz/.
URL: https://www.czechency.org/slovnik/DOTAZOVACÍ JAZYK (poslední přístup: 21. 11. 2024)
Další pojmy:
korpusová lingvistikaCzechEncy – Nový encyklopedický slovník češtiny
Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020
Provozuje Centrum zpracování přirozeného jazyka