LEMMA
1. Jednotlivý slovníkový vstup. Reprezentativní podoba ↗lexému, charakterizovaná jistou gramatickou formou (u jmen nejčastěji nom.sg., u sloves inf.), jistým pravopisem a jistou výslovností, popř. rozrůzněná dubletou nebo variantností. V klasických slovnících uvádí l. heslový odstavec, v tomto případě se užívá spíše termín heslové slovo.
2. Reprezentativní slovníková podoba, která je při automatickém zpracování jazyka v procesu ↗lemmatizace přidělována každé formě v ↗korpusu. Přístupy k lemmatizaci se mohou v drobnostech lišit, obecně však platí, že l. každého č. substantiva je jeho nom.sg. (tvar lesům má l. les), u adjektiv je to nom.sg.mask. (tvar chytrou má l. chytrý), u sloves je to infinitiv (tvar chodíš má l. chodit) atd. L. jako jednotka vzniká abstrakcí morfologických vlastností slovního tvaru (označovaného jako word nebo forma), představuje tedy množinu forem lišících se pouze tvaroslovnými afixy, příp. pravopisnou variantou. V některých koncepcích se k l. řadí i vybrané varianty slovotvorné. V určitých aspektech je tak l. analogické ↗lexému s tím rozdílem, že l. je zatím vždy jednoslovná jednotka a ve většině korpusů koresponduje s výskytem slovního tvaru v poměru 1:1. V každém korpusu je inventář l. menší než inventář slovních tvarů (např. ve stomilionovém korpusu SYN2010 najdeme 1,7 mil. různých slovních tvarů, ale jenom 786 tis. různých l.).
L. by mělo být základním nositelem lexikálního významu jednotky, na základě l. jsou proto sestavovány korpusově založené slovníky. Vedle toho se ovšem stále více akcentuje přístup, který poukazuje na fakt, že význam je úzce spjat s morfologicky vymezeným tvarem a že l. je tak přílišnou abstrakcí zanedbávající důležité sémantické distinkce mezi tvary (srov. význam l. nerv a význam tvarů nerv a nervy, n. řídký brambůrek a běžné brambůrky).
- Baker, P. & A. Hardie ad. A Glossary of Corpus Linguistics, 2006.
- Biber, D. & S. Conrad ad. Corpus Linguistics: Investigating Language Structure and Use, 1998.
- Čermák, F. & R. Blatná. (eds.) Manuál lexikografie, 1995.
- Jelínek, T. & V. Petkevič. Systém jazykového značkování korpusů současné psané češtiny. In Petkevič, V. & A. Rosen (eds.), Korpusová lingvistika Praha 2011 3. Gramatika a značkování korpusů, 2011, 154–170.
- Kocek, J. & M. Kopřivová ad. (eds.) Český národní korpus: Úvod a příručka uživatele, 2000.
URL: https://www.czechency.org/slovnik/LEMMA (poslední přístup: 21. 11. 2024)
Další pojmy:
lexikologieCzechEncy – Nový encyklopedický slovník češtiny
Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020
Provozuje Centrum zpracování přirozeného jazyka