MORFOLOGICKÁ ANALÝZA

Základní

1. V tradiční gramatice lineární rozklad slova na ↗morfémy, tj. morfematická analýza. Stupně analýzy jsou dány mírou proměnlivosti různých částí slova při odvozování a ohýbání. Největší stálost vykazuje kořenný morfém slova (viz ↗kořen), který se považuje za kategorii stanovitelnou vesměs historicky, tedy z diachronního hlediska (např. uč‑), a je společný nejen všem morfologickým formám slova (např. všem pádovým podobám), ale i slovům od něho odvozovaným (it, ení, itel, itelský, itelství). Jeho rozšířením o kmenotvorný/é morfém/y vzniká jednoduchý (uč‑i‑), n. vícestupňový (uč‑i‑tel‑stv‑) ↗kmen, v jehož rámci se rozeznává kmen odvozovací (od něhož se tvoří dál) a kmen odvozený. Posledním morfémem je u ohebných slov tvarotvorný morfém / formant neboli koncovka (uč‑i‑tel‑stv‑í, uč‑i‑tel‑k‑y), v základním tvaru morfologická charakteristika (uč‑i‑tel‑k‑a), n. u neohebných slov slovnědruhová charakteristika (mlč‑k‑y). Kořenné i kmenotvorné morfémy podléhají ↗hláskovým alternacím.

Pro poznání slovotvorného procesu se v rámci ↗OTS odvozovací kmen považuje za slovotvorný základ, k němuž se připojuje slovotvorný formant. Analogicky se pro tvarotvornou (morfologickou) analýzu považuje celé slovo kromě tvarotvorného formantu za tvarotvorný základ, což se obvykle u odvozených slov kryje s odvozeným kmenem (v morfologii nazývaným také tvarotvorný kmen). Tvarotvorným formantem rozumíme kmenotvornou příponu + (a) tvarovou (někdy nazývanou pádovou) koncovku jména (žen‑a, kuř‑at+a, zdrav‑é+ho), (b) tvarovou (někdy nazývanou osobní) koncovku určitého slovesného tvaru (nes‑e+š, děl‑ej+me), (c) infinitivní tvarovou koncovku (pros‑i+t, péc‑0+i) a (d) tvarotvornou koncovku participia + koncovku jmenných kategorií rodu+čísla (nes‑0+l+0, uvid‑ě+l+y).

2. V ↗korpusové lingvistice automatický proces, při němž se v užším smyslu každému slovnímu tvaru v (korpusovém) textu přiřadí všechny morfologické údaje včetně slovního druhu v podobě značky (↗tagu), v širším (obvyklém) smyslu navíc všechna jeho ↗lemmata procesem ↗lemmatizace; viz ✍Hajič (2004), ✍Hlaváčová (2009), ✍Čermák & Klímová ad. (2000), ✍Petkevič (2000). Je-li tvar slovnědruhově a/nebo morfologicky homonymní, přiřadí mu m.a. takových údajů více než jeden. Např. (zjednodušená) m.a. věty Sním je místo něho přiřadí jednotlivým slovním tvarům tyto údaje (v prvním sloupci je analyzovaný tvar, ve druhém lemma, ve třetím značka):

Sním

sníst

VpS--1d

snít

VpS--1n

je

být

VpS--3n

ono

PPSN4--

oni

PPPM4--

ony

PPPI4--

ony

PPPF4--

ona

PPPN4--

místo

místo

NNSN1--

místo

R---2--

něho

něha

NNSF5--

on

PPSM2--

on

PPSM4--

on

PPSI2--

ono

PPSN2--

.

.

Z------

Symboly ve značce mají tento význam (- znamená: neurčuje se):

1. pozice:

slovní druh: V – sloveso, P – zájmeno, N – substantivum, R – předložka, Z – interpunkce

2. pozice:

poddruh slovního druhu: p – prézens, P – osobní zájmeno, N – apelativum

3. pozice:

číslo: S – singulár, P – plurál

4. pozice:

jmenný rod: M – maskulinum životné, I – maskulinum neživotné. F – femininum, N – neutrum

5. pozice:

pád: 1 – nominativ, 2 – genitiv, 4 – akuzativ, 5 – vokativ

6. pozice:

osoba: 1 – první, 3 – třetí

7. pozice:

vid: d – dokonavý, n – nedokonavý

M.a. se provádí počítačovým programem zvaným morfologický analyzátor a je součástí morfologické ↗anotace, jejíž součástí je typicky i morfologická ↗disambiguace, která operuje obvykle na výstupu m.a. Např. výsledkem správné ↗lemmatizace a morfologické disambiguace, jež následuje po m.a. uvedené věty, jsou interpretace vysázené tučně.

Rozšiřující
Literatura
  • Bosák, J. & K. Buzássyová. Východiska morfémovej analýzy (Morfematika, slovotvorba), 1985.
  • Čermák, F. Syntagmatika a paradigmatika českého slova II. Morfologie a tvoření slov, 1990.
  • Čermák, F. & J. Klímová ad. (eds.) Studie z korpusové lingvistiky, 2000.
  • Český národní korpus, 2010 (http://korpus.cz/).
  • ČŘJ, 1996, 81–83.
  • Dokulil, M. Stav a zkoumání morfologické stavby současné češtiny. SaS 29, 1968, 229–246.
  • Garside, R. & G. Leech ad. Corpus Annotation. Linguistic Information from Computer Text Corpora, 1997.
  • Hajič, J. Popis morfologických značek – poziční systém, 2000 (http://ucnk.ff.cuni.cz/).
  • Hajič, J. Disambiguation of Rich Inflection (Computational Morphology of Czech), 2004.
  • Hlaváčová, J. Formalizace systému české morfologie s ohledem na automatické zpracování českých textů. PhD. dis., FF UK, Praha, 2009.
  • Hnátková, M. & V. Petkevič ad. Linguistic Annotation of Corpora in the Czech National Corpus. In Trudy meždunarodnoj konferenciiKorpusnaja lingvistika – 2011“ (Proceedings of the International Conference „Corpus Linguistics – 2011“), 2011, 15–20.
  • Jakubíček, M. & V. Kovář ad. Czech Morphological Tagset Revisited. In Horák, A. & P. Rychlý (eds.), Proceedings of Recent Advances in Slavonic Natural Language Processing 2011, 2011, 29–42.
  • Jelínek, T. & V. Petkevič. Systém jazykového značkování současné psané češtiny. In Petkevič, V. & A. Rosen (eds.), Korpusová lingvistika Praha 2011 – 3. Gramatika a značkování korpusů, 2011, 154–170.
  • Leech, G. The State of the Art in Corpus Linguistics. In Aijmer K. & B. Altenberg (eds.), English Corpus Linguistics. Studies in Honour of Jan Svartvik, 1991, 8–29.
  • Leech, G. Corpus Annotation Schemes. Literary and Linguistic Computing 8, 1993, 275–281.
  • 1, 1986, 177–178, 215–220.
  • McEnery, A. & A. Wilson. Corpus Linguistics, 2001.
  • Neščimenko, G. P. Problema derivacionnoj morfonologii. In Slavjanskoje i balkanskoje jazykoznanije. Problemy morfonologii, 1981, 302–321.
  • Osolsobě, K. Algoritmický popis české morfologie a strojový slovník češtiny. PhD. dis., FF MU, Brno, 1996.
  • Osolsobě, K. Formale Beschreibung der tschechischen Morphologie. In Junghanns, U. & G. Zybatow (eds.), Formale Slavistik, 1997, 443–451.
  • Petkevič, V. Značkování, automatická morfologická analýza a desambiguace. In Kocek, J. & M. Kopřivová ad. (eds.), Český národní korpus – Úvod a příručka uživatele, 2000, 25–34.
  • PMČ, 1995, 109–110.
  • The Prague Dependency Treebank 2.0, 2006 (http://ufal.mff.cuni.cz/pdt2.0/).
  • Sedláček, R. Morphematic Analyser for Czech. PhD. dis., FI MU, Brno, 2004.
  • Skoumalová, Z. Status tzv. kmenotvorných přípon slovesných v slovanských jazycích, zvláště v ruštině, 1975.
  • Slavíčková, E. Metoda morfémové analýzy založené na aplikaci teorie pravděpodobnosti. SaS 23, 1962, 94–104.
  • Slavíčková, E. Některé problémy morfémové analýzy češtiny. SaS 28, 1967, 7–17.
  • Slavíčková, E. Retrográdní morfematický slovník češtiny, 1975.
  • Straková, V. Κ morfematické strukturaci sémantických obsahů. Sl 53, 1984, 244–250.
  • Šmerk, P. K počítačové morfologické analýze češtiny. PhD. dis., FI MU, Brno, 2010.
  • Šmilauer, V. Novočeské tvoření slov, 1971, 10.
  • TSČ, 1962, 33, 53, 120, 128, 135.
  • Viz též Slovotvorný základ, Tvarotvorný základ, Tvarotvorný formant, Slovotvorný formant.
Citace
Zdenka Rusínová (1), Vladimír Petkevič (2) (2017): MORFOLOGICKÁ ANALÝZA. In: Petr Karlík, Marek Nekula, Jana Pleskalová (eds.), CzechEncy - Nový encyklopedický slovník češtiny.
URL: https://www.czechency.org/slovnik/MORFOLOGICKÁ ANALÝZA (poslední přístup: 26. 11. 2024)

CzechEncy – Nový encyklopedický slovník češtiny

Všechna práva vyhrazena © Masarykova univerzita, Brno 2012–2020

Provozuje Centrum zpracování přirozeného jazyka