Lemmas uitgelegd

In de morfologie en lexicologie, de vorm van een woord dat verschijnt aan het begin van een woordenboek of een woordenlijst: een hoofdwoord.

Het lemma, zegt David Crystal, is "in wezen een abstracte weergave, die alle formele lexicale variaties die van toepassing zijn ondergaat" (Woordenboek van taal- en fonetiek, 2008).

The Lemma Explained by Malliday and Yallop

"Het lemma is de basisvorm waaronder het woord wordt ingevoerd [in een woordenboek] en zijn plaats krijgt: typisch de 'stam' of eenvoudigste vorm (enkelvoud zelfstandig naamwoord, tegenwoordige / infinitief werkwoord, enz.). Andere vormen mogelijk niet worden ingevoerd als ze voorspelbaar zijn (zoals het meervoud bears, hier niet gegeven); maar de onregelmatige verleden vormen van de werkwoorden worden gegeven (onregelmatig in de zin dat ze niet het standaardpatroon volgen van het toevoegen -ed) en er staat ook een indicatie onder besnoeiing dat de t moet worden verdubbeld in de spelling van verbogen vormen zoals snijdend. Een onregelmatige vorm kan verschijnen als een afzonderlijk lemma, met kruisverwijzing. Dit woordenboek [het tweedelige Nieuw korter Oxford Engels woordenboek, 1993] heeft een dergelijke vermelding voor borne v. vader. pple & ppl a. van BEAR v., aangeeft dat borne is het voltooid deelwoord en het bijvoeglijk naamwoord van het werkwoord beer."

(M. A. K. Halliday en Colin Yallop, Lexicologie: een korte introductie. Continuum, 2007)

Lemmas en Lexemes

"De conventionele term lemma wordt momenteel gebruikt in corpusonderzoek en psycholinguïstische studies als quasi-synoniem met lexeme. Maar lemma kan niet worden verward met lexemes. De redacteuren van de British National Corpus waarschuw gebruikers dat items zoals frasale werkwoorden, dat wil zeggen werkwoorden die twee of drie delen bevatten, zoals blijken, of uitkijken naar, die lexicologen behandelen als lexicale eenheden, zijn alleen toegankelijk via afzonderlijke lemma's. In het geval van blijken, het bevat twee lemma's, en in die van uitkijken naar, drie. Homoniem onderscheid wordt ook niet altijd vastgesteld door de redactie van lijsten met lemma's (Leech, Rayson en Wilson 2001).
"Een lemma lijkt echter op andere manieren op het lexeme-concept. Linguïstische corpora staan ​​twee basiszoekopdrachten toe, waarvan er één gelemmatiseerde woordenlijsten produceert, dat wil zeggen woordenlijsten die lemma's bevatten, en een andere die niet-gemattiseerde woordenlijsten bevat, dat wil zeggen woordenlijsten met woordvormen ...
"Ten slotte kunnen woordenboekwoorden niet altijd worden geïdentificeerd met lexemes. Bijvoorbeeld het trefwoord bubbel, in een woordenboek zoals de Oald [Oxford Advanced Learner's Dictionary] bevat informatie over het zelfstandig naamwoord bubbel en het werkwoord bubbel binnen dezelfde invoer. Voor een lexicoloog vertegenwoordigen deze twee verschillende lexemen. "
(Miguel Fuster Márquez, "Engelse Lexicologie." Werken met woorden: een inleiding tot de Engelse taalkunde, ed. door Miguel Fuster en Antonia Sánchez. Universitat de València, 2008)

De morfologische status van Lemmas

"Wat is de morfologische status van lemma's? Verschillende hypothesen zijn uiteengezet, bijvoorbeeld:

1) dat elk 'woord' (vrije vorm), inclusief verbuigingsvormen en woordformaties, zijn eigen ingang heeft en overeenkomt met een lemma; een zwakkere is
2) dat niet alle woorden hun eigen invoer hebben, d.w.z. 'normale' verbuigingsvormen en misschien woordformaties maken deel uit van de invoer van de basis en zijn toegankelijk via die basis;
3) dat stengels of wortels, in plaats van vrijstaande vormen, het lemma vormen, ongeacht of andere daarvan afgeleide vormen 'regulier' zijn of niet. "

(Amanda Pounder, Processen en paradigma's in morfologie van woordvorming. Mouton de Gruyter, 2000)

Lemma-frequentie meten

"[T] hier is een probleem met woordfrequentie omdat het onduidelijk is wat de juiste maat voor frequentie is. Er bestaan ​​een aantal verschillende manieren om woordfrequentie te tellen en deze zijn niet theoretisch neutraal ...
"Een voorbeeld is de lemma-frequentie; dit is de cumulatieve frequentie van alle woordvormfrequenties van woorden binnen een inflectioneel paradigma. De lemma-frequentie van het werkwoord helpen, is bijvoorbeeld de som van de woordvormfrequenties van help, helpt, hielp en helpen. In accounts van taalverwerking waarin reguliere inflectionele vormen worden afgebroken en in kaart worden gebracht op rootmorfemen, zouden we verwachten dat de frequentie van de root kritischer is voor het bepalen van responslatenties dan de woordvormfrequentie en daarom zou de lemmafrequentie een prominente rol spelen.
"Rekeningen waarin ook andere complexe vormen worden ontleed (bijv. Verbuigingen, afleidingen en verbindingen) zullen in plaats daarvan de cumulatieve morfeefrequentie benadrukken, die de som is van de frequenties van alle complexe woorden waarin een wortelmorfeum voorkomt. De cumulatieve morfeiefrequentie van helpen zou de som zijn van de lemma-frequentie van helpen plus de lemma-frequenties van behulpzaam, hulpeloos, hulpeloosheid enz. Een andere maat, familiegrootte, is het aantal woordtypen waarin een morfeme voorkomt, in plaats van het aantal tokens erin. Het woord helpen heeft een gezinsgrootte van tien. "
(Michael A. Ford, William D. Marslen-Wilson en Matthew H. Davis, "Morphology and Frequency: Contrasting Methodologies." Morfologische structuur in taalverwerking, ed. door R. Harald Baayen en Robert Schreuder. Mouton de Gruyter, 2003)