Wat is parseren? Definitie en voorbeelden in Engelse grammatica

Parsing is een grammaticale oefening waarbij een tekst wordt opgesplitst in de samenstellende delen van spraak met een uitleg van de vorm, functie en syntactische relatie van elk deel, zodat de tekst kan worden begrepen. De term "parsing" komt uit het Latijn pars voor "deel (van spraak)."

In de hedendaagse taalkunde verwijst parsing meestal naar de computerondersteunde syntactische analyse van taal. Computerprogramma's die automatisch parseringstags toevoegen aan een tekst worden genoemd parsers.

Belangrijkste afhaalrestaurants: ontleden

  • Parsing is het proces waarbij een zin in zijn elementen wordt opgesplitst zodat de zin kan worden begrepen.
  • Traditioneel parseren gebeurt met de hand, soms met behulp van zinsdiagrammen. Parsing is ook betrokken bij complexere vormen van analyse, zoals discoursanalyse en psycholinguïstiek.

Parse-definitie

In de taalkunde, tot parse betekent het splitsen van een zin in zijn samenstellende delen zodat de betekenis van de zin kan worden begrepen. Soms wordt parseren gedaan met behulp van tools zoals zinsdiagrammen (visuele weergaven van syntactische constructies). Bij het ontleden van een zin neemt de lezer nota van de zinselementen en hun woordsoorten (of een woord een zelfstandig naamwoord, werkwoord, bijvoeglijk naamwoord, enz. Is). De lezer merkt ook andere elementen op, zoals de werkwoordsvorm (tegenwoordige tijd, verleden tijd, toekomstige tijd, enz.). Nadat de zin is afgebroken, kan de lezer zijn analyse gebruiken om de betekenis van de zin te interpreteren.

Sommige taalkundigen maken een onderscheid tussen "volledige parsing" en "skelet parsing". De eerste verwijst naar de volledige analyse van een tekst, inclusief een zo gedetailleerd mogelijke beschrijving van de elementen ervan. De laatste verwijst naar een eenvoudigere vorm van analyse die wordt gebruikt om de basisbetekenis van een zin te begrijpen.

Traditionele methoden van parseren

Traditioneel wordt parseren gedaan door een zin te nemen en deze op te splitsen in verschillende delen van spraak. De woorden worden in verschillende grammaticale categorieën geplaatst en vervolgens worden de grammaticale relaties tussen de woorden geïdentificeerd, waardoor de lezer de zin kan interpreteren. Neem bijvoorbeeld de volgende zin:

  • De man opende de deur.

Om deze zin te ontleden, classificeren we eerst elk woord op zijn woordsoort: de (artikel), Mens (zelfstandig naamwoord), geopend (werkwoord), de (artikel), deur (zelfstandig naamwoord). De zin heeft slechts één werkwoord (geopend); we kunnen dan het onderwerp en object van dat werkwoord identificeren. In dit geval, omdat de man de actie uitvoert, is het onderwerp Mens en het object is deur. Omdat het werkwoord is geopend-liever dan Opent of zal openen-we weten dat de zin in de verleden tijd staat, wat betekent dat de beschreven actie al heeft plaatsgevonden. Dit voorbeeld is eenvoudig, maar het laat zien hoe parsing kan worden gebruikt om de betekenis van een tekst te verlichten. Traditionele methoden voor parseren kunnen al dan niet zinsdiagrammen bevatten. Dergelijke visuele hulpmiddelen zijn soms nuttig wanneer de te analyseren zinnen bijzonder complex zijn.

Discoursanalyse

In tegenstelling tot eenvoudige analyse verwijst discoursanalyse naar een breder studiegebied dat zich bezighoudt met de sociale en psychologische aspecten van taal. Degenen die een discoursanalyse uitvoeren, zijn onder andere geïnteresseerd in taalgenres (mensen met bepaalde vaste conventies binnen verschillende velden) en de relaties tussen taal en sociaal gedrag, politiek en geheugen. Op deze manier gaat discoursanalyse veel verder dan het bereik van traditionele parsing, die beperkt is tot die individuele teksten.

Psycholinguïstiek

Psycholinguïstiek is een vakgebied dat zich bezighoudt met taal en de relatie ervan met psychologie en neurowetenschappen. Wetenschappers die op dit gebied werken, bestuderen de manier waarop het brein taal verwerkt en tekens en symbolen omzet in betekenisvolle uitspraken. Als zodanig zijn ze vooral geïnteresseerd in de onderliggende processen die traditionele parsing mogelijk maken. Ze zijn bijvoorbeeld geïnteresseerd in hoe verschillende hersenstructuren taalverwerving en -begrip bevorderen.

Computergestuurd parseren

Computationele taalkunde is een vakgebied waarin wetenschappers een op regels gebaseerde benadering hebben gebruikt om computermodellen van menselijke talen te ontwikkelen. Dit werk combineert informatica met cognitieve wetenschappen, wiskunde, filosofie en kunstmatige intelligentie. Met computerondersteunde parsing kunnen wetenschappers algoritmen gebruiken om tekstanalyses uit te voeren. Dit is vooral handig voor wetenschappers omdat, in tegenstelling tot traditionele parsing, dergelijke tools kunnen worden gebruikt om grote hoeveelheden tekst snel te analyseren, patronen en andere informatie te onthullen die anders niet gemakkelijk kon worden verkregen. In het opkomende gebied van digitale geesteswetenschappen is bijvoorbeeld computerondersteund parseren gebruikt om de werken van Shakespeare te analyseren; in 2016 concludeerden literaire historici uit een computeranalyse van het stuk dat Christopher Marlowe de co-auteur was van Shakespeare's 'Henry VI'.

Een van de uitdagingen van computerondersteund parseren is dat computermodellen van taal gebaseerd zijn op regels, wat betekent dat wetenschappers algoritmen moeten vertellen hoe ze bepaalde structuren en patronen moeten interpreteren. In de werkelijke menselijke taal hebben dergelijke structuren en patronen echter niet altijd dezelfde betekenis, en taalkundigen moeten individuele voorbeelden analyseren om de principes te bepalen die hen beheersen.

bronnen

  • Dowty, David R., et al. "Parsing van natuurlijke talen: psychologische, computationele en theoretische perspectieven." Cambridge University Press, 2005.
  • Halley, Ned. "Het Wordsworth-woordenboek voor modern Engels: grammatica, syntaxis en stijl voor de 21ste eeuw." Wordsworth Editions, 2001.