Corpus-taalkunde is de studie van taal gebaseerd op grote verzamelingen van "real life" taalgebruik opgeslagen in corpora (of corpora) - geautomatiseerde databanken die zijn opgezet voor taalkundig onderzoek. Ook gekend als op corpus gebaseerde studies.
Corpuslinguïstiek wordt door sommige taalkundigen gezien als een onderzoeksinstrument of methodologie, en door anderen als een discipline of theorie op zich. Kuebler en Zinsmeister concluderen dat "het antwoord op de vraag of corpuslinguïstiek een theorie of een hulpmiddel is, gewoon is dat het allebei kan zijn. Het hangt ervan af hoe corpuslinguïstiek wordt toegepast" (Corpus Linguistics and Linguistically Annotated Corpora, 2015).
Hoewel de methoden die in de corpuslinguïstiek werden gebruikt, voor het eerst in de vroege jaren zestig werden aangenomen, werd de term gebruikt corpus linguïstiek verscheen pas in de jaren 1980.
Voorbeelden en observaties
"[C] orpus-taalkunde is ... een methodologie, bestaande uit een groot aantal gerelateerde methoden die kunnen worden gebruikt door wetenschappers van verschillende theoretische aard. Aan de andere kant kan niet worden ontkend dat corpuslinguïstiek ook vaak wordt geassocieerd met een bepaalde kijk op taal. De kern van deze visie is dat de taalregels gebaseerd zijn op gebruik en dat er veranderingen optreden wanneer sprekers taal gebruiken om met elkaar te communiceren. Het argument is dat als je geïnteresseerd bent in de werking van een bepaalde taal, zoals Engels, het een goed idee is om de taal in gebruik te bestuderen. Een efficiënte manier om dit te doen is om corpus-methodologie te gebruiken ... "(Hans Lindquist, Corpus Linguïstiek en de beschrijving van het Engels. Edinburgh University Press, 2009)
"Corpus-studies namen een hoge vlucht vanaf 1980, toen corpora, technieken en nieuwe argumenten voor het gebruik van corpora duidelijker werden. Momenteel gaat deze boom door - en beide 'scholen' van corpus linguïstiek groeien ... Corpus-taalkunde groeit methodologisch en het aantal talen dat door corpus-taalkundigen wordt behandeld, groeit jaarlijks. "(Tony McEnery en Andrew Wilson, Corpus Linguïstiek, Edinburgh University Press, 2001)
Corpus Linguïstiek in de klas
"In de context van de klas de methodologie van corpus linguïstiek is sympathiek voor studenten van alle niveaus, omdat het een 'bottom-up' studie is van de taal die in het begin heel weinig aangeleerde expertise vereist. Zelfs de studenten die naar een taalkundig onderzoek komen zonder een theoretisch apparaat, leren zeer snel hun hypothesen vooruit te gaan op basis van hun waarnemingen in plaats van kennis te ontvangen, en ze te toetsen aan het bewijsmateriaal dat door het corpus wordt verstrekt. "(Elena Tognini-Bonelli, Corpus Linguistics at Work. John Benjamins, 2001)
"Om goed gebruik te kunnen maken van corpusbronnen heeft een leraar een bescheiden oriëntatie nodig op de routines die betrokken zijn bij het ophalen van informatie uit het corpus, en - vooral - training en ervaring in het evalueren van die informatie." (John McHardy Sinclair, Hoe Corpora te gebruiken bij het onderwijzen van talen, John Benjamins, 2004)
Kwantitatieve en kwalitatieve analyses
"Kwantitatieve technieken zijn essentieel voor corpus-gebaseerde studies. Als je bijvoorbeeld het taalgebruik van patronen voor de woorden wilde vergelijken groot en groot, je zou moeten weten hoe vaak elk woord in het corpus voorkomt, hoeveel verschillende woorden samen voorkomen met elk van deze bijvoeglijke naamwoorden (de collocaties) en hoe vaak elk van die collocaties voorkomt. Dit zijn allemaal kwantitatieve metingen ... "Een cruciaal onderdeel van de corpusgebaseerde benadering gaat verder dan de kwantitatieve patronen om functionele interpretaties voor te stellen waarin wordt uitgelegd waarom de patronen bestaan. Als gevolg hiervan wordt in corpusgebaseerde studies veel aandacht besteed aan het verklaren en illustreren van kwantitatieve patronen." (Douglas Biber, Susan Conrad en Randi Reppen, Corpus Linguïstiek: onderzoek naar taalstructuur en -gebruik, Cambridge University Press, 2004)
"[In corpus linguïstiek kwantitatieve en kwalitatieve methoden worden veelvuldig in combinatie gebruikt. Het is ook kenmerkend voor corpuslinguïstiek om te beginnen met kwantitatieve bevindingen en toe te werken naar kwalitatieve. Maar ... de procedure kan cyclische elementen bevatten. Over het algemeen is het wenselijk om kwantitatieve resultaten aan kwalitatief onderzoek te onderwerpen, bijvoorbeeld door uit te leggen waarom een bepaald frequentiepatroon optreedt. Maar aan de andere kant kan kwalitatieve analyse (gebruikmakend van het vermogen van de onderzoeker om taalmonsters in context te interpreteren) het middel zijn om voorbeelden in een bepaald corpus naar hun betekenis te classificeren; en deze kwalitatieve analyse kan dan de input zijn voor een verdere kwantitatieve analyse, een die is gebaseerd op betekenis ... "(Geoffrey Leech, Marianne Hundt, Christian Mair en Nicholas Smith, Verandering in hedendaags Engels: een grammaticale studie. Cambridge University Press, 2012)