Korpus oziroma besedilni korpus je strukturirana zbirka besedil, ki je običajno hranjena v elektronski verziji. Korpusi so primarno uporabni za statistične analize in testiranje hipotez ter za potrjevanje in raziskovanje pravil v določenem jeziku (slovnice in slovarja).
Korpusi niso uporabni samo za jezikoslovce, temveč lahko določene dvome in dileme pri pisanju preverjamo tudi sami, saj lahko na podlagi rezultatov razberemo, ali je določena različica oz. besedna zveza pogosto v rabi ali ne. Med rezultati iskanja se izpišejo tudi viri, kjer je bilo besedilo objavljeno, tako da lahko sklepamo, če je raba primernejša na primer v publicističnem besedilu, strokovnem besedilu ...
Za slovenski jezik obstajajo trije on-line korpusi, in sicer:
Največja prednost korpusov je, da v njih najdete tudi najnovejše besede, ki jih v slovarjih, slovnici in drugih priročnikih še ni. Primer izpisa rezultatov za besedo blog si lahko ogledate s klikom na fotografijo.
Ni komentarjev:
Objavite komentar