Projekat "Bosanskohercegovački nacionalni elektronski korpus"
U prostorijama Ministarstva za nauku, visoko obrazovanje i mlade Kantona Sarajevo održan je tematski sastanak, koji su inicirali predstavnici Instituta za jezik Univerziteta u Sarajevu.
Direktor Instituta dr. Jasmin Hodžić sa saradnicom dr. Zenaidom Karavdić i članom Međunarodnog savjeta Instituta za njemački jezik u Mannheimu prof. dr. Vedadom Smailagićem predstavili su ministrici prof. dr. Adni Mesihović i pomoćnici ministrice mr. Azemini Njuhović ideju o pokretanju projekta bosanskohercegovačkog nacionalnog elektronskog korpusa.
Elektronski lingvistički koncept predstavlja bazu podataka koja integriše lingvistiku i informacijske tehnologije radi analize, obrade i generisanja jezičkih podataka. Ovaj koncept koristi računarske algoritme i tehnike za razumijevanje i obradu prirodnog jezika, kao i za automatizaciju jezičkih procesa.
Bosanskohercegovački nacionalni jezički korpus bi predstavljao zbirku tekstova na bosanskom jeziku koja se koristi za lingvistička istraživanja, razvoj jezičkih tehnologija i u druge svrhe. Ovaj korpus bi obuhvatio širok spektar tekstova različitih žanrova, kao što su književni tekstovi, novinski članci, akademska literatura, internet sadržaji, javni govori itd. Kao važna baza podataka koristio bi se za analizu jezičkih obrazaca, istraživanje promjena u jeziku kroz vrijeme, razvoj jezičkih modela za obradu prirodnog jezika, kao i za unapređenje računarskih alata kao što su prevoditelji, pretraživači i sintetizatori govora.
Prvi zacrtani cilj projekta jeste izgradnja korpusa od 50 miliona riječi.
Ministrica Mesihović je naglasila da jedan ovakav projekta može doprinijeti očuvanju, proučavanju i primjeni jezika u različitim sferama društva i tehnologije, te kao takav zaslužuje pažnju Ministarstva.
Izvor: Ministarstvo za nauku, visoko obrazovanje i mlade Kantona Sarajevo