დაგვიკავშირდით

          

          პ. ინგოროყვას ქ. №8
          თბილისი 380108.
          ტელ: +99532 293-29-21
          ფაქსი: +99532 293-45-30
          ფოსტა: contact@ice.ge 

----------------------------     

 


ენობრივ მონაცემთა კომპიუტერული დამუშავების განყოფილება

 

განყოფილება შეიქმნა 2006 წლის ზაფხულში ორი სამეცნიერო რგოლის: დიალექტოლოგიური ატლასისა და კომპიუტერული ლინგვისტიკის ლაბორატორიების ბაზაზე. შესაბამისად, გამოიკვეთა მისი, როგორც ინსტიტუტის ერთ-ერთი მნიშვნელოვანი სტრუქტურული ერთეულის განვითარების მთავარი მიმართულებებიც ლინგვისტურ მონაცემთა ბაზების შექმნა და კვლევის თეორიული საფუძვლების შემუშავება.
განყოფილების მთავარი პრიორიტეტი უახლოესი მომავლისთვის არის ქართული ენის კომპიუტერული დამუშავება, ინტერ-და მულტიდისციპლინარული კვლევებისათვის ენობრივი მასალის მომზადება და მისი ხელმისაწვდომობის უზრუნველყოფა, ტექსტების კორპუსების შექმნა და ”კორპუსული ლინგვისტიკის” განვითარება.
განყოფილების მიზანია, გააერთიანოს და განავითაროს კომპიუტერული ლინგვისტიკის, სახელდობრ, ენობრივ მონაცემთა კომპიუტერული დამუშავების სფეროში არსებული ინტელექტუალური რესურსები. განყოფილება გააგრძელებს ინსტიტუტში გასული საუკუნის 90-იან წლებში შემუშავებულ კურსს. შეიძლება ითქვას, რომ სწორედ ამ პერიოდში დაიწყო მზადება ენის ახალი ტექნოლოგიებით კვლევისათვის. ინსტიტუტის მაშინდელი დირექტორის ბ-ნ ბესარიონ ჯორბენაძის უშუალო მონაწილეობითა და ხელმძღვანელობით შეიქმნა ფუნდამენტური ლექსიკონები, რომლებიც შემდგომში საფუძვლად დაედო ენის ფორმალური სისტემების შექმნას, მოდელირებას და მთელ რიგ კომპიუტერულ პროგრამებს. ეს ლექსიკონებია:
”ზმნური ფუძეების ლექსიკონი” (გ. გოგოლაშვილი, ც. კვანტალიანი, დ. შენგელია),
”სახელზმნური ფუძეების ლექსიკონი” (გ. გოგოლაშვილი, ც. კვანტალიანი, დ. შენგელია),
”ქართული ენის ფორმანტებისა და მოდალური ელემენტების ლექსიკონი” (ბ. ჯორბენაძე, მ. კობაიძე, მ. ბერიძე),”ქართული ენის სახელური ძირების ლექსიკონი» (ბ. ჯორბენაძე, ნ. ლოლაძე, მ. კიკონიშვილი) (მომზადებულია გამოსაცემად).
დაწყებული იყო აგრეთვე მეგრულისა და სვანურის ფორმანტებისა და მოდალური ელემენტების ლექსიკონზე მუშაობა (ბ. ჯორბენაძე, მ. კობაიძე, მ. ბერიძე).
ლექსიკონების მომზადების პარალელურად მიმდინარეობდა მონაცემთა ბაზების შექმნასა და ენის მოდელირების საკითხებზე მუშაობაც.
ბატონი თედო უთურგაიძისა და მისი ჯგუფის (ლევან ჩხაიძის, მანანა თანდაშვილის, ქეთევან დათუკიშვილის, მაია მანჯგალიძის და სხვათა) მოღვაწეობამ საფუძველი დაუდო ინსტიტუტში ახალი მიმართულების ჩამოყალიბებასა და განვითარებას. 1989 წელს შეიქმნა კომპიუტერების ლაბორატორია (გამგე - ვლადიმერ კიკილაშვილი), რომლის ბაზაზეც 1995 წელს ჩამოყალიბდა კომპიუტერული ლინგვისტიკის ლაბორატორია, რომელსაც 1995-2002 წლებში ხელმძღვანელობდა მანანა თანდაშვილი, 2002-2006 წლებში კი ქეთევან დათუკიშვილი. ლაბორატორიაში
მომზადდა და ჩატარდა კონფერენციები: ”ენის კონცეპტუალური და კომპიუტერული მოდელები” (1996, 1997, 1998). 2003 წლიდან კონფერენციები განახლდა სახელწოდებით: “ბუნებრივ ენათა დამუშავება (ქართული ენა და კომპიუტერული ტექნოლოგიები)” (2003, 2004, 2005, 2006, 2007, 2008). იბეჭდებოდა კონფერენციის მასალები. კონფერენციებში, ენათმეცნიერების ინსტიტუტის გარდა, მონაწილეობდნენ სხვადასხვა ორგანიზაციები: ივ. ჯავახიშვილის სახ. თბილისის სახელმწიფო უნივერსიტეტი, მართვის სისტემების ინსტიტუტი, ლიტერატურის ინსტიტუტი, ხელნაწერთა ინსტიტუტი, ეროვნული ბიბლიოთეკა და სხვა. 2004-2006 წლებში კომპიუტერული ლინგვისტიკის ლაბორატორია მეტყველების კულტურის განყოფილებასთან ერთად მონაწილეობდა მეცნიერებათა აკადემიის საგრანტო პროექტში ”საკუთარ სახელთა ორთოგრაფიული ლექსიკონი”.
პროექტის ფარგლებში შეიქმნა მონაცემთა ბაზა ელექტრონული ლექსიკონისათვის. ბაზა მომზადდა შემდეგი ლექსიკონების საფუძველზე:
“საბჭოთა კავშირის გეოგრაფიულ სახელთა ლექსიკონი”;
“საზღვარგარეთის ქვეყნების გეოგრაფიულ სახელთა ლექსიკონი”;
“საქართველოს გეოგრაფიულ სახელთა ლექსიკონი”;
“უცხო პირთა სახელების ლექსიკონი”;
“ბერძნულ-რომაულ სახელთა ორთოგრაფიული ლექსიკონი”.
”ლინგვისტური ატლასის” ლაბორატორია შეიქმნა 1991 წელს ქართველურ ენათა განყოფილების ბაზაზე და მის ძირითად ფუნქციად განისაზღვრა ქართველური ენების დიალექტების ტექსტური და ლექსიკური ბაზების მომზადება. ლაბორატორია გეგმავდა დიალექტური მასალის მოპოვებისა და დამუშავების ვრცელ და მასშტაბურ სამუშაოს. ქვეყანაში განვითარებულმა მოვლენებმა დიდი ხნით შეაფერხა დაგეგმილი საველე მუშაობა, თუმცა ლაბორატორია აგრძელებდა წინა წლების ექსპედიციებში დაგროვილი ინფორმაციის დამუშავებას და თეორიულ კვლევებს. შექმნის დღიდან (1991წ.) ლაბორატორიას ხელმძღვანელობდა მ. კობაიძე, 1995 წლიდან კი გ. ცოცანიძე.
2004 წლიდან განყოფილების გამგეა მ. ბერიძე. 1998 წლიდან 2006 წლამდე ლაბორატორია ასრულებდა დიალექტური ტექსტებისა და დიალექტური ლექსიკის მონაცემთა ბაზის მოსამზადებელ სამუშაოს, რომელიც ფინანსდებოდა მეცნიერებათა აკადემიის მიერ. ლაბორატორიაში მომზადდა გ. ცოცანიძის ”თუშური ლექსიკონი”; განხორციელდა რამდენიმე პროექტი სხვა ორგანიზაციათა ფინანსური მხარდაჭერით; პირველად მოხდა ლინგვისტური მიზნებით მოპოვებული მასალის ინტერდისციპლინარული მნიშვნელობით გააქტიურება და კვლევა: გ. ცოცანიძე, ”თუშური ქრონიკები”, 2004წ. (თუშური ტექსტებით); მ. ბერიძე, «პირდაპირი რეპორტაჟები წარსულიდან» -მესხეთი და მესხები 1918-1944წ) (მესხური ტექსტებით).
დაწყებულია მუშაობა დიალექტური ლექსიკის და კარტოგრაფირების ბაზის მოსამზადებლად. ჩვენი თანამშრომლები: გ. ცოცანიძე, ნ. სურმავა, მ. ბერიძე, ლ. ბაკურაძე ჩართული იყვნენ «ფოლკსვაგენ შტიფტუნგის» მიერ დაფინანსებულ პროექტში «ენობრივი სიტუაცია საქართველოში» (სამეცნიერო ხელმძღვანელი პროფ. იოსტ გიპერტი, კოორდინატორი პროფ. მანანა თანდაშვილი).
2006 წლის გაზაფხულზე ამვე ლაბორატორიის თანამშრომელთა ჯგუფმა საქართველოს სამეცნიერო ფონდის მიერ გამოცხადებულ კონკურსზე წარადგინა სამწლიანი პროექტი «საქართველოს ლინგვისტური პორტრეტი - ქართული დიალექტური ტექსტების კორპუსი (სამეცნიერო ხელმძღვანელი მ. ბერიძე). პროექტი დაფინანსდა და წარმატებით ხორციელდება.
განყოფილების მთავარი მიმართულებები უახლოესი მომავლისთვის:
1. კომპიუტერული ლინგვისტიკა
2. კორპუსული ლინგვისტიკა

 

2009 წელს ეროვნულ მონაცემთა კომპიუტერული დამუშავების განყოფილების გამგედ აირჩიეს ფილოლოგიურ მეცნიერებათა კანდიდატი მარინე ბერიძე.

სამეცნიერო თანამდებობებზე არჩეულ იქნენ:

მთავარი მეცნიერი თანამშრომელი
ლიანა ლორთქიფანიძე (0.5)

უფროსი მეცნიერი თანამშრომელი
ლია ბაკურაძე
ნარგიზა სურმავა

ციცინო კვანტალიანი

მეცნიერი თანამშრომელი
რუსუდან ლანდია
ნათია ფუტკარაძე
მაია ბარიხაშვილი