H Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ |
Η Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ αναπτύσσει αλγορίθμους, μοντέλα και συστήματα που επιτρέπουν στoυς υπολογιστές να επεξεργάζονται και να παράγουν κείμενα φυσικής γλώσσας.
Τα τρέχοντα ερευνητικά ενδιαφέροντα της ομάδας περιλαμβάνουν:- συστήματα ερωταποκρίσεων φυσικής γλώσσας για συλλογές εγγράφων, βάσεις δεδομένων και οντολογίες,
- κειμενική συνεπαγωγή και παραγωγή παραφράσεων,
- παραγωγή περιλήψεων, συμπεριλαμβανομένης της παραγωγής περιλήψεων εστιασμένων σε ερωτήσεις και της συμπίεσης προτάσεων,
- παραγωγή κειμένων φυσικής γλώσσας από βάσεις δεδομένων και οντολογίες, ιδιαίτερα οντολογίες του Σημασιολογικού Ιστού,
- κατάταξη εγγράφων, συμπεριλαμβανομένης της ιεραρχικής κατάταξης κειμένων και των φίλτρων ανεπιθύμητου περιεχομένου,
- στατιστική μηχανική μετάφραση, ιδιαίτερα από και προς τα ελληνικά,
- εργαλεία επεξεργασίας φυσικής γλώσσας, όπως αναγνωριστές ονομάτων οντοτήτων και αναγνωριστές μερών του λόγου,
- μηχανική μάθηση στην επεξεργασία φυσικής γλώσσας.
Η ομάδα είναι μέρος του Εργαστηρίου Επεξεργασίας Πληροφοριών του Τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών.
To Τμήμα Πληροφορικής του ΟΠΑ συνδιοργάνωσε το 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2009), που έλαβε χώρα στην Αθήνα από 30 Μαρτίου έως 3 Απριλίου 2009. H ομάδα συμμετείχε επίσης στη διοργάνωση του Second Pascal Challenge on Large Scale Hierarchical Text classification (LSHTC2) και συν-διοργανώνει το ECML/PKDD 2012 Discovery Challenge on Large Scale Hierarchical Text Classification (LSHTC3).
Οι Βαγγέλης Πτερνέας και Γιώργος Καρακατσιώτης, μέλη της ομάδας, κέρδισαν την πρώτη θέση του interoperability challenge του Imagine Cup 2011 της Microsoft. Το σύστημά τους, το Touring Machine (βίντεο), χρησιμοποιεί τη μηχανή παραγωγής κειμένων NaturalOWL, που διατίθεται ελεύθερα.