Ομάδα Επεξεργασίας Φυσικής Γλώσσας ΟΠΑ
Η Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ αναπτύσσει αλγόριθμους, μοντέλα και συστήματα που επιτρέπουν στους υπολογιστές να κατανοούν και να παράγουν φυσική γλώσσα σε κείμενο και ομιλία. Εξετάζουμε επίσης την επεξεργασία πολυτροπικής πληροφορίας, π.χ. τον συνδυασμό ομιλίας, κειμένου και εικόνων.
Τα τρέχοντα ερευνητικά ενδιαφέροντα της ομάδας περιλαμβάνουν:
- μηχανική μάθηση για κείμενο, ομιλία και πολυτροπική πληροφορία, ιδιαίτερα μοντέλα βαθιάς μάθησης,
- κατανόηση προφορικού λόγου και διαλογικά συστήματα,
- question answering, retrieval-augmented generation (RAG), και multi-step reasoning για συλλογές εγγράφων,
- παραγωγή κειμένου από εικόνα και συγκεκριμένα παραγωγή διαγνωστικών ετικετών και περιγραφών για ιατρικές εικόνες,
- βελτίωση διαδικτυακών συζητήσεων, συμπεριλαμβανομένης της ανίχνευσης και αντιμετώπισης τοξικών αναρτήσεων και ψευδών ειδήσεων, και της χρήσης μεγάλων γλωσσικών μοντέλων ως ενεργών διαμεσολαβητών,
- ανάλυση συναισθήματος και αναγνώριση συναισθημάτων για κείμενο και ομιλία,
- επεξεργασία φυσικής γλώσσας στην ψηφιακές ανθρωπιστικές επιστήμες (digital humanities),
- επεξεργασία φυσικής γλώσσας για ιατρικά, νομικά και οικονομικά δεδομένα,
- εργαλεία επεξεργασίας κειμένου και ομιλίας για τα Ελληνικά.
Η ομάδα αποτελεί μέρος του Εργαστηρίου Επεξεργασίας Πληροφορίας του Τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών. και συνδιοργάνωσε πρόσφατα το 4ο, 3ο, και 2ο Καλοκαιρινό Σχολείο Επεξεργασίας Φυσικής Γλώσσας στην Αθήνα (AthNLP 2024-2026). Η ομάδα συμμετέχει εδώ και αρκετά χρόνια και κατακτά σταθερά τις πρώτες θέσεις στον διαγωνισμό ImageCLEFmedical Caption, μεταξύ άλλων την 1η θέση τόσο στην ανίχνευση εννοιών όσο και στην εξηγησιμότητα το 2025, καθώς και τη 2η θέση στην κατηγορία της ανίχνευσης εννοιών το 2026.