Ομάδα Επεξεργασίας Φυσικής Γλώσσας

Τμήμα Πληροφορικής - Οικονομικό Πανεπιστήμιο Αθηνών

H Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ

Home

Η Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ αναπτύσσει αλγορίθμους, μοντέλα και συστήματα που επιτρέπουν στoυς υπολογιστές να επεξεργάζονται και να παράγουν κείμενα φυσικής γλώσσας.

Τα τρέχοντα ερευνητικά ενδιαφέροντα της ομάδας περιλαμβάνουν:
  • ερωταποκρίσεις φυσικής γλώσσας, ιδιαίτερα για βιοϊατρικές συλλογές εγγράφων,
  • παραγωγή κειμένων από δομημένα δεδομένα και πιο πρόσφατα από ιατρικές εικόνες,
  • κατάταξη κειμένων, συμπεριλαμβανομένης της διήθησης ανεπιθύμητου περιεχομένου,
  • εξαγωγή πληροφοριών και εξόρυξη γνώμης, συμπεριλαμβανομένης της ανάλυσης νομικών κειμένων και της ανάλυσης συναισθήματος,
  • εργαλεία επεξεργασίας φυσικής γλώσσας για τα Ελληνικά,
  • μηχανική μάθηση στην επεξεργασία φυσικής γλώσσας, ιδιαίτερα βαθιά μάθηση,
  • επεξεργασία φυσικής γλώσσας στην ψηφιακή επιμέλεια.

Η ομάδα είναι μέρος του Εργαστηρίου Επεξεργασίας Πληροφοριών του Τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών.

Η ομάδα συνδιοργάνωσε τον διαγωνισμό SemEval Toxic Spans Detection (2021), το 11ο Συνέδριο Τεχνητής Νοημοσύνης της Ελληνικής Εταιρείας Τεχνητής Νοημοσύνης (ΣΕΤΝ 2020), το 2nd Workshop on Natural Legal Language Processing (NLLP 2020) στο KDD 2020, το 1st Athens Natural Language Processing Summer School (AthNLP 2019), το συνέδριο EACL 2009 στην Αθήνα, καθώς και τους διαγωνισμούς Large Scale Hierarchical Text Classification (το LSHTC3 ήταν το ECML/PKDD 2012 Discovery Challenge), BioASQ και SemEval Aspect-Based Sentiment Analysis (2014, 2015, 2016). Λάβαμε άλλο ένα βραβείο στον διαγωνισμό BioASQ του 2019, όπου η ομάδα μας πρώτευσε στις τέσσερις δέσμες αξιολόγησης ανάκτησης εγγράφων και αποσπασμάτων στις οποίες διαγωνιστήκαμε. Λάβαμε επίσης βραβείο στον διαγωνισμό BioASQ του 2020, επειδή η ομάδα μας κατετάγη στις κορυφαίες 2 θέσεις σε 4 από τις 5 δέσμες αξιολόγησης ανάκτησης εγγράφων και στην 1η θέση σε 4 από τις 5 δέσμες αξιολόγησης ανάκτησης αποσπασμάτων εγγράφων. Η ομάδα έλαβε επίσης βραβείο στον διαγωνισμό BioASQ του 2019, όπου πρώτευσε στις τέσσερις δέσμες αξιολόγησης ανάκτησης εγγράφων και αποσπασμάτων στις οποίες διαγωνίστηκε. Τα συστήματά μας κατετάγησαν επίσης στις θέσεις 1, 2, 3 και 5 μεταξύ περίπου 60 συστημάτων στον διαγωνισμό ImageCLEFmed Caption 2019, καθώς και στις θέσεις 1, 2, 6 μεταξύ 49 συστημάτων του ImageCLEFmed Caption 2020 (δείτε και αυτή την ανακοίνωση του ΟΠΑ).