Ομάδα Επεξεργασίας Φυσικής Γλώσσας

Τμήμα Πληροφορικής - Οικονομικό Πανεπιστήμιο Αθηνών

H Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ

Home

Η Ομάδα Επεξεργασίας Φυσικής Γλώσσας του ΟΠΑ αναπτύσσει αλγορίθμους, μοντέλα και συστήματα που επιτρέπουν στoυς υπολογιστές να επεξεργάζονται και να παράγουν κείμενα φυσικής γλώσσας.

Τα τρέχοντα ερευνητικά ενδιαφέροντα της ομάδας περιλαμβάνουν:
  • συστήματα ερωταποκρίσεων φυσικής γλώσσας για βάσεις δεδομένων, οντολογίες, συλλογές εγγράφων και τον Παγκόσμιο Ιστό, ιδιαίτερα συστήματα ερωταποκρίσεων για βιοϊατρικά δεδομένα,
  • παραγωγή κειμένων από βάσεις δεδομένων και οντολογίες, ιδιαίτερα οντολογίες του Σημασιολογικού Ιστού,
  • κατάταξη κειμένων, συμπεριλαμβανομένης της διήθησης ανεπιθύμητου περιεχομένου,
  • εξαγωγή πληροφοριών και εξόρυξη γνώμης, συμπεριλαμβανομένης της ανάλυσης νομικών κειμένων και της ανάλυσης συναισθήματος,
  • εργαλεία επεξεργασίας φυσικής γλώσσας για τα Ελληνικά, για παράδειγμα συντακτικούς αναλυτές και συστήματα αναγνώρισης ονομάτων οντοτήτων,
  • μηχανική μάθηση στην επεξεργασία φυσικής γλώσσας, ιδιαίτερα βαθιά μάθηση.

Η ομάδα είναι μέρος του Εργαστηρίου Επεξεργασίας Πληροφοριών του Τμήματος Πληροφορικής του Οικονομικού Πανεπιστημίου Αθηνών.

Η ομάδα συνδιοργανώνει το 1ο Θερινό Σχολείο Επεξεργασίας Φυσικής Γλώσσας στην Αθήνα (AθNLP 2019). Επίσης συνδιοργάνωσε το 12th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2009) και τους διαγωνισμούς Large Scale Hierarchical Text Classification (το LSHTC3 ήταν το ECML/PKDD 2012 Discovery Challenge), BioASQ και SemEval task on Aspect-Based Sentiment Analysis. Η ομάδα έλαβε βραβείο στο διαγωνισμό BioASQ του 2018, όπου πρώτευσε σε τρεις από τις πέντε δέσμες αξιολόγησης ανάκτησης εγγράφων και σε όλες τις (πέντε) δέσμες αξιολόγησης ανάκτησης αποσπασμάτων. Τα συστήματά μας κατετάγησαν επίσης στις θέσεις 1, 2, 3 και 5 μεταξύ περίπου 60 συστημάτων στον διαγωνισμό ImageCLEFmed Caption 2019.

Προτεινόμενες πτυχιακές και διπλωματικές εργασίες.