Εισαγωγή

Το σύστημα εξαγωγής συναισθήματος από κείμενα αποτελεί μια εφαρμογή τεχνολογιών επεξεργασίας φυσικής γλώσσας αιχμής για την Ελληνική γλώσσα. Ανεπτυγμένο εξ’ ολοκλήρου από Έλληνες ειδικούς στον τομέα της επεξεργασίας φυσική γλώσσας η εφαρμογή μπορεί να εξάγει περικειμενική πολικότητα (polarity) ή συναίσθημα (sentiment) από κείμενα τα οποία εμπίπτουν σε μια ευρεία περιοχή θεματικών περιοχών. Η εξαγωγή συναισθήματος μπορεί να είναι συνολική (σε επίπεδο εγγράφου) ή εστιασμένη σε επίπεδο οντοτήτων (π.χ. προσώπων ή οργανισμών/εταιριών/προϊόντων). Τέλος, υπάρχει η δυνατότητα προσαρμογής των θεματικών περιοχών, ώστε να καλυφθούν οι ανάγκες ειδικευμένων εφαρμογών. Το προϊόν «Polarity Plus» υποστηρίζει τις ακόλουθες λειτουργίες: 1. Αναγνώριση πολικότητας (θετικής, αρνητικής, ουδέτερης) σε επίπεδο φράσης, για ονόματα οντοτήτων που έχουν αναγνωριστεί. 2. Αναγνώριση πολικότητας (θετικής, αρνητικής, ουδέτερης) σε επίπεδο εγγράφου. Αναγνώριση πολικότητας Τα αρθρώματα(modules) που αφορούν την αναγνώριση της πολικότητας βασίζονται σε έτοιμες βιβλιοθήκες, ενώ υλοποιούνται από 12.585 γραμμές κώδικα στην γλώσσα προγραμματισμού Tcl. Για κάθε κατηγορία γίνεται χρήση συγκεκριμένων λέξεων και εκφράσεων ώστε το σύστημα να εκπαιδευτεί με βάση τη συγκεκριμένη ορολογία και ονοματολογία. Τα αρθρώματα κάνουν χρήση ηλεκτρονικού μορφολογικού λεξικού, καθώς και λεξικού πολικότητας.

Γενικές τεχνικές προδιαγραφές

H πλατφόρμα «Polarity Plus» αποτελείται από ένα σύνολο συναρτήσεων και βιβλιοθηκών, ανεπτυγμένων κυρίως στις γλώσσες προγραμματισμού C, C++, Tcl/Tk, ενώ μικρότερα τμήματα έχουν γραφεί στις γλώσσες προγραμματισμού Java, Python και Perl. Το προϊόν «Polarity Plus» κάνει επίσης χρήσης ηλεκτρονικού μορφολογικού λεξικού της ελληνικής γλώσσας.