Οι μηχανές μιλούν μαζί μας καθημερινά

Οι μηχανές μιλούν μαζί μας καθημερινά

7' 53" χρόνος ανάγνωσης
Ακούστε το άρθρο

Δεν το αντιλαμβανόμαστε, αλλά βρισκόμαστε καθημερινά σε σχεδόν συνεχή επικοινωνία με κάποια ρομποτική μηχανή: όταν τηλεφωνούμε σε τράπεζα, όταν αναζητάμε πληροφορίες στο Διαδίκτυο, όταν γράφουμε ένα sms και το κείμενο διορθώνεται αυτόματα, όταν ακούμε τις φωνητικές οδηγίες από το σύστημα πλοήγησης του αυτοκινήτου, όταν μεταφράζουμε αυτόματα ένα κείμενο στο Google, όταν απολαμβάνουμε τη μηχανική διερμηνεία της συζήτησής μας με ετερόγλωσσο συνομιλητή μέσω Skype, όταν γράφουμε χειρόγραφα στην οθόνη του κινητού και λαμβάνουμε δακτυλογραφημένο κείμενο, όταν στοχεύουμε με την κάμερα του κινητού μια αλλόγλωσση πινακίδα και έχουμε άμεσα την ίδια πινακίδα γραμμένη στα ελληνικά…

Πίσω από αυτές τις υπηρεσίες κρύβονται εξαιρετικά πολύπλοκες τεχνολογίες που έχουν αναπτύξει ερευνητές σε όλον τον κόσμο, αλλά από πολύ νωρίς και στο πρώτο ελληνικό εκκολαπτήριο γλωσσικών τεχνολογιών, στο Ινστιτούτο Επεξεργασίας Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου «Αθηνά», που μετράει τρεις δεκαετίες ζωής και αναρίθμητα επιτεύγματα.

Ο διευθυντής του ινστιτούτου Βασίλης Κατσούρος, αφού εξηγεί στην «Κ» πώς μπορεί κάποιος να χρησιμοποιήσει το κινητό του για αυτόματη απομαγνητοφώνηση μιας συνέντευξης (ήταν εντυπωσιακή η άμεση μετατροπή της φωνής σε κείμενο επί της οθόνης του κινητού), πιάνει το νήμα της αποκωδικοποίησης των τεχνολογικών θαυμάτων του ινστιτούτου από την αρχή. «Ας δούμε πώς λειτουργεί ένας φωνητικός βοηθός, στον οποίο δίνουμε μια εντολή ή από τον οποίο ζητάμε μια πληροφορία. Η μηχανή ακούει τη φωνή, τη μετατρέπει σε κείμενο, ανασύρει από μια αξιόπιστη βάση δεδομένων –συνήθως τη Wikipedia– την απάντηση, συνθέτει ένα κείμενο και το μετατρέπει σε φωνή. Ολος αυτός ο κύκλος περιλαμβάνει τεχνολογίες πάνω στις οποίες εργάζεται το ινστιτούτο. Με τον ίδιο τρόπο γίνεται και η αυτόματη διερμηνεία. Θέλεις να επικοινωνήσεις με έναν Σλοβένο συνεργάτη σου; Μιλάς στη γλώσσα σου, η μηχανή μετατρέπει τη φωνή σε κείμενο, το μεταφράζει στα σλοβενικά και μετατρέπει το κείμενο σε φωνή, στην άλλη άκρη της γραμμής. Ζούμε σε μια ευτυχή συγκυρία, διαθέτουμε μεγάλη υπολογιστική ισχύ, ισχυρούς αλγορίθμους, πλούτο αξιόπιστων πηγών δεδομένων και γνώσης. Οι μηχανές μαθαίνουν γρήγορα από τα δεδομένα –γι’ αυτό γίνεται προσπάθεια για ανοικτά δεδομένα–, από την ποσότητα αλλά και την ποιότητα της γνώσης με την οποία τις τροφοδοτούμε», λέει ο κ. Κατσούρος. Ο κ. Στέλιος Πιπερίδης, πρόεδρος του Επιστημονικού Συμβουλίου του ΙΕΛ, ξεκαθαρίζει: «Για όλες τις τεχνολογίες σήμερα ισχύει το “garbage in, garbage out”, αν τροφοδοτήσεις τη μηχανή με σκουπίδια, θα πάρεις ως αποτέλεσμα σκουπίδια. Οι μηχανές εκπαιδεύονται όπως και τα παιδιά μας».

Οι μηχανές μιλούν μαζί μας καθημερινά-1

Ο φωνητικός βοηθός μετατρέπει την ερώτησή μας σε κείμενο, ανασύρει από δεδομένα την απάντηση, συντάσσει ένα κείμενο και το μετατρέπει σε φωνή.

«Στόχος είναι η ανθρώπινη επικοινωνία με τη βοήθεια των μηχανών. Εργαζόμαστε, για παράδειγμα, πάνω σε τεχνολογίες μετάφρασης της ελληνικής νοηματικής γλώσσας. Θα βιντεοσκοπείς με την κάμερα του κινητού τον άνθρωπο που μιλάει στη νοηματική και θα λαμβάνεις σε πραγματικό χρόνο σε κείμενο το περιεχόμενο των λεγομένων του. Αντίστροφα, θα μιλάς στο κινητό και ένα άβαταρ θα μετατρέπει την ομιλία σου σε νοηματική», τονίζει ο κ. Κατσούρος.

Θα κατανοούν σε βάθος τα συναισθήματά μας

Η τεχνολογία την οποία τελειοποιούν αυτή τη στιγμή στο ινστιτούτο επιτρέπει, όπως σημειώνουν οι κ. Κατσούρος και Πιπερίδης, η μηχανή να μπορεί να κατανοεί όχι μόνο φωνή αλλά και τα παραγλωσσικά στοιχεία, όπως οι δισταγμοί, οι εμφάσεις, τα «εεε», τα «χμμμ», το κούνημα του κεφαλιού, το χαμόγελο, οι κινήσεις των χεριών· «η μηχανή θα αναλύει όχι μόνο τη γλώσσα, αλλά και τη χροιά της φωνής, τις εκφράσεις, τις διαθέσεις, τα συναισθήματα», εξηγεί ο κ. Κατσούρος. «Θα πρέπει π.χ. το bot στο τηλεφωνικό κέντρο μιας τράπεζας να αναγνωρίζει τις αντιδράσεις του πελάτη και να τον εξυπηρετεί πριν εκείνος χάσει την υπομονή του. Επιδιώκουμε η μηχανή να εντοπίζει γλωσσικές δομές και πρότυπα, να πηγαίνει σε μεγαλύτερο βάθος κατανόησης», συμπληρώνει ο κ. Πιπερίδης. «Για παράδειγμα, ρωτάς τον φωνητικό βοηθό στο κινητό σου “ποια είναι η πρωτεύουσα του Περού;”, “η Λίμα”, απαντά, και “ποιος είναι ο πληθυσμός της;” συνεχίζεις, “9.752.000 κάτοικοι”. Δεν υπάρχει η λέξη Λίμα στην ερώτηση, αλλά το συνάγει από τη συντακτική ανάλυση της ερώτησης. Αυτό ακριβώς κάνει και το ανθρώπινο μυαλό», καταλήγει ο κ. Πιπερίδης. «Η δυνατότητα των bots να ανιχνεύουν τη διάθεση είναι επίσης καίρια κατά την “εξόρυξη απόψεων” στα κοινωνικά δίκτυα. Ενα από τα έργα μας είναι ο εντοπισμός φορτισμένων λέξεων, του μισαλλόδοξου λόγου. Αλλά και η αναγνώριση του βαθμού δυσλεξίας με την ανάλυση κειμένων· η ανίχνευση ρινικών αλλεργιών με την ανάλυση των αλλαγών στη φωνή· η ψηφιακή υποστήριξη και θεραπεία ατόμων με δυσκολίες στην ομιλία ύστερα από εγκεφαλικό ή ατύχημα· η αυτόματη συλλογή κειμένων, η ταξινόμηση και αυτόματη σύνταξη emails· η απομόνωση της φωνής σε περιβάλλοντα με έντονο θόρυβο, όπως στο κόκπιτ ενός αεροπλάνου· η άμεση μετατροπή και μετάφραση του θεατρικού λόγου σε κείμενο, για τους υπέρτιτλους. Ολα αυτά απαιτούν εξαιρετικά εύρωστα συστήματα», λέει ο κ. Κατσούρος.

Χτίζοντας τη μεγαλύτερη βάση γλωσσικών πόρων και τεχνολογιών

Το ΙΕΛ ασχολείται με τη μηχανική μετάφραση από την ίδρυσή του. Εχει αναπτύξει συστήματα, με ποικίλες τεχνολογίες, ξεκινώντας από τη νομοθετική και προχωρώντας στη στατιστική, και πλέον στη νευρωνική τεχνολογία. Οι ερευνητές του ινστιτούτου δουλεύουν πάνω σε ζευγάρια γλωσσών συλλέγοντας τον μεγαλύτερο δυνατό όγκο μεταφρασμένων προτάσεων με τις οποίες τροφοδοτούν τη μηχανή ώστε να την εκπαιδεύσουν. «Ενώ παλιότερα χρειαζόμασταν μήνες, ενδεχομένως και χρόνια για να δημιουργήσουμε ένα σύστημα μηχανικής μετάφρασης σε ένα ζεύγος γλωσσών, σήμερα μπορούμε να το κάνουμε πολύ γρήγορα, σε μέρες, εάν διαθέτουμε τα κατάλληλα δεδομένα», λέει ο κ. Πιπερίδης.

Η ικανότητα των μηχανών να μαθαίνουν από τα δεδομένα με τα οποία τροφοδοτούνται είναι κομβικής σημασίας στη μηχανική μετάφραση, ιδιαίτερα στην Ευρωπαϊκή Ενωση των 24 επίσημων γλωσσών. «Εφαρμόζεται η πολιτική στην Ευρώπη τα δεδομένα που παράγονται στην ήπειρο να χρησιμοποιούνται από ευρωπαϊκούς οργανισμούς και εταιρείες που αναπτύσσουν γλωσσικές τεχνολογίες. Ενα καλό και αξιόπιστο σύστημα μετάφρασης απαιτεί πολλά, καλά και αξιόπιστα δεδομένα», αναφέρει ο κ. Κατσούρος.

Οι μηχανές μιλούν μαζί μας καθημερινά-2

Η ομάδα ερευνητών του ΙΕΛ, που παράγει από τις πλέον πρωτοποριακές γλωσσικές καινοτομίες στον κόσμο.

Σύμφωνα με τον κ. Πιπερίδη, εδώ και πολλά χρόνια η Ευρώπη εργάζεται για την τεχνολογική της αυτονομία όσον αφορά τη μηχανική μετάφραση. Ολες οι δημόσιες υπηρεσίες σε όλα τα κράτη-μέλη της Ε.Ε. μπορούν πλέον να χρησιμοποιούν το ευρωπαϊκό σύστημα μηχανικής μετάφρασης eTranslation, το οποίο εξελίσσεται και βελτιώνεται. Οι μηχανές εκπαιδεύονται πάνω στην εξειδικευμένη μετάφραση ανάλογα με το αντικείμενο (οικονομία, Δικαιοσύνη, Υγεία, Παιδεία, μεταφορές κ.ά.). Τέσσερις οργανισμοί στην Ευρώπη, μεταξύ των οποίων το ΙΕΛ, υποστηρίζουν την εκπαίδευση των νέων αυτών μηχανών νευρωνικής μηχανικής μετάφρασης για όλες τις χώρες της Ε.Ε., και επιπλέον για τη Νορβηγία και την Ισλανδία. Το ΙΕΛ έχει αναλάβει όλη τη ΝΑ Ευρώπη (Αυστρία, Πολωνία, Σλοβακία, Σλοβενία, Ουγγαρία, Τσεχία, Ρουμανία, Βουλγαρία, Κροατία, Ελλάδα, Κύπρο).

Αυτή τη στιγμή οι ερευνητές του ΙΕΛ διερευνούν το πώς μια μηχανή μπορεί αυτόματα να καταλάβει τι κατανόησε ένας άνθρωπος διαβάζοντας ένα κείμενο. «Με τεχνολογίες καταγραφής της οφθαλμοκίνησης κατά την ανάγνωση, αναλύοντας τις στάσεις του ματιού πάνω σε λέξεις και φράσεις, και ταυτόχρονα τις απαντήσεις που έχουν δώσει παιδιά, ανιχνεύεται ο βαθμός κατανόησης του κειμένου. Επίσης, μπορεί να αξιολογηθεί η ορθότητα μιας απάντησης και εν γένει η παραγωγή γραπτού λόγου από μαθητές», λέει ο κ. Κατσούρος. «Με την τεχνολογία καταγραφής της οφθαλμοκίνησης θα μπορούσε επίσης να γίνει αξιολόγηση διδακτικών βιβλίων και να εντοπιστούν δυσνόητα σημεία», προσθέτει ο κ. Πιπερίδης. «Υπάρχουν, ακόμη, τεχνολογίες απλοποίησης κειμένων, ανάλογα με τον αποδέκτη. Πρόκληση αποτελεί η δημιουργία μιας simplified wikipedia στα ελληνικά».

Το ΙΕΛ έχει μακριά ιστορία στην εισαγωγή νέων τεχνολογιών στα σχολεία. Ανέπτυξε το πρώτο σύστημα εκμάθησης της ελληνικής με πολυμέσα (Λογομάθεια, 1993), συμμετείχε στη δημιουργία του πρώτου σχολικού δικτύου (Τηλέμαχος, 1994), δημιούργησε το μεγαλύτερο σώμα κειμένων νέας ελληνικής (Εθνικός Θησαυρός της Ελληνικής Γλώσσας, 1996 έως σήμερα), τη μηχανή αναζήτησης ψηφιακού εκπαιδευτικού οπτικοακουστικού υλικού στα σχολεία (Φωτόδεντρο) στην e-υπηρεσία του υπουργείου Παιδείας (2013).

Δημιούργησε ψηφιακές εφαρμογές για την εκμάθηση της ελληνικής από αλλόγλωσσους (Φιλογλωσσία), με βάση τα αγγλικά, γαλλικά, γερμανικά, ισπανικά, δανικά, ρωσικά, κινεζικά, καθώς και ένα σύστημα εκμάθησης της ελληνικής για επισκέπτες στη χώρα μας, έναν βοηθό γλώσσας στο κινητό. Επίσης, ψηφιακά λεξικά για τον χρήστη και ηλεκτρονικά λεξικά για τον υπολογιστή με στόχο την ορθογραφική –αλλά πλέον και συντακτική– διόρθωση κειμένου.

Ακόμη «έχτισε» το ελληνικό σκέλος της πανευρωπαϊκής ερευνητικής υποδομής γλωσσικών πόρων, τεχνολογιών και υπηρεσιών (CLARIN), και εργάζεται πάνω στην επέκταση και διάθεσή του σε όλα τα εκπαιδευτικά και ερευνητικά ιδρύματα της χώρας. Η υποδομή διαθέτει και τον Εθνικό Θησαυρό Ελληνικής Γλώσσας, το μεγαλύτερο αποθετήριο ελληνικών δομημένων κειμένων, που διαρκώς διευρύνεται και όπου αποτυπώνεται η εξέλιξη της γλώσσας στον χρόνο.

Η Ιnnoetics και η Samsung

Το ΙΕΛ ιδρύθηκε το 1991 από τη σύμπραξη δύο ανεξάρτητων ερευνητικών ομάδων, της EUROTRA, που ασχολούνταν με το σύστημα μηχανικής μετάφρασης της Ε.Ε., και της ομάδας Eπεξεργασίας Σήματος του ΕΜΠ, την οποία διηύθυνε ο αείμνηστος καθηγητής του ΕΜΠ και ιδρυτής του ΙΕΛ Γιώργος Καραγιάννης (καθηγητής και των κ. Κατσούρου και Πιπερίδη). Γλωσσολόγοι και μηχανικοί Πληροφορικής, που ασχολούνταν με την επεξεργασία της φωνής, συνεργάστηκαν για την ανάπτυξη συστημάτων αυτόματης μετάφρασης και γλωσσικών εργαλείων. Το πρώτο μεγάλο έργο γλωσσικής τεχνολογίας του ΙΕΛ ήταν ο «Λόγος» και το διαδέχθηκε ο «Διάλογος». Αναπτύχθηκαν τα πρώτα συστήματα αναγνώρισης και σύνθεσης φωνής, συστήματα μηχανικής μετάφρασης, διόρθωσης ορθογραφικών λαθών, ηλεκτρονικά λεξικά, συλλογές γραπτού λόγου, λογισμικά εκμάθησης της ελληνικής για μαθητές της μουσουλμανικής μειονότητας (το πρόγραμμα στάθηκε αφορμή για τη δημιουργία του παραρτήματος του ΙΕΛ στην Ξάνθη, το 1996), λεξικά νοηματικής γλώσσας. Τεχνολογίες που έδωσαν μια σειρά από επιτυχημένα εμπορικά προϊόντα. Το 2001 το ΙΕΛ άρχισε να ιδρύει τεχνοβλαστούς, εταιρείες που εκμεταλλεύονταν τις τεχνολογίες που δημιουργούνταν στο ινστιτούτο. Από τις μεγαλύτερες επιτυχίες του ινστιτούτου θεωρείται η εξαγορά, το 2017, του τεχνοβλαστού Innoetics από τη Samsung Electronics. H Innoetics ανέπτυσσε τεχνολογίες μετατροπής κειμένου σε φωνή και συστήματα φυσικής επικοινωνίας ανθρώπου και μηχανής, με διεθνή αναγνωρισιμότητα. Η εξαγορά της αποτέλεσε τεράστια επιτυχία όχι μόνο για το Ερευνητικό Κέντρο «Αθηνά», αλλά και για το σύνολο του ελληνικού ερευνητικού ιστού.

Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή