Η ΑΙ διαβάζει Στίβεν Κινγκ – Ειδικοί μιλούν στην «Κ»

Η ΑΙ διαβάζει Στίβεν Κινγκ – Ειδικοί μιλούν στην «Κ»

Πειρατικά βιβλία εκπαιδεύουν την τεχνητή νοημοσύνη

3' 42" χρόνος ανάγνωσης
Ακούστε το άρθρο

Μέχρι πρότινος, υπήρχαν ισχυρές ενδείξεις (ικανές να επισύρουν μηνύσεις από συγγραφείς και εκδότες), οι οποίες όμως πρόσφατα επιβεβαιώθηκαν από ένα ρεπορτάζ του περιοδικού Atlantic: οι εφαρμογές τεχνητής νοημοσύνης, που παράγουν περιεχόμενο υψηλού γλωσσικού επιπέδου, εκπαιδεύονται «διαβάζοντας» και πειρατικά βιβλία στο Διαδίκτυο.

Το Chat GPT είναι η δημοφιλέστερη τέτοια εφαρμογή, ωστόσο, το Atlantic επικεντρώνεται σε ομόλογές της, όπως το LLaMA του τεχνολογικού κολοσσού Meta, το BloombergGPT του ομώνυμου μιντιακού ομίλου κ.ά. Οι δύο εφαρμογές βασίστηκαν στην ανάγνωση δεκάδων χιλιάδων βιβλίων, που έχουν καταχωνιαστεί σε βάσεις δεδομένων ανοιχτού κώδικα, όπως η Books3, με τη μορφή απλού κειμένου, χωρίς δηλαδή υποχρεωτικές ενδείξεις για τον συγγραφέα, τον εκδότη ή τα πνευματικά τους δικαιώματα.

Τι «διαβάζει», λοιπόν, η τεχνητή νοημοσύνη; Το LLaMA εκπαιδεύτηκε μεταξύ άλλων με έργα των Τζορτζ Σόντερς, Στίβεν Κινγκ και Ζέιντι Σμιθ, ενώ στο Books3 το Atlantic εντόπισε συνολικά πάνω από 170.000 βιβλία, το ένα τρίτο των οποίων είναι λογοτεχνία, γραμμένη από τους Ελενα Φεράντε, Χαρούκι Μουρακάμι, Τζόναθαν Φράνζεν, Μάργκαρετ Ατγουντ κ.ά.

Αραγε στην «ύλη» περιλαμβάνονται και ελληνικοί τίτλοι; Υπάρχει λόγος να θορυβηθούν οι εγχώριοι εκπρόσωποι του βιβλίου; Ο Γιωργανδρέας Ζάννος, διευθυντής του Οργανισμού Συλλογικής Διαχείρισης Εργων του Λόγου, πιστεύει ότι είναι «πολύ πιθανόν» τέτοια προγράμματα να έχουν εκπαιδευθεί και με ελληνικά πειρατικά βιβλία. «Ο μεγάλος κίνδυνος», εξηγεί, «είναι να έχουμε για ακόμη μία φορά εκμετάλλευση περιεχομένου από τρίτους, χωρίς να αμείβονται οι δημιουργοί του και οι εκδότες, όπως έχει γίνει με την αξιοποίηση ειδησεογραφικού περιεχομένου από μεγάλες πλατφόρμες».

Η ΑΙ διαβάζει Στίβεν Κινγκ – Ειδικοί μιλούν στην «Κ»-1
Η Ζέιντι Σμιθ και ο Στίβεν Κινγκ είναι μερικοί μόνον από τους συγγραφείς με των οποίων τα βιβλία «εκπαιδεύονται» οι διάφορες εφαρμογές τεχνητής νοημοσύνης.

Η ΑΙ διαβάζει Στίβεν Κινγκ – Ειδικοί μιλούν στην «Κ»-2
[A.P./PATRICK SEMANSKY]

«Ο μεγάλος κίνδυνος είναι να έχουμε πάλι εκμετάλλευση περιε- χομένου από τρίτους, χωρίς να αμείβονται οι δημιουργοί του», λέει ο Γιωργανδρέας Ζάννος.

Η τρέχουσα σχετική συζήτηση, σημειώνει ο κ. Ζάννος, επικεντρώνεται στο ότι η απλή εισαγωγή ενός έργου σε ένα πρόγραμμα για σκοπούς εκμάθησης συνιστά αναπαραγωγή και άρα προϋποθέτει άδεια χρήσης. Πάντως, όσοι παραγωγοί περιεχομένου θέλουν να απαγορεύσουν την επεξεργασία του από πλατφόρμες, μπορούν να το κάνουν, στην Ευρώπη τουλάχιστον, αξιοποιώντας τους διαθέσιμους μηχανισμούς της ευρωπαϊκής οδηγίας 2019/790 για την εξόρυξη δεδομένων (data mining). «Και βέβαια», καταλήγει ο κ. Ζάννος, «θα πρέπει οπωσδήποτε να υιοθετηθούν υποχρεώσεις διαφάνειας για τις πλατφόρμες που χρησιμοποιούν τεχνητή νοημοσύνη, ώστε να αποκαλύπτουν ποια έργα χρησιμοποιούν για την εκπαίδευση των αλγορίθμων τους».

Ο σύμβουλος ψηφιακών εκδόσεων Μιχάλης Καλαμαράς παρατηρεί ότι τουλάχιστον το Chat GPT είναι πολύ αποτελεσματικό στην παραγωγή εκτενούς περιεχομένου στην ελληνική γλώσσα. «Αρα ο αλγόριθμος έχει εκπαιδευθεί και με ελληνικό περιεχόμενο, το οποίο σημαίνει και βιβλία προερχόμενα από πειρατικές πηγές», εξηγεί. Αν όμως κάποιος εκδότης, προσθέτει ο κ. Καλαμαράς, θέλει το βιβλίο του να αξιοποιείται με τέτοιο τρόπο, θα πρέπει να γίνεται έναντι εύλογης αμοιβής, η οποία προβλέπεται από την ευρωπαϊκή νομοθεσία. Οσον αφορά τις ΗΠΑ, ο Μιχάλης Καλαμαράς εκτιμά πως οι αγωγές που ασκούνται σε εφαρμογές τεχνητής νοημοσύνης ενδέχεται να αναγκάσουν τις εταιρείες να αποκαλύψουν πώς λειτουργεί ο αλγόριθμός τους. Ο οποίος δεν είναι, βέβαια, τυφλός. «Σίγουρα γίνεται μια αξιολόγηση και ένα φιλτράρισμα των πηγών», σχολιάζει ο κ. Καλαμαράς, «αλλιώς μια πλατφόρμα θα μπορούσε να παράγει αντισημιτικό λόγο ή να θεωρεί ισάξια την “Καθημερινή” με ένα site που ισχυρίζεται ότι η γη είναι επίπεδη».

Ο εκδότης Αργύρης Καστανιώτης πιστεύει ότι το πρόβλημα δεν εντοπίζεται τόσο στην παραβίαση του copyright από μηχανές που απλώς διαβάζουν ό,τι βρίσκουν διαθέσιμο, όσο σε ένα ρυθμιστικό πλαίσιο που επιτρέπει σε κολοσσούς όπως η Google να εκμεταλλεύονται δεδομένα και περιεχόμενο που παράγουν οι χρήστες, φαινόμενο που περιγράφεται στο βιβλίο της Σοσάνα Ζούμποφ «Η εποχή του κατασκοπευτικού καπιταλισμού». «Η μηχανή δεν διαβάζει λογοτεχνία, αλλά δυαδικό κώδικα», λέει ο κ. Καστανιώτης. «Δεν την αφορά αν είναι λυρική μια περιγραφή της Ελενα Φεράντε, αν ένα κείμενο αφορά ένα ηλιοβασίλεμα ή αν είναι πιο δοκιμιακό, αλλά τα μαθηματικά που βρίσκονται από πίσω. Αυτό που φοβόμαστε, λοιπόν, είναι η ανεξέλεγκτη χρήση των δεδομένων από μεγάλες εταιρείες, στην οποία πρέπει να μπει ένα ρυθμιστικό πλαίσιο για να μην ξεφύγει σε άλλα επίπεδα η κατάσταση».

Καθησυχαστικός στο θέμα της λογοτεχνικής εκπαίδευσης των αλγορίθμων ήταν και ο ίδιος ο Στίβεν Κινγκ, ο οποίος σχολίασε το ρεπορτάζ του Atlantic με άρθρο του στο περιοδικό. Η πιθανότητα μιας μηχανής που δημιουργεί πραγματική λογοτεχνία τού προκαλεί «σαγηνευτικό τρόμο», γνωρίζει όμως ότι δεν μπορεί να την αποτρέψει. «Θα απαγόρευα τη διδασκαλία (αν αυτή είναι η σωστή λέξη) των ιστοριών μου στους υπολογιστές; Οχι, ακόμη και αν μπορούσα», έγραψε ο Αμερικανός συγγραφέας. Και σύγκρινε μια τέτοια πράξη με την απόπειρα να εξουσιάσει κάποιος την παλίρροια.

Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή
MHT