Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»

Οι εικονογραφήσεις που θα δείτε σκρολάροντας προέκυψαν από «εντολές» του «Κ» σε ένα πρόγραμμα τεχνητής νοημοσύνης. Πρόκειται για το λυκόφως της τέχνης, όπως φοβούνται κάποιοι, ή για την αυγή μιας νέας δημιουργικής εποχής;

10' 41" χρόνος ανάγνωσης
Ακούστε το άρθρο

Ο Αντρέ Γκουανταμούζ είναι αναπληρωτής καθηγητής στο Πανεπιστήμιο του Σάσεξ, διδάσκει νόμους περί πνευματικής ιδιοκτησίας και τα τελευταία χρόνια ερευνά τα νομικά ζητήματα που εγείρει η χρήση της τεχνητής νοημοσύνης στις τέχνες. Τον τελευταίο ενάμιση χρόνο, η δουλειά του έχει αποκτήσει μεγαλύτερο ενδιαφέρον, καθώς έχουν κάνει την εμφάνισή τους κάποια πολύ αποτελεσματικά εργαλεία τεχνητής νοημοσύνης, τα οποία μπορούν, μέσω μιας γραπτής υπόδειξης, να δημιουργούν αυτόματα τις δικές τους πρωτότυπες εικόνες. 

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-1
Σουρεαλιστικές εικόνες, αποτέλεσμα των προσπαθειών του προγράμματος να απεικονίσει ένα ρομπότ και ένα μικρό κορίτσι που παίζουν με ανθρώπινες κούκλες.

Μπορεί να το κάνει οποιοσδήποτε, ξεκινώντας από το πιο απλό εργαλείο, το Dall-Ε Mini (που μετονομάστηκε σε Craiyon): σκεφτείτε μια πρόταση, γράψτε τη στο ειδικό πεδίο και αναμείνατε για λίγο. Είναι βέβαιο ότι το αποτέλεσμα θα σας εκπλήξει, ενώ υπάρχει περίπτωση να κολλήσετε, όπως εγώ, παίζοντας με τις ώρες. Η τέχνη που παράγει η τεχνητή νοημοσύνη είναι εντυπωσιακή. Ο Γκουανταμούζ, ωστόσο, σκέφτηκε να κάνει κάτι πολύ διαφορετικό. Πήγε σε ένα άλλο εργαλείο, συγκεκριμένα στο Midjourney, και ζήτησε από τη μηχανή να του φτιάξει μια εικόνα στο στιλ του γνωστού για τα μετα-αποκαλυπτικά τοπία ζωγράφου Σάιμον Στάλεναγκ. Έπειτα ανάρτησε την εικόνα στο Twitter και ακολούθησε αυτό που συμβαίνει συνήθως στο Twitter όταν ανεβαίνει κάτι που ερεθίζει το δημόσιο αίσθημα: θόρυβος. Αρκετοί έσπευσαν να κατηγορήσουν τον Γκουανταμούζ ότι γίνεται προκλητικός. Εκείνος αμύνθηκε, απαντώντας ότι έκανε απλώς ένα πείραμα. Διάλεξε το έργο του Στάλεναγκ γιατί ήταν πολύ αναγνωρίσιμο και γιατί ο δημιουργός του έχει ταχθεί ξεκάθαρα εναντίον αυτών των εργαλείων. Ο στόχος του, όπως είπε, ήταν να αναδείξει ένα σοβαρό πρόβλημα που εγείρουν αυτά τα εργαλεία: ποιος έχει τα πνευματικά δικαιώματα του έργου που παρήγαγε η τεχνητή νοημοσύνη;

Ο Στάλεναγκ δεν έδειξε να πείθεται από τις εξηγήσεις του καθηγητή και μεταξύ άλλων έγραψε στο Twitter: «Έτσι κι αλλιώς, πιστεύω ότι η τέχνη τεχνητής νοημοσύνης, όπως και τα NFTs, είναι μια τεχνολογία που ενισχύει όλα τα απαίσια που μισώ ως ένας καλλιτέχνης που ζει σε αυτή τη φεουδαρχική καπιταλιστική δυστοπία, όπου κάθε υποσχόμενο νέο εργαλείο καταλήγει πάντοτε στα χέρια των λιγότερο ευφάνταστων και των πιο άπληστων και αδίστακτων ανθρώπων». Η συζήτηση για τα πνευματικά δικαιώματα των έργων της τεχνητής νοημοσύνης, αν και πολύ σοβαρή, αναβλήθηκε επ’ αόριστον. Τώρα έχουμε άλλα, ακόμα πιο σκοτεινά ζητήματα να μας απασχολούν. 

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-2
Μια μοτοσικλέτα που την οδηγεί ένας πίθηκος ντελιβεράς 

Δύσκολα όρια

Η αρχή έγινε τον Ιανουάριο του 2021, όταν η εταιρεία OpenAI, με έδρα το Σαν Φρανσίσκο, ανακοίνωσε το λογισμικό DALL-E (η ονομασία του παραπέμπει στο πάντρεμα της παιδικής ταινίας WALL-E της Pixar και του σουρεαλιστή ζωγράφου Σαλβαντόρ Νταλί), το οποίο, έχοντας πρόσβαση σε εκατομμύρια χαρακτηρισμένες εικόνες του διαδικτύου, μπορούσε μέσα σε πολύ λίγο χρόνο να παραδίδει στον κόσμο νέες εικόνες, αφού είχε βάλει σε λειτουργία το μοντέλο της μηχανικής μάθησής του. Σε λιγότερο από δύο χρόνια, εμφανίστηκαν πολλά άλλα ανταγωνιστικά λογισμικά, με πιο γνωστά το Midjourney και το Stable Diffusion. Τον περασμένο Απρίλιο, η OpenAI κυκλοφόρησε σε περιορισμένο αριθμό χρηστών μια αρκετά βελτιωμένη έκδοση, η οποία βασίζεται σε πολύ περισσότερα δεδομένα, το DALL-E 2. Ο κώδικας του λογισμικού δεν έχει δημοσιευτεί για λόγους ασφαλείας, λένε οι υπεύθυνοι της εταιρείας. Και, όταν μιλούν για ασφάλεια, εννοούν κάτι που ήδη έχουν αντιληφθεί όσοι χρησιμοποιούν αντίστοιχα λογισμικά ανοιχτού κώδικα. Τα μοντέλα αυτά αντλούν εικόνες από το διαδίκτυο, οπότε δεν υπάρχει περιορισμός στα πράγματα που μπορεί να φανταστεί και να ζητήσει κάποιος από τις μηχανές. 

Βρισκόμαστε μπροστά σε ένα πρωτοφανές γεγονός με τρομερές προεκτάσεις – κατ’ αρχάς για όσους βγάζουν το ψωμί τους από την παραγωγή εικόνων (εικονογράφοι, φωτογράφοι, ζωγράφοι κ.ά.). Κατά τα άλλα, ανά πάσα στιγμή μπορεί να δούμε συνθετικές εικόνες προπαγάνδας, ψευδών ειδήσεων ή και εκδικητικής πορνογραφίας, να δούμε να εκβιάζονται άνθρωποι και να καταστρέφονται προσωπικότητες. Και μπροστά σε όλα αυτά, κανείς δεν είναι προετοιμασμένος – οι νομοθέτες μας θα πρέπει να ενημερωθούν και να κινητοποιηθούν άμεσα, όπως έγινε στις Ηνωμένες Πολιτείες το καλοκαίρι, όταν μέλη του Κογκρέσου παρακολούθησαν ένα συνέδριο τεχνητής νοημοσύνης από ειδήμονες του Πανεπιστημίου Στάνφορντ ειδικά για εκείνους.

Παράλληλα, αυτή η νέα πραγματικότητα μας δίνει τροφή για σκέψη: ποια είναι η δύναμη των μηχανών και ποιο το μέλλον της συμβίωσής μας. Αν οι μηχανές μπορούν με απλές προτάσεις να παραδίδουν τόσο καλά έργα, μήπως είμαστε κοντά σε αυτό που έχει ονομαστεί «μοναδικότητα», στη στιγμή δηλαδή που οι μηχανές μάς ξεπερνούν σε ευφυΐα και δημιουργικότητα;

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-3
Ρομποτικός ιερέας που παίζει σκάκι με τον Θεό.

Μηχανές υπερνοημοσύνης

Το 1965, ένας Βρετανός μαθηματικός, ο Ίρβινγκ Τζον Γκουντ, συνάδελφος του Άλαν Τιούρινγκ στο Μπλέτσλι Παρκ, όπου αποκρυπτογραφήθηκαν οι απόρρητες επικοινωνίες των ναζί, δημοσίευσε ένα εκτενές επιστημονικό άρθρο με τίτλο Εικασίες για την πρώτη υπερνοήμων μηχανή. Ο Γκουντ προέβλεψε λανθασμένα ότι ο άνθρωπος θα φτιάξει μια υπερνοημοσύνη κατά τη διάρκεια του εικοστού αιώνα, αλλά με τη θεωρία του άνοιξε τον δρόμο για την κυρίαρχη μορφή τεχνητής νοημοσύνης που έχουμε σήμερα, τη μηχανική μάθηση και τα νευρωνικά δίκτυα. Είναι αυτός που πρώτος μίλησε για την «έκρηξη της νοημοσύνης»: «Ας ονομάσουμε υπερνοήμων μια μηχανή που ξεπερνά όλες τις διανοητικές ικανότητες ακόμα και του πιο έξυπνου ανθρώπου. Από τη στιγμή που ο σχεδιασμός αυτής της μηχανής θα απορρέει από αυτές τις διανοητικές ικανότητες, η υπερνοήμων μηχανή θα μπορεί να σχεδιάσει ακόμα καλύτερες μηχανές· τότε είναι που θα συμβεί, χωρίς αμφιβολία, μια “έκρηξη νοημοσύνης”, και η νοημοσύνη του ανθρώπου θα μείνει πια πολύ πίσω. Ως αποτέλεσμα, η πρώτη υπερνοήμων μηχανή θα είναι η τελευταία εφεύρεση που θα κάνει ποτέ ο άνθρωπος, υπό την προϋπόθεση ότι η μηχανή αυτή θα είναι αρκούντως πειθήνια ώστε να μας λέει πώς να την κρατούμε υπό έλεγχο».

Σχεδόν εξήντα χρόνια μετά το άρθρο του Γκουντ, αρκετά επιφανείς τεχνολόγοι, όπως ο Ρέι Κέρζουελ, διατείνονται ότι ο άνθρωπος αυτός είχε δίκιο. Μπορεί να βιάστηκε να προβλέψει την υπερνοημοσύνη, αλλά αυτή η έκρηξη που περιέγραψε γίνεται πλέον όλο και πιο ορατή. Στον αντίποδα, άλλοι ειδικοί λένε ότι είναι πολύ πρώιμο να πει κανείς ότι δημιουργήσαμε την «τελευταία μας εφεύρεση», την αληθινά σκεπτόμενη μηχανή. Οι εφαρμογές που βλέπουμε δεν είναι παρά «στοχαστικοί παπαγάλοι» που επαναλαμβάνουν με μεγάλη ακρίβεια αυτά που τους μαθαίνουμε. Όπως λέει και ο Κέβιν Ρουζ στους New York Times, το ζητούμενο δεν είναι να πάρουμε θέση υπέρ του ενός ή του άλλου, αλλά να καταλάβουμε καλύτερα ποιες είναι οι συγκεκριμένες πρόοδοι της τεχνητής νοημοσύνης –όπως για παράδειγμα στην παραγωγή συνθετικών εικόνων– και πώς θα επηρεάσουν βραχυπρόθεσμα και μακροπρόθεσμα τη ζωή μας. 

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-4
Έτσι φαντάστηκε το πρόγραμμα μια βραδιά χορού με βασιλικό πρωτόκολλο.

Πικάσο μετά μουσικής

Υπάρχουν λόγοι να είμαστε σκεπτικοί απέναντι σε όλα αυτά, αλλά οφείλουμε να εξετάσουμε και μια πιο αισιόδοξη προσέγγιση, γι’ αυτό και επικοινωνήσαμε με τον Άρθουρ Ι. Μίλερ, συγγραφέα και πρώην καθηγητή του UCL, ο οποίος ανήκει ξεκάθαρα στην πλευρά των τεχνο-οπτιμιστών. Στο βιβλίο του The artist in the machine (MIT Press) περιγράφει τις απόπειρες που έχουν γίνει έως τώρα να παραχθεί αξιόλογη τέχνη μέσω της τεχνητής νοημοσύνης και προτείνει στη νέα γενιά πρωτοπόρων καλλιτεχνών να αρχίσει αμέσως να πειραματίζεται με τις ψηφιακές τέχνες. «Θα έλεγα ότι αυτή η έκρηξη νοημοσύνης είναι σαράντα χρόνια μακριά», μου λέει στη διαδικτυακή μας συνομιλία. «Σε αυτό συναινούν οι περισσότεροι ειδήμονες. Αυτή τη στιγμή, οι μηχανές κάνουν απίθανα πράγματα, αλλά πράγματι οι ικανότητές τους είναι περιορισμένες. Μπορούν να κάνουν ένα μόνο πράγμα τη φορά. Ο στόχος είναι να αποκτήσουμε μια μηχανή γενικού σκοπού, που θα μπορεί να κάνει πολλά πράγματα μαζί. Αυτό, λοιπόν, έρχεται. Δείτε πόσο απίθανη εξέλιξη είναι ένα άλλο εργαλείο της OpenAI, το GPT-3 (Generative Pretrained Transformer, 3η έκδοση). Τροφοδοτείς το εργαλείο με μια πρόταση ή μια παράγραφο κι εκείνο συνεχίζει το κείμενο μόνο του. Είναι ένα τεχνητό νευρωνικό δίκτυο που έχει εκπαιδευτεί από 500 δισεκατομμύρια λέξεις, οι οποίες έχουν αντληθεί από όλο τον κόσμο, από το ίντερνετ, τα σόσιαλ μίντια, τα μπλογκ. Και είναι συντονισμένο με πάνω από 175 δισεκατομμύρια παραμέτρους μηχανικής μάθησης. Σήμερα, η μηχανή μπορεί να γράψει μόνη της υπολογιστικό κώδικα. Όλα είναι πλέον κωδικοποιημένα με αριθμούς. Το ίδιο το κείμενο είναι κωδικοποιημένο με αριθμούς. Φανταστείτε λοιπόν να βάλετε και εικόνες με τη μορφή πίξελ.

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-5
Όταν η τεχνητή νοημοσύνη ζωγράφισε όπως ο Έντουαρντ Χόπερ.

Τα πίξελ είναι κωδικοποιημένα με αριθμούς, αλλά και οι μουσικές νότες είναι κωδικοποιημένες με αριθμούς. Μέσα λοιπόν στη μηχανή έχεις όλους αυτούς τους αριθμούς να τρέχουν τριγύρω, αντλώντας από την τέχνη, τη λογοτεχνία και τη μουσική, και στην ουσία ενέχει μια ενότητα τέχνης, λογοτεχνίας και μουσικής. Μπορείς να φανταστείς λοιπόν γλυπτά από λέξεις και μουσικές νότες και πιθανώς να δεις τις Δεσποινίδες της Αβινιόν του Πικάσο να γίνονται συμφωνικό έργο. Ο κόσμος της τεχνητής νοημοσύνης ανοίγει ολόκληρους νέους κόσμους μπροστά μας». 

Ρωτάω τον Μίλερ αν αυτό που βλέπουμε να συμβαίνει μπροστά στα μάτια μας είναι πράγματι δημιουργικότητα ή κάτι άλλο. «Οι μηχανές ήδη επιδεικνύουν αναλαμπές δημιουργικότητας», μου λέει, «κι έχω στον νου μου τον αλγόριθμο AlphaGo, για παράδειγμα, που το 2016 κέρδισε έναν πρωταθλητή του παιχνιδιού Go. Τότε όλοι συμφώνησαν ότι η μηχανή “έσπασε” το αξιοσέβαστο αυτό παιχνίδι. Ήταν μια ιστορική στιγμή για την τεχνητή νοημοσύνη. Στην πορεία, το AlphaGo έκανε μια απίθανη κίνηση, μπορούμε να πούμε μια δημιουργική κίνηση. Είναι η περίφημη κίνηση νούμερο 37, στο δεύτερο από τα πέντε παιχνίδια. Κι έπειτα, έχουμε το DeepDream, έναν αλγόριθμο που επιτρέπει σε νευρωνικά δίκτυα να παράγουν αλλόκοτα έργα τέχνης. Σήμερα, πίσω από αυτές τις εφαρμογές βρίσκεται το ανθρώπινο χέρι, το χέρι του καλλιτέχνη της τεχνητής νοημοσύνης. Ο καλλιτέχνης της τεχνητής νοημοσύνης είναι ένα νέο, τεχνολογικό είδος καλλιτέχνη». 

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-6
Αυτό θα ήταν ένα εξώφυλλο ελληνικού περιοδικού αν το σχεδίαζε ένα πρόγραμμα τεχνητής νοημοσύνης.

Ποιος φοβάται τις δημιουργικές μηχανές;

Η συζήτηση με τον κ. Μίλερ συνεχίζεται. Επιμένω: πώς μπορούμε να λέμε ότι οι μηχανές είναι δημιουργικές όταν πίσω από αυτά τα εργαλεία που παράγουν εικόνες βρίσκονται προγραμματιστές; «Αυτό είναι πρόσκαιρο. Όταν παράγουμε κάτι, ένα αντικείμενο ή μια γνώση που πάει πέρα από τα υλικά που διαθέτουμε, λέμε ότι διαθέτουμε δημιουργικότητα. Γιατί να μην αποδίδουμε αυτή τη δημιουργικότητα και στις μηχανές του μέλλοντος; Νομίζω ότι υπάρχει ένας φόβος για τις δημιουργικές μηχανές. Πιστεύω ότι μια μέρα θα είναι πλήρως δημιουργικές, καθώς θα πληρούν και τις τρεις προϋποθέσεις της δημιουργικότητας: θα είναι μη προβλέψιμες, θα έχουν συνείδηση, αλλά και συναισθήματα. Ναι, οι μηχανές θα αποκτήσουν συναισθήματα παρακολουθώντας ό,τι υπάρχει στο διαδίκτυο και αντιγράφοντας τις ζωές μας. Κατά βάση, κι εμείς μηχανές είμαστε, βιολογικές μηχανές. Είμαστε κατασκευασμένοι από φλέβες και αρτηρίες και οστά και μύες και κύτταρα. Και, παρ’ όλα αυτά, καταφέραμε να αναπτύξουμε δημιουργικότητα, κάτι που είναι μεγάλο μυστήριο. Και είναι επίσης μεγάλο μυστήριο το πώς κάτι που είναι φτιαγμένο από τσιπάκια και καλώδια μπορεί να είναι επίσης δημιουργικό. Αντιλαμβανόμουν πάντοτε τον όρο τεχνητή νοημοσύνη ως ένα τρομερό οξύμωρο, γιατί βάζει στη μια πλευρά τη νοημοσύνη και στην άλλη τα συναισθήματα. Γιατί πρέπει να κάνουμε τη διάκριση μεταξύ της νοημοσύνης μιας μηχανής και της δικής μας;

Αλγόριθμε, κάνε ένα εξώφυλλο για το «Κ»-7
Πίσω από αυτή τη μυστηριώδη εικόνα κρύβεται η απόπειρα της μηχανής να «ζωγραφίσει» μια ομάδα παιδιών που διαμαρτύρονται.

Το κάνουμε γιατί οι μηχανές είναι εξωγήινα όντα; Πράγματι, δεν χρειάζεται να πάμε στον Άρη για να έρθουμε σε επαφή με εξωγήινες μορφές ζωής. Αναπτύσσονται εδώ δίπλα μας. Και το εκπληκτικό είναι ότι εμείς συγχωνευόμαστε μαζί τους. Η βιολογική μας αλλαγή συμβαίνει πολύ γρήγορα. Αν θέλεις να μιλήσεις για το πολύ μακρινό μέλλον, πρέπει να σταματήσεις να αναφέρεσαι σε ανθρώπους ή μηχανές. Στο μέλλον θα μιλάμε για ανθρώπους και μηχανές, και στο πολύ πιο μακρινό μέλλον θα μιλάμε για τεχνητή υπερνοημοσύνη. Μηχανές που είναι πολύ πολύ πιο έξυπνες από εμάς. Και μηχανές των οποίων η δημιουργικότητα είναι πολύ πολύ μεγαλύτερη από τη δική μας. Γιατί οι μηχανές έχουν την προοπτική απεριόριστης δημιουργικότητας. Τότε, το τι σημαίνει να είσαι άνθρωπος θα έχει αλλάξει δραστικά. Σε έναν πολύ μεγάλο βαθμό θα έχουμε γίνει ένα με τις μηχανές. Κι αυτό μπορεί να μην είναι καθόλου κακή ιδέα, γιατί οι μηχανές μπορούν να δουν το μέλλον, να αισθανθούν προβλήματα και να εργαστούν αμέσως για να τα λύσουν. Είναι γεγονός ότι εμείς δεν είμαστε τόσο καλοί σε όλα αυτά». 

Στις αρχές Σεπτεμβρίου του 2022, ο καλλιτέχνης Τζέισον Άλεν υπέβαλε σε έναν διαγωνισμό ζωγραφικής του Κολοράντο ένα έργο που δημιούργησε με το Midjourney και κέρδισε το πρώτο βραβείο. Αυτό προφανώς δεν έχει ξαναγίνει. Μεθυσμένος από την αναπάντεχη νίκη του, ο Άλεν άδραξε την ευκαιρία να πανηγυρίσει. «Η τέχνη είναι νεκρή, φίλε», είπε ο 39χρoνος καλλιτέχνης στον Κέβιν Ρουζ. «Όλα τελείωσαν. Η τεχνητή νοημοσύνη κέρδισε. Οι άνθρωποι έχασαν». «Όπα, πολύ βιάζεσαι, φίλε!» απαντά ο Άρθουρ Ι. Μίλερ. «Υπάρχει τέχνη που παράγεται από ανθρώπους, συνεργασίες μεταξύ ανθρώπων και μηχανών, και στο κοντινό μέλλον, τέχνη που θα δημιουργείται εξ ολοκλήρου από σκεπτόμενες μηχανές. Διαφορετική αισθητική, διαφορετική τέχνη. Κανείς δεν χάνει έτσι». Ας ελπίσουμε ότι η τελευταία μας εφεύρεση θα μας λυπηθεί.

Δοκίμασέ το στο σπίτι!

→ 1 Δημιουργείς έναν λογαριασμό στο midjourney.com 
→ 2 Από εκεί μεταφέρεσαι αυτόματα στο κανάλι του Midjourney στο Discord.
→ 3  Πηγαίνεις σε ένα κανάλι για νέους χρήστες #newbies
→ 4  Στη γραμμή εντολών γράφεις /imagine και σου εμφανίζεται η λέξη prompt.
→ 5  Γράφεις στα αγγλικά ό,τι επιθυμείς και περιμένεις.
→ 6  Σε λίγα δευτερόλεπτα έχεις τα τέσσερα πρώτα δείγματα εικόνων. 

* Το πρόγραμμα είναι δωρεάν για μια δοκιμαστική περίοδο που περιλαμβάνει τη δημιουργία 25 εικόνων. 

Λάβετε μέρος στη συζήτηση 0 Εγγραφείτε για να διαβάσετε τα σχόλια ή
βρείτε τη συνδρομή που σας ταιριάζει για να σχολιάσετε.
Για να σχολιάσετε, επιλέξτε τη συνδρομή που σας ταιριάζει. Παρακαλούμε σχολιάστε με σεβασμό προς την δημοσιογραφική ομάδα και την κοινότητα της «Κ».
Σχολιάζοντας συμφωνείτε με τους όρους χρήσης.
Εγγραφή Συνδρομή