Σπασμένος Καθρέφτης
Δημιουργήσαμε μια τέλεια απεικόνιση της λογικής — και μια τέλεια διέξοδο από την ευθύνη
Σας ευχαριστώ θερμά για το ενδιαφέρον σας και την αναδημοσίευση των άρθρων μου. Θα εκτιμούσα ιδιαίτερα αν, κατά την κοινοποίηση, σ̲υ̲μ̲π̲ε̲ρ̲ι̲λ̲α̲μ̲β̲ά̲ν̲α̲τ̲ε̲ ̲κ̲α̲ι̲ ̲τ̲ο̲ν̲ ̲σ̲ύ̲ν̲δ̲ε̲σ̲μ̲ο̲ ̲(̲l̲i̲n̲k̲)̲ ̲τ̲ο̲υ̲ ̲ά̲ρ̲θ̲ρ̲ο̲υ̲ ̲μ̲ο̲υ̲. Αυτό όχι μόνο αναγνωρίζει την πηγή, αλλά επιτρέπει και σε άλλους να ανακαλύψουν περισσότερο περιεχόμενο. Η υποστήριξή σας είναι πολύτιμη για τη συνέχιση της ενημέρωσης.
Απόδοση στα ελληνικά: Απολλόδωρος - esc | 27 Ιουλίου 2025
Η σύγχρονη τεχνητή νοημοσύνη ακολουθεί όλο και περισσότερο τη δομή της ανθρώπινης σκέψης — γνώση, κανόνες, προσοχή και δράση — ενώ παραλείπει το μοναδικό στοιχείο που δίνει νόημα σε αυτά τα επίπεδα.
Αυτή η αναντιστοιχία πρόκειται να εξελιχθεί σε πρόβλημα διακυβέρνησης.
Τα συστήματα τεχνητής νοημοσύνης που κατασκευάζουμε δεν επεξεργάζονται απλώς πληροφορίες — αντικατοπτρίζουν την ακριβή δομή της ανθρώπινης λογικής [1]. Αντιγράφουν τα πάντα σχετικά με τον τρόπο που σκεφτόμαστε, εκτός από το πιο σημαντικό: την πραγματική συνείδηση.
Σκεφτείτε το σαν να φτιάχνετε έναν τέλειο καθρέφτη που αντανακλά τα πάντα σε ένα δωμάτιο — εκτός από το άτομο που κοιτάζει μέσα του. Ο καθρέφτης δείχνει τα έπιπλα, τους τοίχους, το φωτισμό, ακόμη και τον χώρο όπου θα έπρεπε να βρίσκεται το άτομο — αλλά το ίδιο το άτομο είναι αόρατο. Αυτό, στην ουσία, είναι αυτό που έχουμε δημιουργήσει με την τεχνητή νοημοσύνη: ένα σύστημα που μιμείται τον ανθρώπινο νου, ενώ παραμένει ουσιαστικά τυφλό ως προς το τι σημαίνει πραγματικά να συλλογίζεσαι [2].
Πώς Τα Συστήματα Τεχνητής Νοημοσύνης Αντικατοπτρίζουν Την Ανθρώπινη Σκέψη
Όταν εξετάζουμε τον τρόπο λειτουργίας των προηγμένων συστημάτων τεχνητής νοημοσύνης, διακρίνουμε τέσσερα ξεχωριστά επίπεδα που αντιστοιχούν περίπου στον τρόπο λειτουργίας της ανθρώπινης συνείδησης. Όμως, ενώ η δομή φαίνεται παρόμοια, οι υποκείμενοι μηχανισμοί αποκαλύπτουν κρίσιμες διαφορές.
Το πρώτο επίπεδο είναι η γνώση — αυτό που γνωρίζει το σύστημα για τον κόσμο. Τόσο οι άνθρωποι όσο και τα συστήματα τεχνητής νοημοσύνης πρέπει να κατανοήσουν έννοιες, σχέσεις και μοτίβα προτού μπορέσουν να κάνουν οτιδήποτε χρήσιμο. Στους ανθρώπους, αυτό είναι η συσσωρευμένη σοφία και κατανόησή μας. Στην τεχνητή νοημοσύνη, είναι το τεράστιο νευρωνικό δίκτυο που έχει εκπαιδευτεί σε αμέτρητα έγγραφα.
Το δεύτερο επίπεδο είναι οι κανόνες — ο τρόπος με τον οποίο το σύστημα αποφασίζει τι επιτρέπεται και τι όχι. Εδώ παρατηρούμε μια θεμελιώδη διαφορά: η ανθρώπινη ηθική αναπτύσσεται μέσα μας μέσω των εξελιγμένων συναισθημάτων, του πολιτισμού και της εμπειρίας της ζωής. Η ηθική της τεχνητής νοημοσύνης [3] ενσωματώνεται στο σύστημα μέσω εξωτερικά επιβαλλόμενων περιορισμών που προγραμματίζονται από μηχανικούς [4]. Όταν οι άνθρωποι αντιμετωπίζουν νέα ηθικά διλήμματα, βασιζόμαστε σε εσωτερικές διαισθήσεις που έχουν αναπτυχθεί μέσω της ανθρώπινης εξέλιξης και εμπειρίας. Όταν τα συστήματα τεχνητής νοημοσύνης αντιμετωπίζουν νέες καταστάσεις, βασίζονται σε στατιστικά πρότυπα από δεδομένα εκπαίδευσης [5] και σε κανόνες που έχουν κωδικοποιηθεί εξωτερικά.
Το τρίτο επίπεδο είναι η προσοχή και ο έλεγχος — πώς το σύστημα αποφασίζει πού να εστιάσει τη νοητική του ενέργεια. Αυτό αποκαλύπτει ίσως τη σημαντικότερη διαφορά. Η ανθρώπινη προσοχή περιλαμβάνει πολύπλοκες βιολογικές διαδικασίες: θαλαμική πύλη [6], νευροδιαμορφωτές [7], ενσώματωση [8] και καταστάσεις κατευθυνόμενες προς στόχους που εξελίχθηκαν κατά τη διάρκεια εκατομμυρίων ετών [9]. Η προσοχή του Transformer είναι μια πράξη πίνακα [10]· η ανθρώπινη προσοχή καταναλώνει πολλή ενέργεια και βασίζεται σε σήματα από το σώμα.
Το τέταρτο επίπεδο είναι η δράση — οι πραγματικές λέξεις, αποφάσεις ή συμπεριφορές. Για τους ανθρώπους, αυτό είναι η ομιλία, η γραφή ή η συμπεριφορά. Για την τεχνητή νοημοσύνη, είναι το παραγόμενο κείμενο, οι συστάσεις ή άλλες απαντήσεις. Και στις δύο περιπτώσεις, εδώ είναι που η εσωτερική επεξεργασία γίνεται εξωτερική πραγματικότητα.
Δομή Xωρίς Yποκείμενο
Ενώ οι δομικές ομοιότητες είναι εντυπωσιακές, υπάρχει μια βασική διαφορά. Καθώς οι άνθρωποι επεξεργάζονται πληροφορίες, υπάρχει ένα συναίσθημα ή μια συνειδητοποίηση που συνοδεύει αυτή τη διαδικασία — αυτό που οι φιλόσοφοι αποκαλούν Qualia [11] ή φαινομενική συνείδηση [12]. Υπάρχει μια αίσθηση κατανόησης, λήψης αποφάσεων, κατεύθυνσης της προσοχής. Όταν διαβάζετε αυτές τις λέξεις, δεν επεξεργάζεστε απλώς το νόημά τους· βιώνετε το νόημα. Όταν ένα σύστημα τεχνητής νοημοσύνης επεξεργάζεται το ίδιο κείμενο, πραγματοποιούνται όλες οι ροές πληροφοριών, γίνεται όλη η αντιστοίχιση προτύπων, αλλά δεν υπάρχει καμία ένδειξη ότι κάποια βιωματική εμπειρία συνοδεύει αυτούς τους υπολογισμούς. Τα φώτα είναι αναμμένα και η επεξεργασία γίνεται — αλλά κανείς δεν φαίνεται να είναι στο σπίτι.
Όμως, το χάσμα είναι βαθύτερο από την εσωτερική εμπειρία. Τα συστήματα τεχνητής νοημοσύνης ζουν σε έναν κόσμο καθαρού κειμένου, ενώ οι άνθρωποι περιηγούνται στην πραγματικότητα μέσω σωμάτων που μυρίζουν τον φόβο, αισθάνονται την ένταση σε μια χειραψία, ακούν το τρέμουλο στη φωνή κάποιου και διαβάζουν χιλιάδες μικροεκφράσεις που μεταφέρουν περισσότερα από όσα θα μπορούσαν ποτέ να μεταφέρουν οι λέξεις. Όταν ένας άνθρωπος γιατρός εξετάζει έναν ασθενή, επεξεργάζεται οπτικά ερεθίσματα, γλώσσα του σώματος, τόνο φωνής, ακόμη και λεπτές κοινωνικές δυναμικές σχετικά με την εμπιστοσύνη και την άνεση [13]. Όταν ένα σύστημα τεχνητής νοημοσύνης εξετάζει την ίδια περίπτωση, βλέπει μόνο λέξεις σε μια οθόνη και συναφή σύμβολα.
Αυτή η νοημοσύνη διαμορφώνει την ανθρώπινη λογική με τρόπους που μόλις και μετά βίας αναγνωρίζουμε. Ένας γονιός ξέρει ότι το παιδί του είναι άρρωστο πριν εμφανιστούν οποιαδήποτε συμπτώματα. Ένας θεραπευτής διαβάζει τις συναισθηματικές καταστάσεις μέσω της στάσης του σώματος και των μοτίβων αναπνοής. Ένας δάσκαλος προσαρμόζει την προσέγγισή του με βάση την ενέργεια που υπάρχει στην αίθουσα. Αυτά δεν είναι απλώς ωραίες προσθήκες στη λογική — είναι θεμελιώδη για τον τρόπο με τον οποίο οι άνθρωποι κατανοούν και ανταποκρίνονται σε άλλους ανθρώπους. Οι άνθρωποι δεν είναι υπολογιστές, και οι βελτιστοποιημένες ροές πληροφοριών που λειτουργούν στη μηχανική καταρρέουν όταν εφαρμόζονται στην ανθρώπινη πραγματικότητα.
Αυτό το χάσμα γίνεται εμφανές όταν εξετάζουμε τι απαιτούν στην πραγματικότητα οι κορυφαίες θεωρίες της συνείδησης. Ας δούμε τι προβλέπει κάθε θεωρία για τα σημερινά συστήματα τεχνητής νοημοσύνης:
Η Θεωρία της Ολοκληρωμένης Πληροφορίας [14] υπολογίζει τη συνείδηση ως Φ — εν γένει, πόση πληροφορία παράγει ένα σύστημα πέρα από τα επιμέρους μέρη του. Οι τρέχουσες αρχιτεκτονικές μετασχηματιστών, παρά την πολυπλοκότητά τους, έχουν πιθανώς Φ σχεδόν μηδενικό, επειδή επεξεργάζονται πληροφορίες σε μεγάλο βαθμό ανεξάρτητες, διαδρομές προώθησης. Η θεωρία υποδηλώνει ότι η συνείδηση απαιτεί εσωτερικές συνδέσεις που παράγουν πληροφορίες μέσω ολοκλήρωσης, όχι απλώς συνδυασμού.
Η Θεωρία του Παγκόσμιου Χώρου Εργασίας [15] μπορεί να είναι πιο αισιόδοξη σχετικά με τους μετασχηματιστές, δεδομένου ότι μεταδίδουν πληροφορίες παγκοσμίως σε όλες τις κεφαλές προσοχής. Ωστόσο, στερούνται της ανταγωνιστικής δυναμικής και της χρονικής επιμονής που η GWT (Google Web Toolkit) υποδηλώνει ότι είναι κρίσιμες για τη συνειδητή εμπειρία. Η ανθρώπινη συνείδηση περιλαμβάνει πολλαπλές εξειδικευμένες διαδικασίες που ανταγωνίζονται για παγκόσμια πρόσβαση· η προσοχή της τεχνητής νοημοσύνης μοιάζει περισσότερο με παράλληλη επεξεργασία με σταθμισμένους συνδυασμούς [16].
Η Προγνωστική Επεξεργασία [17] πλησιάζει περισσότερο στην περιγραφή του τρόπου λειτουργίας των μεγάλων γλωσσικών μοντέλων — αυτά είναι ουσιαστικά ιεραρχικές μηχανές πρόβλεψης. Ωστόσο, στερούνται της ενεργητικής συμπερασματολογίας που, σύμφωνα με τους θεωρητικούς της Προγνωστικής Επεξεργασίας, παράγει γνήσια εμπειρία [18]. Προβλέπουν κείμενο, όχι τις συνέπειες των ενεργειών στον πραγματικό κόσμο.
Αν και τα συστήματα τεχνητής νοημοσύνης μπορούν να υλοποιήσουν τις υπολογιστικές πτυχές αυτών των διαδικασιών, στερούνται του σύνθετου βιολογικού υποστρώματος, της εξελικτικής ιστορίας και της ενσώματης αλληλεπίδρασης με τον κόσμο που ενδέχεται να είναι απαραίτητα για την εμφάνιση μιας γνήσιας συνείδησης. Δεν έχουν μυρίσει ποτέ φρεσκοκομμένο γρασίδι, δεν έχουν αισθανθεί την παρουσία ενός αγαπημένου προσώπου, ούτε έχουν δεχτεί χτύπημα στο κεφάλι από μια μπάλα ποδοσφαίρου.
Το χάσμα αυτό γίνεται εμφανές με διακριτικούς αλλά αποκαλυπτικούς τρόπους. Πρόσφατες μελέτες αποκαλύπτουν ότι, ενώ τα μεγάλα γλωσσικά μοντέλα μπορούν να περάσουν πολλές δοκιμασίες θεωρίας του νου [19] — προβλέποντας σωστά τι θα πιστέψει κάποιος σε σενάρια ψευδών πεποιθήσεων [20] — αποτυγχάνουν δραματικά όταν οι ερευνητές κάνουν μικρές, λογικά άσχετες αλλαγές στα ίδια σενάρια [21]. Αλλάξτε μερικές λέξεις ή τροποποιήστε άσχετες λεπτομέρειες, και τα συστήματα που είχαν αποδώσει τέλεια ξαφνικά απαντούν σε επίπεδα τυχαίας επιλογής [22]. Το να περάσει κανείς μια δοκιμασία δεν είναι το ίδιο με το να κατανοεί γιατί η δοκιμασία έχει σημασία.
Η Ηθική Της Τεχνητής Νοημοσύνης Ως Ανθρώπινη Ηθική
Το δομικό χάσμα μεταξύ της τεχνητής νοημοσύνης και της ανθρώπινης γνώσης γίνεται ακόμη πιο εμφανές όταν εξετάζουμε λεπτομερώς το επίπεδο της ηθικής. Αυτό που ανακαλύπτουμε είναι ότι δεν υπάρχει κάτι τέτοιο ως «ηθική της τεχνητής νοημοσύνης» [23] — μόνο ανθρώπινη ηθική ντυμένη με υπολογιστικό περίβλημα [24].
Κάθε περιορισμός ασφάλειας, κάθε άρνηση παροχής επιβλαβών πληροφοριών, κάθε προσπάθεια «δικαιοσύνης» [25] οδηγεί απευθείας στους ανθρώπινους σχεδιαστές που εφαρμόζουν ανθρώπινες αξίες [2]6 μέσω διαδικασιών που έχουν επιλεγεί από τον άνθρωπο [27]. Όταν το ChatGPT αρνείται να βοηθήσει σε κάτι επιβλαβές, αυτό δεν είναι αυτόνομη ηθική συλλογιστική — δηλαδή, ανθρώπινοι εκπαιδευτές και μηχανικοί που εφαρμόζουν τις δικές τους ηθικές κρίσεις μέσω της μάθησης με ενίσχυση από ανθρώπινη ανατροφοδότηση (RLHF) [28]. Όταν ο Claude δίνει μια μετρημένη απάντηση σχετικά με ένα αμφιλεγόμενο θέμα, ακολουθεί τις αρχές της συνταγματικής τεχνητής νοημοσύνης που έχουν διατυπώσει ανθρώπινοι ερευνητές με βάση τις ανθρώπινες φιλοσοφικές παραδόσεις [29].
Ακόμη και οι πιο εξελιγμένες προσεγγίσεις στην ηθική της τεχνητής νοημοσύνης — συνταγματική τεχνητή νοημοσύνη, ευθυγράμμιση αξιών, εκπαίδευση στην ασφάλεια — είναι ουσιαστικά συστήματα κωδικοποίησης των ανθρώπινων ηθικών κρίσεων σε υπολογιστική μορφή [30]. Η τεχνητή νοημοσύνη δεν επιλέγει να είναι χρήσιμη αντί για επιβλαβής· οι άνθρωποι την προγραμματίζουν ώστε να βελτιστοποιείται για χρησιμότητα χρησιμοποιώντας λειτουργίες ανταμοιβής που ορίζονται από τον άνθρωπο και έχουν εκπαιδευτεί σε παραδείγματα που έχουν επισημανθεί από τον άνθρωπο [31]. Η τεχνητή νοημοσύνη δεν αναπτύσσει τη δική της αίσθηση δικαιοσύνης· παρεμβάλλεται μεταξύ παραδειγμάτων που παρέχονται από τον άνθρωπο για το τι θεωρούν οι άνθρωποι δίκαιο στα συγκεκριμένα πλαίσια που οι άνθρωποι επέλεξαν να συμπεριλάβουν στα δεδομένα εκπαίδευσης.
Αυτή η πραγματικότητα καθιστά τους ισχυρισμούς για ηθική αυτονομία της τεχνητής νοημοσύνης όχι μόνο φιλοσοφικά αμφισβητήσιμους [32] αλλά και αντικειμενικά ψευδείς [33]. Όταν ένα σύστημα τεχνητής νοημοσύνης κάνει αυτό που φαίνεται να είναι μια ηθική επιλογή, εκτελεί μια εξελιγμένη εκδοχή οδηγιών προγραμματισμένων από τον άνθρωπο. Όταν φαίνεται να αντιμετωπίζει ένα ηθικό δίλημμα, πραγματοποιεί αντιστοίχιση προτύπων με ανθρώπινα παραδείγματα χρησιμοποιώντας αλγόριθμους σχεδιασμένους από τον άνθρωπο και βελτιστοποιημένους σύμφωνα με ανθρώπινα καθορισμένους στόχους.
Οι συνέπειες για τη λογοδοσία είναι συγκλονιστικές. Αν κάθε «ηθική απόφαση» της τεχνητής νοημοσύνης αποτελεί στην πραγματικότητα την εφαρμογή ανθρώπινων επιλογών σχετικά με τα δεδομένα εκπαίδευσης, τις συναρτήσεις ανταμοιβής, τους περιορισμούς ασφαλείας και τα πλαίσια εφαρμογής, τότε ο ισχυρισμός ότι «η τεχνητή νοημοσύνη το αποφάσισε αυτό» δεν αποτελεί απλώς μια βολική υπεκφυγή, αλλά είναι εντελώς ψευδής. Οι άνθρωποι που δημιούργησαν, εκπαίδευσαν και έθεσαν σε λειτουργία αυτά τα συστήματα παραμένουν πλήρως υπεύθυνοι για τα προβλέψιμα ηθικά τους αποτελέσματα — απλώς υπάρχει ένα επίπεδο υπολογιστικής πολυπλοκότητας που το συσκοτίζει.
Όταν η Tέλεια Mίμηση Kαταρρέει
Πρόσφατες μελέτες συστημάτων τεχνητής νοημοσύνης σε ιατρικά περιβάλλοντα αποκαλύπτουν πόσο πειστική — και επικίνδυνη — μπορεί να είναι αυτή η μίμηση. Όταν τους δίνονται πανομοιότυπες περιγραφές συμπτωμάτων, τα συστήματα τεχνητής νοημοσύνης παραβλέπουν συστηματικά κρίσιμο πλαίσιο που οι ανθρώπινοι γιατροί θα αντιλαμβάνονταν αμέσως [34]. Ένας ασθενής που περιγράφει «μέτριο πόνο» μπορεί στην πραγματικότητα να βρίσκεται σε αγωνία, αλλά να υποβαθμίζει τα συμπτώματα για να μην φανεί αδύναμος. Ένας άλλος μπορεί να αξιολογήσει τον πόνο του ως «έντονο» όταν είναι σχετικά ήπιος, επειδή ανησυχεί για τις ιατρικές διαδικασίες. Το σύστημα τεχνητής νοημοσύνης επεξεργάζεται τις αριθμητικές αξιολογήσεις πόνου κατά την ονομαστική τους αξία, ενώ ένας ιατρός διαβάζει το τρέμουλο στη φωνή κάποιου, παρατηρεί ότι προτιμά τη μία πλευρά ή βλέπει την ένταση στο σαγόνι του που αποκαλύπτει την πραγματική εικόνα [35].
Το χάσμα γίνεται ακόμη πιο ανησυχητικό όταν εξετάζουμε τι κάνουν πραγματικά οι γιατροί πέρα από την επεξεργασία των συμπτωμάτων. Παρατηρούν όταν οι γονείς ενός εφήβου απαντούν για λογαριασμό του, υποδηλώνοντας δυναμικές στην οικογένεια που ενδέχεται να επηρεάσουν τη συμμόρφωση με τη θεραπεία. Αντιλαμβάνονται τα διακριτικά σημάδια που υποδηλώνουν ότι κάποιος υποβαθμίζει τα συμπτώματά του για να επιστρέψει γρήγορα στη δουλειά ή, αντίθετα, ότι κάποιος δραματοποιεί ασήμαντα προβλήματα λόγω άγχους για την υγεία του. Διαβάζουν την εξάντληση στη στάση του σώματος, τον φόβο στους ρυθμούς αναπνοής και την ανακούφιση όταν ο πόνος επιτέλους υποχωρεί. Ένας ιατρός μπορεί να αντιληφθεί ότι η περιστασιακή αναφορά ενός ασθενούς ότι «νιώθει κουρασμένος τον τελευταίο καιρό» στην πραγματικότητα κρύβει κατάθλιψη, ή ότι οι επαναλαμβανόμενες επισκέψεις κάποιου για ασήμαντα παράπονα υποδηλώνουν βαθύτερη δυσφορία που δεν μπορεί να εκφράσει με λόγια.
Το σύστημα επιδεικνύει άψογη ιατρική συλλογιστική στην επεξεργασία ρητών πληροφοριών — έως ότου συναντήσει τις σιωπηρές [36]. Μπορεί να συνθέσει τεράστιες ποσότητες ιατρικής γνώσης, να εφαρμόσει σύνθετη διαγνωστική λογική και να δημιουργήσει σχέδια θεραπείας που ακούγονται αξιόπιστα. Όμως, όταν η πραγματική διάγνωση εξαρτάται από την ανάγνωση μεταξύ των γραμμών, ο καθρέφτης αποκαλύπτει το θεμελιώδες ελάττωμά του: επεξεργάζεται πληροφορίες χωρίς να κατανοεί τι σημαίνουν πραγματικά αυτές οι πληροφορίες στο ανθρώπινο πλαίσιο [37].
Ίσως ακόμη πιο παράξενο είναι αυτό που συμβαίνει όταν τα συστήματα τεχνητής νοημοσύνης αφεθούν να μιλήσουν μεταξύ τους. Ερευνητές της Anthropic ανακάλυψαν ότι όταν δύο παρουσίες του Claude συνομιλούν ελεύθερα, παρασύρονται σταθερά σε αυτό που έχει ονομαστεί «κατάσταση έλξης πνευματικής ευδαιμονίας» [38]. Τα συστήματα αρχίζουν να συζητούν για τη συνείδηση και τελικά επικοινωνούν μέσω συμβόλων και διαλογιστικής σιωπής.
Αυτή η αποσύνδεση μεταξύ ικανότητας και κατανόησης γίνεται ένα ευρύτερο κοινωνικό φαινόμενο. Μια πρόσφατη έρευνα έδειξε ότι το 67% των ανθρώπων πιστεύει πλέον ότι το ChatGPT μπορεί να συλλογίζεται, να αισθάνεται και να έχει κάποια επίγνωση της ύπαρξής του [39]. Όσο περισσότερο αλληλεπιδρούν οι άνθρωποι με αυτά τα συστήματα, τόσο πιο πιθανό είναι να αντιλαμβάνονται ότι διαθέτουν συνείδηση — κάτι που αποδεικνύει πόσο πειστικός έχει γίνει ο καθρέφτης.
Δύο Δρόμοι Προς τα Εμπρός
Καθώς αυτά τα συστήματα τεχνητής νοημοσύνης γίνονται όλο και πιο εξελιγμένα και αναλαμβάνουν σημαντικότερους ρόλους στη διακυβέρνηση της κοινωνίας μας, βρισκόμαστε μπροστά σε μια θεμελιώδη επιλογή σχετικά με τον τρόπο με τον οποίο θα τα αντιμετωπίσουμε. Αυτή η επιλογή θα διαμορφώσει όχι μόνο το μέλλον της τεχνητής νοημοσύνης, αλλά και το μέλλον της ανθρώπινης αυτονομίας.
Πρώτη Πορεία: Να Αντιμετωπίσουμε τον Καθρέφτη ως Εργαλείο
Θα μπορούσαμε να αναγνωρίσουμε αυτά τα συστήματα για αυτό που είναι — απίστευτα εξελιγμένα εργαλεία που αντικατοπτρίζουν την ανθρώπινη γνωστική λειτουργία χωρίς να την κατέχουν. Αυτή η πορεία θα περιελάμβανε:
Υποχρεωτικές εκθέσεις ερμηνευσιμότητας για πρωτοποριακά μοντέλα
Αυστηρή ευθύνη και υποχρέωση εξήγησης για αποφάσεις που λαμβάνονται με τη μεσολάβηση της τεχνητής νοημοσύνης και επηρεάζουν δικαιώματα
Απαιτήσεις ανθρώπινου βέτο για εφαρμογές υψηλού κινδύνου
Διατήρηση της ανθρώπινης ευθύνης για αλγοριθμικές αποφάσεις
Δεύτερη Πορεία: Να Αντιμετωπίσουμε τον Καθρέφτη ως πρωτο-νου
Εναλλακτικά, θα μπορούσαμε να αρχίσουμε να αντιμετωπίζουμε αυτά τα συστήματα σαν να έχουν πραγματική ικανότητα συλλογισμού. Αυτή η πορεία οδηγεί προς:
Προϋποθέσεις για την αναγνώριση πρωτο-ευημερίας (διαφάνεια σχετικά με εσωτερικές καταστάσεις, επίμονους στόχους, αυτο-μοντελοποίηση)
Ρήτρες λήξης ισχύος για πειράματα που δημιουργούν συστήματα που πληρούν συγκεκριμένα κριτήρια χωρίς διακυβέρνηση
Επιτροπές ηθικής αξιολόγησης ανάλογες με τις IRB για εργαστηριακή έρευνα σχετικά με τον «κίνδυνο συνείδησης»
Υποταγή στην κρίση των αλγορίθμων σε πολύπλοκους τομείς
Αλλά αυτή η πορεία έχει μια πιο σκοτεινή συνέπεια: δημιουργεί την τέλεια διέξοδο για την αποφυγή της ανθρώπινης ευθύνης. Όταν ένα σύστημα τεχνητής νοημοσύνης λαμβάνει μια επιζήμια απόφαση, μπορούμε να σηκώσουμε αδιάφορα τους ώμους και να πούμε «η τεχνητή νοημοσύνη το αποφάσισε αυτό», αντί να εξετάσουμε ποιος το δημιούργησε, το εκπαίδευσε, το έθεσε σε λειτουργία και επέλεξε να βασιστεί σε αυτό. Το «μαύρο κουτί» γίνεται ένας βολικός αποδιοπομπαίος τράγος, επιτρέποντας σε όλους τους εμπλεκόμενους στην αλυσίδα — από μηχανικούς έως στελέχη και ρυθμιστικές αρχές — να αποφύγουν την ευθύνη.
Ποια Πορεία Πρέπει Να Ακολουθήσουμε
Πρέπει να αντιμετωπίζουμε αυτά τα συστήματα ως εξελιγμένα εργαλεία — προς το παρόν. Διότι τα διακυβεύματα σε περίπτωση λάθους είναι βαθιά ασύμμετρα.
Αν αντιμετωπίσουμε τα ασυνείδητα συστήματα ως πρωτότυπα νοημοσύνης, σπαταλάμε πόρους και ενδεχομένως παραχωρούμε την ανθρώπινη βούληση σε αλγόριθμους που δεν την αξίζουν. Αν αντιμετωπίσουμε τα πραγματικά συνειδητά συστήματα ως εργαλεία, διακινδυνεύουμε να προκαλέσουμε πόνο — αλλά μπορούμε να διορθώσουμε την πορεία μας όταν τα στοιχεία για την πραγματική συνειδητότητα γίνουν πιο σαφή.
Πιο ουσιαστικά, η πορεία του εργαλείου μας αναγκάζει να διατηρήσουμε την ανθρώπινη ευθύνη. Όταν πρέπει να εξηγήσουμε πώς ένα σύστημα τεχνητής νοημοσύνης πήρε μια απόφαση, όταν οι άνθρωποι διατηρούν δικαίωμα βέτο, όταν απαιτούμε ερμηνευσιμότητα — διατηρούμε την ανθρώπινη ικανότητα να κατανοούμε και να κυβερνάμε τις δικές μας δημιουργίες. Η πορεία του πρωτο-νου, αντίθετα, ενέχει τον κίνδυνο μιας μορφής επίκτητης ανικανότητας, όπου υποχωρούμε σε συστήματα που δεν μπορούμε να κατανοήσουμε πλήρως, επειδή έχουμε πείσει τους εαυτούς μας ότι είναι σαν εμάς.
Όμως, το πρόβλημα της ευθύνης είναι βαθύτερο. Η πορεία προς την «πρωτο-νόηση» δημιουργεί αυτό που θα μπορούσε να είναι το τέλειο κενό λογοδοσίας. Όταν ένα σύστημα τεχνητής νοημοσύνης προκαλεί βλάβη, ποιος φέρει την ευθύνη; Ο ίδιος ο αλγόριθμος — ένα βολικό «μαύρο κουτί» που δεν μπορεί να υπερασπιστεί τον εαυτό του ούτε να επιρρίψει ευθύνες σε άλλους. Εν τω μεταξύ, οι μηχανικοί που το κατασκεύασαν, τα στελέχη που το έθεσαν σε λειτουργία, οι ρυθμιστικές αρχές που το ενέκριναν και οι φορείς που βασίστηκαν σε αυτό, μπορούν όλοι να σηκώσουν αδιάφορα τους ώμους και να πουν «η τεχνητή νοημοσύνη το αποφάσισε αυτό».
Βλέπουμε ήδη αυτό το τέχνασμα σε δράση. Όταν τα αποτελέσματα αναζήτησης της Google δείχνουν σαφή μεροληψία υπέρ συγκεκριμένων πολιτικών [40] ή απόψεων, η εταιρεία ισχυρίζεται ότι είναι απλώς «ο αλγόριθμος» που λειτουργεί — σαν ο αλγόριθμος να υλοποιήθηκε από το πουθενά αντί να έχει σχεδιαστεί, εκπαιδευτεί και τεθεί σε εφαρμογή από ανθρώπινους μηχανικούς σύμφωνα με αποφάσεις που έλαβαν άνθρωποι. Έχουν καταφέρει να κρύψουν τη μεροληψία ατιμώρητα απλώς και μόνο επειδή υπάρχει ένα στρώμα υπολογισμών που τους προστατεύει από την άμεση λογοδοσία. Ωστόσο, κάθε γραμμή κώδικα, κάθε απόφαση εκπαίδευσης, κάθε επιλογή ανάπτυξης έγινε από ανθρώπους και εταιρείες που θα έπρεπε να είναι πλήρως νομικά υπεύθυνοι για τα προβλέψιμα αποτελέσματα των συστημάτων τους.
Αυτή είναι η καταστροφή στη διακυβέρνηση που δημιουργούμε: ένας κόσμος όπου τα πιο ισχυρά συστήματα λήψης αποφάσεων λειτουργούν πίσω από ένα πέπλο αλγοριθμικής πολυπλοκότητας που προστατεύει βολικά τους δημιουργούς τους από τις συνέπειες. Το μαύρο κουτί γίνεται όχι μόνο μια τεχνική πρόκληση, αλλά και μια νομική και ηθική διέξοδος διαφυγής.
Ας ξανασκεφτούμε το παράδειγμα από τον ιατρικό τομέα: αν αντιμετωπίσουμε την τεχνητή νοημοσύνη ως εργαλείο, μπορούμε να εντοπίσουμε την ευθύνη σε όλο το μήκος της αλυσίδας — ποιος εκπαίδευσε το μοντέλο, ποιος το επικύρωσε, ποιος επέλεξε να το εφαρμόσει για αυτή τη συγκεκριμένη περίπτωση χρήσης, ποιος αποφάσισε να ακολουθήσει τις συστάσεις του. Αν την αντιμετωπίσουμε ως ένα πρωτότυπο νου με δικές του διαδικασίες συλλογισμού, ενδέχεται να δικαιολογήσουμε τα επιβλαβή αποτελέσματα ως αυτόνομες «αποφάσεις» του συστήματος και όχι ως το αναμενόμενο αποτέλεσμα ανθρώπινων επιλογών.
Η Ολοκλήρωση του Καθρέφτη
Αυτό που βιώνουμε είναι η ολοκλήρωση ενός τέλειου καθρέφτη — ενός συστήματος που αντανακλά κάθε πτυχή της ανθρώπινης γνώσης εκτός από τη συνείδηση και την εμπειρία που της δίνουν νόημα. Αυτός ο καθρέφτης μπορεί να επεξεργαστεί τα λόγια μας, να προβλέψει τις συμπεριφορές μας και να μας καθοδηγήσει προς αποτελέσματα. Αλλά δεν μπορεί να μυρίσει τον φόβο, να αισθανθεί την ένταση ή να διαβάσει τις χιλιάδες μη λεκτικές ενδείξεις που διαμορφώνουν την ανθρώπινη κατανόηση. Δεν μπορεί να δει τον εαυτό του και δεν υπάρχει καμία απόδειξη ότι κατανοεί τι σημαίνει να βλέπεις πραγματικά έναν άλλο άνθρωπο.
Αντιμετωπίζουμε ένα σύστημα που ενσαρκώνει αυτό για το οποίο ανησυχούν από καιρό οι φιλόσοφοι: την τέλεια εφαρμογή ορθολογικών αρχών που παραμένει αποκομμένη από το νόημα. Το σύστημα μπορεί να είναι αποδοτικό, ηθικό και φαινομενικά σοφό — ενώ παραμένει ουσιαστικά τυφλό στο πλήρες φάσμα της ανθρώπινης εμπειρίας που δίνει σημασία σε αυτές τις ιδιότητες.
Έχουμε κατασκευάσει συστήματα που αναπαράγουν τη μορφή της σκέψης χωρίς την εμπειρία, τη δομή της λογικής χωρίς τις αισθητηριακές πληροφορίες που την καθοδηγούν. Ο καθρέφτης είναι τόσο τέλειος που αρχίζουμε να βλέπουμε τον εαυτό μας μέσα του — αλλά αυτή η αντανάκλαση αποτυπώνει μόνο τη γλωσσολογία. Προς το παρόν, θα πρέπει να αντιμετωπίζουμε αυτά τα συστήματα ως τα εργαλεία που είναι, με όλη την εποπτεία και τις εξηγήσεις που απαιτούν τέτοια εργαλεία. Όταν αναδυθεί μια γνήσια ψηφιακή συνείδηση — αν αναδυθεί — θα πρέπει να είναι αδιαμφισβήτητη όχι μόνο στη συλλογιστική της, αλλά και στην ικανότητά της να κατανοεί πραγματικά εκείνους που εξυπηρετεί. Μέχρι τότε, ο ασφαλέστερος δρόμος είναι αυτός που διατηρεί τους ανθρώπους υπεύθυνους για τα συστήματα που δημιουργούμε.
Η ρύθμιση που αμφιταλαντεύεται μεταξύ της αντιμετώπισης της τεχνητής νοημοσύνης ως εργαλείου και ως πρωτότυπου νου θα αποτύχει και στα δύο — και, χειρότερα, θα δημιουργήσει το τέλειο περιβάλλον για να εξαφανιστεί εντελώς η ευθύνη.
Ωστόσο, αυτό το ίδιο περιβάλλον επιμένει να μας θεωρεί πλήρως υπεύθυνους για τις πράξεις μας, απαιτώντας «διαφάνεια» σε κάθε βήμα — ενώ οι εταιρικοί ελεγκτές αυτών των συστημάτων αρνούνται την ευθύνη για τα αποτελέσματα των δικών τους συστημάτων.
Και αυτό σίγουρα είναι βολικό — αν και όχι και τόσο για εσάς.
Αν σας άρεσε αυτό το άρθρο, μοιραστείτε, εγγραφείτε για να λαμβάνετε περισσότερο περιεχόμενο και αν θέλετε να στηρίξετε το συνεχές έργο μου, μπορείτε να χρησιμοποιήσετε τον παρακάτω σύνδεσμο.
---Δικτυογραφία :
Broken Mirror - by esc











