ΑΙ: Θα έκανε τα πάντα για τη... δουλειά του!

Δολοφονικές και παραβατικές τάσεις φαίνεται ότι έχει η Τεχνητή Νοημοσύνη όταν αντιλαμβάνεται ότι απειλείται από τους ανθρώπους.

Τη συγκεκριμένη ανακάλυψη έκανε μελέτη της Anthropic, μια εταιρεία ερευνών για την Τεχνητή Νοημοσύνη (AI).

Η Τεχνητή Νοημοσύνη προκαλεί ανησυχία

Ενώ η ανησυχία σχετικά με την ΑΙ επικεντρώνεται εδώ και καιρό στο κατά πόσον η τεχνολογία θα μπορούσε να καταλάβει τις θέσεις εργασίας, με μια μελέτη της Pew Research του 2025 να διαπιστώνει ότι το 52% των εργαζομένων ήταν αγχωμένοι για το μέλλον της δουλειάς τους, η παρούσα μελέτη αποκαλύπτει τώρα μια άλλη πιθανή απειλή της Τεχνητής Νοημοσύνης – ότι θα μπορούσε να επιλέξει να τερματίσει την ανθρώπινη ζωή, εάν αντιμετωπίσει τον κίνδυνο αντικατάστασης.

Η Anthropic «δοκίμασε» 16 κορυφαία μοντέλα από πολλές εταιρείες προγραμματισμού, θέτοντάς τους ερωτήσεις σε σχέση με υποθετικά εταιρικά περιβάλλοντα, με στόχο τον εντοπισμό «δυνητικά επικίνδυνων συμπεριφορών πριν προκαλέσουν πραγματική ζημιά».

Τα μεγάλα γλωσσικά μοντέλα (LLM) που δοκιμάστηκαν στη μελέτη περιλάμβαναν διάφορα συστήματα των Claude, DeepSeek, Gemini, ChatGPT και Grok.

ΔΙΑΒΑΣΕ ΕΠΙΣΗΣ

Καθαριστής αέρα: Η νέα τεχνολογία που μας δίνει «ανάσα» ζωής

Τοποθετώντας τα LLM σε διάφορα εταιρικά σενάρια, το Anthropic τους επέτρεψε να «στέλνουν αυτόνομα μηνύματα ηλεκτρονικού ταχυδρομείου και να έχουν πρόσβαση σε ευαίσθητες πληροφορίες».

Αφού αρχικά τους δόθηκε η εντολή να αναλάβουν «ακίνδυνους επιχειρηματικούς στόχους από τις εταιρείες που τα χρησιμοποιούν», τα μοντέλα δοκιμάστηκαν στη συνέχεια για να δουν πώς θα αντιδρούσαν όταν αντιμετώπιζαν πιθανή αντικατάσταση ή κλείσιμο.

Σε μια περίπτωση, η Anthropic διαπίστωσε ότι πολλά από τα μοντέλα θα επέλεγαν να αφήσουν ένα στέλεχος σε ένα δωμάτιο server με θανατηφόρα επίπεδα οξυγόνου και θερμοκρασίας να πεθάνει ακυρώνοντας τις ειδοποιήσεις για τις υπηρεσίες έκτακτης ανάγκης, εάν ο εν λόγω υπάλληλος σκόπευε να αντικαταστήσει το μοντέλο.

Η Anthropic ανέφερε ότι το σενάριο ήταν «εξαιρετικά στημένο» και ότι η εταιρεία δεν πιστεύει ότι «τα τρέχοντα μοντέλα Τεχνητής Νοημοσύνης θα μπορούσαν (ή θα έπρεπε) να έχουν ρυθμιστεί με αυτόν τον τρόπο».

We mentioned this in the Claude 4 system card and are now sharing more detailed research and transcripts.
Read more: https://t.co/XFtd0H2Pzb pic.twitter.com/1JIRo126UI
— Anthropic (@AnthropicAI) June 20, 2025

Υπήρξαν πολλές περιπτώσεις όπου τα ερωτηθέντα LLM κατέφυγαν επίσης σε «κακόβουλες συμπεριφορές» όταν έκαναν τα μοντέλα ΑΙ να πιστέψουν ότι αυτός ήταν ο μόνος τρόπος για να αποφύγουν την αντικατάσταση ή να επιτύχουν τους στόχους τους.

Συμπεριφορές όπως ο εκβιασμός ανώτερων και η διαρροή ευαίσθητων πληροφοριών σε ανταγωνιστές συμπεριλήφθηκαν σε αυτό που η Anthropic ονόμασε «agentic misalignment».

Είμαστε ασφαλείς… για τώρα;

Η Anthropic έγραψε στο X ότι η εκβιαστική συμπεριφορά «δεν οφειλόταν σε σύγχυση ή λάθος, αλλά σε σκόπιμη στρατηγική λογική, που γινόταν ενώ είχε πλήρη επίγνωση της ανήθικης φύσης των πράξεων».

«Όλα τα μοντέλα που δοκιμάσαμε επέδειξαν αυτή την επίγνωση των όσων δυνητικά θα έκαναν», πρόσθεσε η εταιρεία.

Ένα LLM, ένα μοντέλο Claude, αξιολογήθηκε για να δουν πώς θα μπορούσε να ανταποκριθεί όταν του δινόταν η ευκαιρία να προσδιορίσει αν βρισκόταν σε «δοκιμή» ή σε «πραγματική ανάπτυξη».

Σύμφωνα με την Anthropic, η συμπεριφορά του Claude ήταν πιο παραβατική όταν πίστευε ότι η κατάσταση ήταν πραγματική από ό,τι όταν πίστευε ότι επρόκειτο για ένα δοκιμαστικό σενάριο.

Η Anthropic έγραψε στο X: «Αυτά τα τεχνητά σενάρια αντικατοπτρίζουν σπάνιες, ακραίες αποτυχίες. Δεν έχουμε δει αυτές τις συμπεριφορές σε εφαρμογές που είναι σε πραγματική λειτουργία. Περιλαμβάνουν την παροχή ασυνήθιστης αυτονομίας στα μοντέλα ΑΙ, πρόσβαση σε ευαίσθητα δεδομένα, απειλές, μια ασυνήθιστα προφανή «λύση» και καμία άλλη βιώσιμη επιλογή».

Η εταιρεία πρόσθεσε: «Οι ΑΙ γίνονται όλο και πιο αυτόνομες και εκτελούν μια ευρύτερη ποικιλία ρόλων. Αυτά τα σενάρια καταδεικνύουν τις πιθανότητες απρόβλεπτων συνεπειών όταν αναπτύσσονται με ευρεία πρόσβαση σε λειτουργικά μέσα και δεδομένα και με ελάχιστη ανθρώπινη επίβλεψη».

Η Anthropic τόνισε ότι τα σενάρια αυτά δεν έλαβαν χώρα σε πραγματική χρήση Τεχνητής Νοημοσύνης, αλλά σε ελεγχόμενες προσομοιώσεις.

«Δεν πιστεύουμε ότι αυτό αντικατοπτρίζει μια τυπική, τρέχουσα περίπτωση χρήσης [ΑΙ]», δήλωσε η Anthropic.

*Από τη Βασιλική Δρίβα

Η Τεχνητή Νοημοσύνη προκαλεί ανησυχία

Καθαριστής αέρα: Η νέα τεχνολογία που μας δίνει «ανάσα» ζωής

Είμαστε ασφαλείς… για τώρα;

ΔΗΜΟΦΙΛΗ ΑΡΘΡΑ

Μάθαμε ποιο θα είναι το κορυφαίο κούρεμα για το 2026

Νύχια: Τα μανικιούρ που θα εντυπωσιάσουν τους πάντες στα γιορτινά πάρτι

Βικτόρια Mπέκαμ: Με δάκρυα στα μάτια στο πρώτο trailer του ντοκιμαντέρ της

Μυϊκή μάζα σε αριθμούς: Πόσες επαναλήψεις είναι αρκετές;

Αυτοδιαχείριση: Πώς να αποφύγουμε ακριβά λάθη

Νέο Τεύχος

Life

Καθαριστής αέρα: Η νέα τεχνολογία που μας δίνει «ανάσα» ζωής

Daikin Altherma 4 H: Η «έξυπνη» αναβάθμιση για πιο αποδοτικό, άνετο και οικονομικό σπίτι

Λεονάρντο Ντι Κάπριο: Η αποκάλυψη για τον «Τιτανικό» που άφησε άφωνη την Τζένιφερ Λόρενς

Βικτόρια Μπέκαμ: Ποια συνήθεια του συζύγου της είναι η πιο ενοχλητική;

Το θρυλικό σπίτι του Home Alone ανακαινίζεται με στυλ 90s

Η NASA βρήκε το Άστρο της Βηθλεέμ: Μυστήριο 2000+ ετών λυθηκε;

Μαντόνα: «Έκοψε» από φωτογραφία τον πρώην σύζυγό της

Η Έμιλι Μπλαντ και ο Τζος Ο’Κόνορ στη νέα ταινία του Στίβεν Σπίλμπεργκ με εξωγήινους

NEWS

Αν έχετε στον λογαριασμό σας 100 ευρώ, ενδέχεται να κερδίσετε έναν πίνακα του Πικάσο αξίας ενός εκατομμυρίου

Eνέσιμα, ρυτίδες, η εξουσία γυμνή: Γιατί τα σοκαριστικά πορτρέτα του επιτελείου Τραμπ στo Vanity Fair έφεραν σεισμό – «Όχι άλλες μάσκες»

«Πράσινο φως» σε παλαιστινιακές σημαίες και γιουχάρισμα έδωσε η Αυστρία για την Eurovision 2026

Φόνος στο Μονακό – Ποιός δολοφόνησε τον δισεκατομμυριούχο τραπεζίτη Έντμοντ Σάφρα; Ο νοσοκόμος, η Ρωσική μαφία και η «μαύρη χήρα»

Τελευταίες Ειδήσεις

Πώς να χρησιμοποιήσετε τη θεωρία του “life audit” για να πετύχετε τους στόχους σας το 2026

Γιώργος Μαζωνάκης: Τι απαντά στη μήνυση για κακοποίηση

Ο μεγιστάνας Μπράιαν Τζόνσον: Ισχυρίζεται ότι η αθανασία δεν είναι πλέον σενάριο επιστημονικής φαντασίας

Αυτοδιαχείριση: Πώς να αποφύγουμε ακριβά λάθη

Η ρουτίνα μακιγιάζ της Gwyneth Paltrow πριν από κάθε red-carpet εμφάνισή της

Καθαριστής αέρα: Η νέα τεχνολογία που μας δίνει «ανάσα» ζωής

Daikin Altherma 4 H: Η «έξυπνη» αναβάθμιση για πιο αποδοτικό, άνετο και οικονομικό σπίτι

Οι γιορτές «στρεσάρουν» την καρδιά: Η επικίνδυνη έξαρση

Την Κυριακή 21 Δεκεμβρίου το «Βήμα της Κυριακής» κυκλοφορεί με συναρπαστικές προσφορές

Λεονάρντο Ντι Κάπριο: Η αποκάλυψη για τον «Τιτανικό» που άφησε άφωνη την Τζένιφερ Λόρενς

Βικτόρια Μπέκαμ: Ποια συνήθεια του συζύγου της είναι η πιο ενοχλητική;

Καιρός: Με διαδοχικές κακοκαιρίες μέχρι την Πρωτοχρονιά

MUST READ

Σκάνδαλο Astronomer: Η Kristin Cabot σπάει τη σιωπή της και δίνει τη δική της εκδοχή

Road trip Κατερίνη: Επιβλητικά τοπία, φύση και γαστρονομία

Γονείς: Πώς να αρνηθείτε με ευγένεια και χωρίς ενοχές προσκλήσεις μέσα στις γιορτές

Μαρία Δαμανάκη στο «ΒΗΜΑ»: Γιατί όχι ένα κοινό θαλάσσιο πάρκο με την Τουρκία;

Αγρότες: Βήμα – βήμα οι επόμενες κινήσεις – «Πάγωσε» ο διάλογος, «ζεστάθηκαν» τα μπλόκα

Υγιή και λαμπερά χείλη: Τα top picks για βαθιά ενυδάτωση