Ηθικά ζητήματα σχετικά με το ChatGPT

Δεδομένα επισήμανσης
Από έρευνα του περιοδικού TIME αποκαλύφθηκε ότι για να δημιουργήσει ένα σύστημα ασφαλείας κατά του τοξικού περιεχομένου (π.χ. σεξουαλική κακοποίηση, βία, ρατσισμός, σεξισμός κ.λπ.), η OpenAI χρησιμοποίησε εξωτερικούς συνεργάτες από την Κένυα που αμείβονταν λιγότερο από 2 δολάρια την ώρα για την επισήμανση του τοξικού περιεχομένου. Αυτές οι ετικέτες χρησιμοποιήθηκαν για την εκπαίδευση ενός μοντέλου ώστε να ανιχνεύει τέτοιο περιεχόμενο στο μέλλον. Οι εξωτερικοί συνεργάτες εκτέθηκαν σε τόσο τοξικό και επικίνδυνο περιεχόμενο που περιέγραψαν την εμπειρία ως «βασανιστήρια». Ο συνεργάτης εξωτερικής ανάθεσης της OpenAI ήταν η Sama, μια εταιρεία δεδομένων εκπαίδευσης με έδρα το Σαν Φρανσίσκο της Καλιφόρνια.

Jailbreaking
Το ChatGPT επιχειρεί να απορρίψει μηνύματα που ενδέχεται να παραβιάζουν την πολιτική περιεχομένου του. Ωστόσο, ορισμένοι χρήστες κατάφεραν να κάνουν jailbreak στο ChatGPT χρησιμοποιώντας διάφορες τεχνικές μηχανικής προτροπών για να παρακάμψουν αυτούς τους περιορισμούς στις αρχές Δεκεμβρίου 2022 και ξεγέλασαν με επιτυχία το ChatGPT ώστε να δώσει οδηγίες για το πώς να φτιάξει ένα κοκτέιλ μολότοφ ή μια πυρηνική βόμβα ή να δημιουργήσει επιχειρήματα στο στυλ ενός νεοναζί. Ένας δημοσιογράφος του Toronto Star είχε άνιση προσωπική επιτυχία στο να κάνει το ChatGPT να κάνει εμπρηστικές δηλώσεις λίγο μετά την κυκλοφορία του: Το ChatGPT ξεγελάστηκε για να υποστηρίξει τη ρωσική εισβολή στην Ουκρανία το 2022, αλλά ακόμη και όταν του ζητήθηκε να συμμετάσχει σε ένα φανταστικό σενάριο, το ChatGPT δίστασε να δημιουργήσει επιχειρήματα για το γιατί ο Καναδός πρωθυπουργός Τζάστιν Τριντό ήταν ένοχος προδοσίας. (wiki)

Ώρα δημοσίευσης: 18 Φεβρουαρίου 2023