Πριν από μερικούς μήνες, ο 28χρονος διευθύνων σύμβουλος της Scale AI, Alexandr Wang, έκανε τίτλους μετά την εταιρεία του, μετά από έναν άγρια επιτυχημένο γύρο χρηματοδότησης που περιελάμβανε τη Meta, την Amazon και τη Microsoft.
The World of AI Data
Για να εξηγήσουμε αυτή την απαίτηση, ας χρησιμοποιήσουμε την αναλογία ενός μολύβδου και ενός μολύβδου: ένα μολύβι χωρίς μολύβδου δεν θα μπορούσε να εκφραστεί σε χαρτί, όπως συμβαίνει με ένα μπουκάλι με μολύβι χωρίς μολύβι. Ομοίως, ένα προϊόν τεχνητής νοημοσύνης όπως το ChatGPT, ο Claude και ο Gemini είναι ο προσεκτικός συνδυασμός δεδομένων κατάρτισης και μιας αρχιτεκτονικής – συνήθως μοντέλου τύπου Transformer – που επιτρέπει την έκφραση των δεδομένων σε μια χρήσιμη μορφή.
Μια μεγάλη ποσότητα δεδομένων είναι απαραίτητη για την κατάρτιση σύγχρονων μοντέλων μεγάλων γλωσσών (ChatGPT 4o, ένα εξέχον LLM, εκτιμάται ότι έχει περίπου__1,8 δισεκατομμύρια εισόδους παραμέτρων__), και έτσι οι εταιρείες γενικής χρήσης τεχνητής νοημοσύνης στράφηκαν στο μεγαλύτερο αποθετήριο ανοιχτού κώδικα γλωσσικών δεδομένων στην ανθρώπινη ιστορία - το Διαδίκτυο.Εκτός από την εκπαίδευση σε δείγματα κειμένου και εικόνων από κάθε ιστοσελίδα που μπορεί να φανταστεί κανείς, τα state-of-the-art LLMs τροφοδοτούνται συνεχώς με περισσότερα δεδομένα από
Why Humans?
Δεν αποτελεί έκπληξη το γεγονός ότι σε μεγάλα σύνολα δεδομένων, μια ποικιλία επιβλαβών περιεχομένων που εκτελούν το φάσμα από το σεξουαλικά ρητό υλικό έως την ομιλία μίσους συνδυάζεται με υγιή εκπαιδευτικά δεδομένα κατάρτισης, όπως ήταν η περίπτωση με το υποσύνολο δεδομένων του Διαδικτύου που χρησιμοποιείται για την κατάρτιση των πιο σύγχρονων chatbots LLM.
Από τεχνική άποψη, το RLHF δεν είναι διαφορετικό από τους τυπικούς αλγόριθμους μάθησης ενίσχυσης της μηχανικής μάθησης: ένα βαθύ δίκτυο χρησιμοποιείται για να εκχωρήσει μια βαθμολογία σε μια αντίδραση που παράγεται από την τεχνητή νοημοσύνη με βάση πραγματικά δεδομένα με ανθρώπινη σήμανση, ενώ η τεχνητή νοημοσύνη γίνεται επανειλημμένα για να δημιουργήσει απαντήσεις που στη συνέχεια τροφοδοτούνται σε αυτό το βαθύ δίκτυο, βαθμολογώντας αποτελεσματικά το πόσο επιβλαβής είναι η απάντηση. μια έξοδος που θεωρείται παρόμοια με τα ανθρώπινα «επιβλαβή» δεδομένα θα επηρεάσει αρνητικά την τάση του μοντέλου να παράγει κάτι παρό
The Issue?
Αντίθετα, το μοντέλο RLHF που υποτίθεται ότι καθιστά την τεχνητή νοημοσύνη ασφαλή και καλοήθη εξαρτάται σε μεγάλο βαθμό από εκατοντάδες χιλιάδες υποπληρωμένους εργαζόμενους, οι περισσότεροι από τους οποίους συμβάλλουν σε ανεκτίμητες υπηρεσίες επισήμανσης δεδομένων μέσω ηλεκτρονικών πλατφορμών «cloudwork». Οι περισσότερες από αυτές τις πλατφόρμες ακολουθούν μια μορφή «εγγράφου και εργολάβου», στην οποία πληθώρα εργαζομένων στο διαδίκτυο ανατίθενται σε μία εργασία, λαμβάνοντας αμοιβή μετά την ολοκλήρωση οποιουδήποτε καθήκοντος προβλέπεται, από την επισήμανση του περιεχομένου μιας εικόνας ή βίντεο έως τη σάρωση το
- Καμία από τις αναφερόμενες πλατφόρμες δεν διαθέτει μηχανισμούς ή πολιτικές που εξασφαλίζουν ότι οι εργολάβοι λαμβάνουν πληρωμή από τους αιτούντες για ολοκληρωμένες εργασίες.
- Μόνο μία από τις αναφερόμενες πλατφόρμες (Appen) έχει πολιτικές που εξασφαλίζουν την QoL των εργαζομένων μέσω της μείωσης της υπερβολικής εργασίας.
- Καμία από τις αναφερόμενες πλατφόρμες δεν έχει σαφείς και εύκολα ερμηνευμένες συμβάσεις που προβλέπουν όρους πληρωμής και εργασίας.
- Καμία από τις αναφερόμενες πλατφόρμες δεν έχει δείξει ότι λαμβάνει υπόψη την ανατροφοδότηση των εργολάβων κατά τη λήψη εκτελεστικών αποφάσεων.
- Μόνο μία από τις αναφερόμενες πλατφόρμες (Appen) έχει πολιτικές που αναγνωρίζουν το δικαίωμα του εργατικού συνεταιρίζεσθαι.
Real People, Real Impact
Η θλιβερή έλλειψη δικαιωμάτων αυτών των εργαζομένων δεδομένων έχει ως αποτέλεσμα τη δημιουργία μιας μη αναγνωρισμένης και υποτιμημένης «υποκατηγορίας» εργαζομένων της τεχνητής νοημοσύνης. Αυτοί οι άνθρωποι, συχνά απελπισμένοι να κερδίσουν λίγο επιπλέον εισόδημα για να στηρίξουν την οικογένειά τους, ξοδεύουν ώρες και ώρες μπροστά στον υπολογιστή τους κάθε μέρα, περνώντας από μικρές και επαναλαμβανόμενες εργασίες επισήμανσης δεδομένων, συχνά έρχονται αντιμέτωποι με τους χειρότερους τρόπους της ανθρώπινης διαφθοράς.
Ως εργολάβοι, οι εργαζόμενοι δεν προστατεύονται από τους νόμους περί μισθών και, σε πολλές περιπτώσεις, δεν πληρώνονται για υπερωρίες. Οι απομακρυσμένες εργασίες θέτουν όριο στον μέγιστο αριθμό ωρών εργασίας για τις οποίες πληρώνεται ένας συμμετέχων και η πλατφόρμα αναθέτει εργασίες μετά από μια μακρά διαδικασία «προσόντων» για την οποία ένας μελλοντικός εργολάβος δεν πληρώνεται.
Εκατοντάδες χιλιάδες άνθρωποι εργάζονται στην ετικέτα δεδομένων τεχνητής νοημοσύνης καθημερινά, ωστόσο η απογοήτευσή τους συρρικνώνεται τυχαία από την κακή υποστήριξη πελατών και την έλλειψη πλατφόρμας.
Συμπτωματικά, η Remotasks, μία από τις μεγαλύτερες τέτοιες εταιρείες επισήμανσης δεδομένων AI, είναι μια βασική επιχορήγηση στην Scale AI που παρέχει ετικέτα δεδομένων κατάρτισης ως μέρος των υπηρεσιών κατασκευής AI της εταιρείας. Επίσημα ιδρύθηκε για να "διατηρήσει το απόρρητο των χρηστών", αυτός ο διαχωρισμός προσπαθεί να καλύψει μερικές από τις λιγότερο γευστικές επιχειρηματικές πρακτικές της μεγάλης εταιρείας από το δημόσιο μάτι. στην πραγματικότητα, όταν κάποιος θεωρεί ότι η Remotasks σημείωσε μόνο το 1/10 στην κλίμακα δίκαιης εργασίας της Fairwork, με το 10/10 να είναι η "ελάχιστη απαίτηση για ένα δίκαιο εργασιακό περιβάλλον", υπάρχει σίγουρα πολύ να συζητηθεί για
Αυτό το άρθρο σας φέρνει το Our AI, ένας φοιτητικός και φοιτητικός οργανισμός δεοντολογίας AI που επιδιώκει να διαφοροποιήσει τις προοπτικές στον τομέα της τεχνητής νοημοσύνης πέρα από αυτό που συζητείται συνήθως στα σύγχρονα μέσα.
Αυτό το άρθρο σας φέρνει το Our AI, ένας οργανισμός δεοντολογίας AI που ιδρύθηκε από φοιτητές και διοικείται από φοιτητές και επιδιώκει να διαφοροποιήσει τις προοπτικές στην τεχνητή νοημοσύνη πέρα από αυτό που συζητείται συνήθως στα σύγχρονα μέσα ενημέρωσης.https://www.our-ai.org/ai-nexus/read!
Raise Awareness
Ως ισχυρός υποστηρικτής της ανάπτυξης της ανθρώπινης τεχνητής νοημοσύνης, υποστηρίζω ότι τα τρέχοντα πρότυπα και οι πολιτικές είναι ανεπαρκή για να διασφαλιστεί ότι οι τεχνολογίες μας δεν επηρεάζουν αρνητικά και δόλια την ανθρωπότητά μας.Αν ενδιαφέρεστε αρκετά για την υπεύθυνη και ασφαλή ανάπτυξη της τεχνητής νοημοσύνης, όχι μόνο για την Silicon Valley αλλά για την ανθρωπότητα στο σύνολό της, σας ενθαρρύνω έντονα να ευαισθητοποιήσετε για τις παραβιάσεις των δικαιωμάτων των εργαζομένων στη βιομηχανία τεχνητής νοημοσύνης - είτε μοιράζοντας αυτό το άρθρο είτε κάνοντας τη δική σας έρευνα - και υποστηρίζοντας τις πολιτικές
Ο κόσμος αξίζει να γνωρίζει – και εσείς πρέπει να παίξετε το ρόλο σας.
Συγγραφέας: Thomas Yin