Συμβαίνουν εκπληκτικά πράγματα όταν φέρνεις μαζί 25 πράκτορες AI σε μια πόλη RPG

Μια ομάδα ερευνητών στο Πανεπιστήμιο του Στάνφορντ και την Google δημιούργησαν έναν εικονικό κόσμο μινιατούρας σε στυλ RPG παρόμοιο με sims, όπου 25 χαρακτήρες, που ελέγχονται από ChatGPT και προσαρμοσμένο κώδικα, ζουν τη ζωή τους ανεξάρτητα με υψηλό βαθμό ρεαλισμού. Έγραψαν για την εμπειρία τους στο Προεκτύπωση ακαδημαϊκής εργασίας Κυκλοφόρησε την Παρασκευή.

«Οι δημιουργοί ξυπνούν, μαγειρεύουν πρωινό και πηγαίνουν στη δουλειά, οι καλλιτέχνες ζωγραφίζουν, ενώ οι συγγραφείς γράφουν, σχηματίζουν απόψεις, σημειώνουν ο ένας τον άλλον και ξεκινούν συζητήσεις. Θυμούνται και στοχάζονται τις περασμένες μέρες καθώς σχεδιάζουν την επόμενη». γράφουν οι ερευνητές χαρτίGenerative Agents: Interactive Simulacra of Human Behavior.

Για να το επιτύχουν αυτό, οι ερευνητές βασίστηκαν σε μεγάλο βαθμό σε ένα μεγάλο γλωσσικό μοντέλο (LLM) για την κοινωνική αλληλεπίδραση, συγκεκριμένα στο ChatGPT API. Επιπλέον, δημιούργησαν μια αρχιτεκτονική που προσομοίωσε τα μυαλά με αναμνήσεις και εμπειρίες και στη συνέχεια άφηνε τους πράκτορες να μετακινούνται στον κόσμο για να αλληλεπιδράσουν. Και οι άνθρωποι μπορούν επίσης να αλληλεπιδράσουν μαζί τους.

Παραδείγματα αλληλεπιδράσεων στο Smallville Out Sheet <em> Παράγοντες παραγωγής </em>src=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_diagram_1-640×393.jpg” width=”640″ height=”393″ srcset=”https://cdn.arstechnica. net/wp-content/uploads/2023/04/gen_agents_diagram_1-640×393.jpg.” arstechnica.net/wp-content/uploads/2023/04/gen_agents_diagram_1.jpg 2x” decoding=”async” class=”amp-w enforced-sizes”/></a><figcaption class=

«Οι χρήστες μπορούν να παρακολουθούν και να παρεμβαίνουν όταν οι πελάτες προγραμματίζουν τις μέρες τους, μοιράζονται νέα, δημιουργούν σχέσεις και συντονίζουν ομαδικές δραστηριότητες», γράφουν. Είναι έργο των Jeon Sung Park, Joseph C. O’Brien, Carrie JK, Meredith Ringle Morris, Percy Liang και Michael S. Bernstein.

Οι υπολογιστές και τα βιντεοπαιχνίδια παρουσιάζουν χαρακτήρες ελεγχόμενους από υπολογιστή από τη δεκαετία του 1970, αλλά ποτέ πριν δεν μπόρεσαν να προσομοιώσουν ένα κοινωνικό περιβάλλον με την πολυπλοκότητα της φυσικής γλώσσας που μπορεί τώρα να είναι δυνατή χάρη σε παραγωγικά μοντέλα AI όπως το ChatGPT. Αν και η αναζήτηση του γκρουπ δεν είναι απαραίτητα ένα «παιχνίδι», θα μπορούσε να είναι ένα πρωτότυπο για ένα μέλλον στο οποίο οι δυναμικοί χαρακτήρες RPG αλληλεπιδρούν με πολύπλοκους και απρόβλεπτους τρόπους.

“Φανταστείτε να σκοτώνετε ένα NPC και να επιστρέφετε στην πόλη και να βλέπετε μια κηδεία για αυτούς». Ντένις Χάνσεν Όταν απαντάτε σε ένα θέμα σχετικά με τις αναδυόμενες επιπτώσεις της εργασίας. Με βάση αυτή την έρευνα, αυτό μπορεί να μην είναι ένα τραβηγμένο σενάριο.

Η ζωή στο Smallville

Για να μελετήσουν την ομάδα των πελατών της τεχνητής νοημοσύνης, οι ερευνητές δημιούργησαν μια εικονική πόλη που ονομάζεται “Smallville”, η οποία περιλαμβάνει σπίτια, καφετέρια, πάρκο και παντοπωλείο. Για τους σκοπούς της ανθρώπινης αλληλεπίδρασης, ο κόσμος αναπαρίσταται στην οθόνη από κάτοψη χρησιμοποιώντας γραφικά pixel ρετρό στυλ που θυμίζουν ένα κλασικό ιαπωνικό RPG 16-bit.

Διάγραμμα του — Μεγέθυνση / Σκίτσο του “Smallville” από *Μαιευτικοί παράγοντες* χαρτί.

Το Smallville φιλοξενεί μια κοινότητα 25 ξεχωριστών ατόμων, καθένα από τα οποία αντιπροσωπεύεται από ένα κύριο avatar. Για να καταγράψουν την ταυτότητα του κάθε πράκτορα και τις σχέσεις του με άλλα μέλη της κοινότητας, οι ερευνητές δημιούργησαν μια παράγραφο για να περιγράψουν τη φυσική γλώσσα ως μνήμη σπόρων. Αυτές οι περιγραφές περιλαμβάνουν λεπτομέρειες σχετικά με το επάγγελμα και τις σχέσεις κάθε πράκτορα με άλλους πράκτορες. Για παράδειγμα, εδώ είναι ένα απόσπασμα από μια τέτοια ακατέργαστη μνήμη που παρέχεται στην εργασία:

Ο John Lin είναι ιδιοκτήτης καταστήματος Willow Market και Pharmacy που του αρέσει να βοηθάει τους ανθρώπους. Πάντα αναζητά τρόπους για να διευκολύνει τη διαδικασία λήψης φαρμάκων για τους πελάτες του. Ο John Lin ζει με τη σύζυγό του May Lin, καθηγήτρια κολεγίου, και τον γιο του Eddie Lin, φοιτητή θεωρίας μουσικής. Ο Τζον Λιν αγαπάει πολύ την οικογένειά του.

Ως εικονικό περιβάλλον, το Smallville χωρίζεται σε περιοχές και αντικείμενα. Οι ανθρώπινοι χρήστες μπορούν να εισέλθουν στον κόσμο ως υπάρχων ή νέοι πράκτορες και τόσο οι χρήστες όσο και οι πράκτορες μπορούν να επηρεάσουν την κατάσταση των πραγμάτων μέσω ενεργειών. Οι ανθρώπινοι χρήστες μπορούν επίσης να αλληλεπιδράσουν με πράκτορες AI μέσω συνομιλίας ή εκδίδοντας οδηγίες ως «εσωτερική φωνή». Οι χρήστες επικοινωνούν σε φυσική γλώσσα, προσδιορίζοντας μια προσωπικότητα που κατανοεί ο πράκτορας ή που μπορεί να χρησιμοποιήσει την εσωτερική φωνή για να επηρεάσει τις ενέργειες του πράκτορα.

Κατά την ανάπτυξη του εικονικού κόσμου, μία από τις προκλήσεις προήλθε από την περιορισμένη «μνήμη» των LLM. Αυτή η μνήμη έρχεται ως “παράθυρο περιβάλλοντος”, που είναι ο αριθμός των διακριτικών (τμημάτων λέξεων) που μπορεί να επεξεργαστεί το ChatGPT κάθε φορά. Για να ξεπεράσουν αυτούς τους περιορισμούς, οι ερευνητές σχεδίασαν ένα σύστημα στο οποίο «τα πιο σχετικά μέρη της μνήμης ενός εργαζομένου» ανακτώνται και συντίθενται όταν χρειάζεται.

Οι πράκτορες γνωρίζουν το περιβάλλον τους και όλες οι αντιλήψεις αποθηκεύονται σε μια ολοκληρωμένη καταγραφή των εμπειριών του πράκτορα που ονομάζεται ροή μνήμης. Με βάση τις αντιλήψεις τους, η κατασκευή ανακτά σχετικές μνήμες και στη συνέχεια χρησιμοποιεί αυτές τις ανακαλούμενες ενέργειες για να καθορίσει τη δράση. Αυτές οι ανακαλούμενες μνήμες χρησιμοποιούνται επίσης για τη διαμόρφωση μακροπρόθεσμων σχεδίων και για τη δημιουργία σχετικών αντανακλαστικών υψηλότερου επιπέδου, και τα δύο εισάγονται στη ροή της μνήμης για μελλοντική χρήση.”

Είναι ενδιαφέρον ότι όταν οι χαρακτήρες στον κόσμο του sandbox συναντούν ο ένας τον άλλον, συχνά μιλούν μεταξύ τους χρησιμοποιώντας τη φυσική γλώσσα που παρέχεται από το ChatGPT. Με αυτόν τον τρόπο ανταλλάσσουν πληροφορίες και σχηματίζουν αναμνήσεις από την καθημερινότητά τους. Όταν οι ερευνητές συγκέντρωσαν αυτά τα βασικά στοιχεία και έκαναν προσομοιώσεις, άρχισαν να συμβαίνουν ενδιαφέροντα πράγματα.

Αναδυόμενη συμπεριφορά

Στο έγγραφο, οι ερευνητές αναφέρουν τρεις απροσδόκητες αναδυόμενες συμπεριφορές που προκύπτουν από την προσομοίωση. Κανένα από αυτά δεν ήταν προ-προγραμματισμένο, αλλά προέκυψε από αλληλεπιδράσεις μεταξύ παραγόντων.

Αυτά περιελάμβαναν «διάδοση πληροφοριών» (πράκτορες που λένε ο ένας στον άλλο πληροφορίες και τις διαδίδουν κοινωνικά στην πόλη), «μνήμη σχέσεων» (μνήμη προηγούμενων αλληλεπιδράσεων μεταξύ πρακτόρων και αργότερα ανάκληση αυτών των γεγονότων του παρελθόντος) και «συντονισμός» (σχεδιασμός και παρακολούθηση του Αγίου Βαλεντίνου Ημερήσιο πάρτι με άλλους πράκτορες). .

Κατά τη διάρκεια της δοκιμής για την Ημέρα του Αγίου Βαλεντίνου, μια πράκτορας AI ονόματι Isabella Rodriguez σχεδίασε ένα πάρτι για την Ημέρα του Αγίου Βαλεντίνου στο “Hobbs Café” και κάλεσε φίλους και πελάτες. Στολίζει το καφέ με τη βοήθεια της φίλης της Μαρίας, η οποία καλεί τον αγαπημένο της Κλάους στο πάρτι.

Διάγραμμα του "Smallville" Οι πράκτορες που αλληλεπιδρούν σχετικά με ένα πάρτι για την Ημέρα του Αγίου Βαλεντίνου από μια εφημερίδα <em> Παράγοντες παραγωγής </em>src=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/valentines_party-640×423.jpg” width=”640″ height=”423″ srcset=”https://cdn.arstechnica. net” arstechnica.net/wp-content/uploads/2023/04/valentines_party-1280×847.jpg 2x” decoding=”async” class=”amp-wp-enforced-sizes”/></a><figcaption class=

«Ξεκινώντας με μια μόνο ένδειξη που ορίζεται από τον χρήστη ότι ένας πράκτορας θέλει να οργανώσει ένα πάρτι για την Ημέρα του Αγίου Βαλεντίνου», έγραψαν οι ερευνητές, «οι πράκτορες δημοσίευσαν ανεξάρτητα προσκλήσεις για το πάρτι τις επόμενες δύο ημέρες, έκαναν νέες γνωριμίες, ρώτησαν ο ένας τον άλλον για ραντεβού για το πάρτι και συντονίστηκαν για να εμφανιστούν μαζί στο πάρτι».

Ενώ 12 πελάτες άκουσαν για το πάρτι μέσω άλλων, μόνο πέντε πελάτες (συμπεριλαμβανομένων των Klaus και Maria) εμφανίστηκαν. Τρεις από αυτούς είπαν ότι ήταν πολύ απασχολημένοι και τέσσερις πελάτες δεν πήγαν. Το πείραμα ήταν ένα διασκεδαστικό παράδειγμα των απροσδόκητων καταστάσεων που μπορεί να προκύψουν από περίπλοκες κοινωνικές αλληλεπιδράσεις στον εικονικό κόσμο.

Πιο ανθρώπινος από ανθρώπινος;

Ως μέρος της έρευνάς τους, η ομάδα ζήτησε από ανθρώπους αξιολογητές να παρακολουθήσουν επαναπροσομοιώσεις για να μετρήσουν πόσο καλά οι πράκτορες τεχνητής νοημοσύνης παρήγαγαν πιστευτή συμπεριφορά με βάση το περιβάλλον και τις εμπειρίες τους, συμπεριλαμβανομένων «λογικών σχεδίων, αντιδράσεων και ιδεών» και «διάδοσης πληροφοριών και σχηματισμού σχέσεων και συντονισμός πρακτόρων σε διαφορετικούς θύλακες της κοινωνίας».

στον ιστότοπο επίδειξης <em> Παράγοντες παραγωγής </em> μπορείτε να κάνετε κλικ στους χαρακτήρες για να δείτε τι σκέφτεται και τι αισθάνεται κάθε άτομο.” src=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_characters-640×568.jpg” width=” 640″ height =”568″ srcset=”https://cdn.arstechnica.net/wp-content/uploads/2023/04/gen_agents_characters.jpg 2x” decoding=”async” class=”amp-wp-enforced-sizes “/></a><figcaption class=

Οι ερευνητές ζήτησαν επίσης από τους ανθρώπους να παίξουν τις απαντήσεις των πρακτόρων σε ερωτήσεις συνέντευξης με τη φωνή του πράκτορα που παρακολούθησαν να επαναλαμβάνονται. Είναι ενδιαφέρον ότι ανακάλυψαν ότι η «πλήρη κατασκευή του παραγωγικού παράγοντα» παρήγαγε πιο πιστευτά αποτελέσματα από τους ανθρώπους που έπαιζαν ρόλους.

Αυτό οδηγεί σε άλλα ζητήματα, όπως οι ηθικές συνέπειες και οι κίνδυνοι αυτής της τεχνολογίας. Οι ερευνητές προειδοποίησαν για κινδύνους όπως ο σχηματισμός ακατάλληλων «κοινωνικών σχέσεων», ο αντίκτυπος λανθασμένων συμπερασμάτων, η έξαρση των υπαρχόντων κινδύνων που σχετίζονται με τη γενετική τεχνητή νοημοσύνη και ο κίνδυνος υπερβολικής εξάρτησης από παραγωγικούς παράγοντες στη διαδικασία σχεδιασμού.

Για να διασφαλιστεί η ηθική και κοινωνικά υπεύθυνη δημοσίευση, οι ερευνητές υποστηρίζουν ότι οι προγραμματιστές θα πρέπει να τηρούν αρχές όπως η ρητή αποκάλυψη της υπολογιστικής φύσης των πρακτόρων, η διασφάλιση της συμβατότητας αξίας, η τήρηση βέλτιστων πρακτικών στο σχεδιασμό ανθρώπινης τεχνητής νοημοσύνης, η διατήρηση αρχείων καταγραφής ελέγχου εισροών και εκροών και η μη αντικατάσταση πραγματικές ανθρώπινες εισροές σε μελέτες και διαδικασίες.το σχεδιασμό.

Για μια ματιά στο Smallville, οι ερευνητές δημοσίευσαν έναν φάκελο Διαδραστική οθόνη διαδικτυακά μέσω ενός ιδιόκτητου ιστότοπου, αλλά είναι μια “προ-υπολογισμένη εκ νέου προσομοίωση” που περιγράφεται στο έγγραφο και δεν είναι προσομοίωση σε πραγματικό χρόνο. Ωστόσο, παρέχει μια καλή απεικόνιση του πλούτου των κοινωνικών αλληλεπιδράσεων που μπορούν να προκύψουν από έναν φαινομενικά απλό εικονικό κόσμο που τρέχει σε ένα sandbox υπολογιστή.

Dionysos Alec

“Τηλεοπτικός γκουρού. Υποστηρικτής της ζόμπι. Οπαδός του διαδικτύου. Πιστοποιημένος μπύρας. Υπερήφανος αναγνώστης. Φανταστικός αλκοόλ. Βραβευμένος επιχειρηματίας.”

Συμβαίνουν εκπληκτικά πράγματα όταν φέρνεις μαζί 25 πράκτορες AI σε μια πόλη RPG – Ars Technica

Η ζωή στο Smallville

Αναδυόμενη συμπεριφορά

Πιο ανθρώπινος από ανθρώπινος;

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ζωή στο Smallville

Αναδυόμενη συμπεριφορά

Πιο ανθρώπινος από ανθρώπινος;

Related Posts

Τα νέα iPad Pro, iMac, Apple TV 4K και το νέο Siri Remote είναι τώρα διαθέσιμα

Ο Sammy Hagar ελπίζει ότι η Ferrari LaFerrari του θα πιάσει ένα ποσό ρεκόρ σε δημοπρασία

Μια νέα γενιά κρυπτονομισμάτων: Ο διαγωνισμός Ethereum έρχεται – Polkadots DOT μεταξύ των κορυφαίων 10 κρυπτονομισμάτων | Μήνυμα

Αφήστε μια απάντηση Ακύρωση απάντησης