Γίνετε μέλος του Leaders στη Βοστώνη στις 27 Μαρτίου για μια αποκλειστική βραδιά δικτύωσης, ιδεών και συνομιλιών. Ζητήστε μια πρόσκληση εδώ.
Η διάσημη υπηρεσία δημιουργίας εικόνων τεχνητής νοημοσύνης Κατά τη διάρκεια της πτήσης Έχει κυκλοφορήσει ένα από τα πιο απαιτούμενα χαρακτηριστικά του: τη δυνατότητα αναδημιουργίας χαρακτήρων με συνέπεια σε νέες εικόνες.
Από τη φύση του, αυτό ήταν ένα σημαντικό εμπόδιο για τις γεννήτριες εικόνων AI μέχρι σήμερα.
Αυτό συμβαίνει επειδή οι περισσότερες γεννήτριες εικόνων AI βασίζονται σε “Μοντέλα διάχυσης“, εργαλεία παρόμοια με ή βασισμένα στον αλγόριθμο δημιουργίας εικόνων ανοιχτού κώδικα Stability AI Stable Diffusion, ο οποίος λειτουργεί κατά προσέγγιση παίρνοντας το κείμενο που εισάγει ο χρήστης και προσπαθώντας να συνδυάσει μια εικόνα pixel προς pixel που ταιριάζει με αυτήν την περιγραφή, όπως έχουμε έμαθε από παρόμοια πειράματα με εικόνες και ετικέτες κειμένου σε μια ομάδα Τεράστια (και αμφιλεγόμενα) εκπαιδευτικά δεδομένα που περιλαμβάνουν εκατομμύρια εικόνες που δημιουργήθηκαν από τον άνθρωπο.
Γιατί οι συνεπείς προσωπικότητες είναι τόσο ισχυρές – και άπιαστες – για τη γενετική τεχνητή νοημοσύνη
Ωστόσο, όπως συμβαίνει με μεγάλα μοντέλα γλώσσας που βασίζονται σε κείμενο (LLM) όπως το ChatGPT του OpenAI ή το νέο Command-R του Cohere, το πρόβλημα με όλες τις εφαρμογές τεχνητής νοημοσύνης που δημιουργούνται είναι η ασυνέπεια των απαντήσεων: η τεχνητή νοημοσύνη δημιουργεί κάτι νέο για κάθε μεμονωμένη προτροπή που εισάγεται σε αυτό. , ακόμα κι αν η αξίωση επαναλαμβάνεται ή χρησιμοποιούνται ορισμένες από τις ίδιες λέξεις-κλειδιά.
Εκδήλωση VB
Περιήγηση Τεχνητής Νοημοσύνης – Βοστώνη
Ζητήστε μια πρόσκληση
Αυτό είναι εξαιρετικό για τη δημιουργία εντελώς νέων κομματιών περιεχομένου – στην περίπτωση του Midjourney, εικόνες. Αλλά τι γίνεται αν κάνετε μια ταινία, μυθιστόρημα, graphic novel, κόμικ ή κάποιο άλλο οπτικό μέσο που σας αρέσει Το ίδιο Ένας χαρακτήρας ή χαρακτήρες για να κινηθείτε και να εμφανιστείτε σε διαφορετικές σκηνές και σκηνικά, με διαφορετικές εκφράσεις προσώπου και σκηνικά;
Αυτό το ακριβές σενάριο, το οποίο είναι συνήθως απαραίτητο για την αφηγηματική συνέχεια, ήταν πολύ δύσκολο να επιτευχθεί με τη χρήση γενετικής τεχνητής νοημοσύνης – μέχρι τώρα. Αλλά το Midjourney εργάζεται τώρα για αυτό το πρόβλημα, εισάγοντας μια νέα ετικέτα, το “–cref” (συντομογραφία για “αναφορά χαρακτήρων”) που οι χρήστες μπορούν να προσθέσουν στο τέλος των μηνυμάτων κειμένου τους στο Midjourney Discord και θα προσπαθήσουν να ταιριάξουν με το πρόσωπο ενός χαρακτήρα. Χαρακτηριστικά, σωματότυπος και ακόμη και ρούχα από τη διεύθυνση URL που επικολλά ο χρήστης στην επόμενη αναφερόμενη ετικέτα.
Καθώς η δυνατότητα εξελίσσεται και βελτιώνεται, το Midjourney πέρα από ένα ωραίο παιχνίδι ή πηγή ιδεών θα μπορούσε να μετατραπεί σε ένα πιο επαγγελματικό εργαλείο.
Πώς να χρησιμοποιήσετε το νέο χαρακτηριστικό συνεπούς προσωπικότητας του Midjourney
Η ετικέτα λειτουργεί καλύτερα με εικόνες Midjourney που δημιουργήθηκαν προηγουμένως. Έτσι, για παράδειγμα, η ροή εργασίας του χρήστη θα ήταν να δημιουργήσει ή να ανακτήσει τη διεύθυνση URL ενός χαρακτήρα που δημιουργήθηκε προηγουμένως.
Ας ξεκινήσουμε από το μηδέν και ας πούμε ότι δημιουργούμε έναν νέο χαρακτήρα με αυτή την προτροπή: «Φαλακρός, μυώδης άντρας με χάντρα και μάτι».
Θα αναβαθμίσουμε την εικόνα που μας αρέσει περισσότερο και, στη συνέχεια, θα κάνουμε Control-κλικ σε αυτήν στον διακομιστή Midjourney Discord για να βρείτε την επιλογή “Αντιγραφή συνδέσμου”.
Στη συνέχεια, μπορούμε να γράψουμε μια νέα προτροπή στο «Φορέστε ένα λευκό σμόκιν ενώ στέκεστε σε μια βίλα-cref». [URL]” και επικολλήστε τη διεύθυνση URL της εικόνας που μόλις δημιουργήσαμε και το Midjourney θα προσπαθήσει να δημιουργήσει τον ίδιο χαρακτήρα από πριν στη ρύθμιση που πληκτρολογήσαμε πρόσφατα.
Όπως θα δείτε, τα αποτελέσματα απέχουν πολύ από το να ταιριάζουν με τον αρχικό αριθμό (ή ακόμα και τον αρχικό μας ισχυρισμό), αλλά είναι σίγουρα ενθαρρυντικά.
Επιπλέον, ο χρήστης μπορεί να ελέγξει σε κάποιο βαθμό το “βάρος” του πόσο κοντά παράγεται η νέα εικόνα στον αρχικό χαρακτήρα εφαρμόζοντας τη σημαία “-cw” ακολουθούμενη από έναν αριθμό από το 1 έως το 100 στο τέλος της νέας προτροπής ( μετά «-κρεφ [URL]”string, όπως αυτό:”-cref [URL] – CW 100.” Όσο χαμηλότερος είναι ο αριθμός “CW”, τόσο μεγαλύτερη είναι η αντίθεση στην εικόνα που προκύπτει. Όσο υψηλότερος είναι ο αριθμός “CW”, τόσο πιο κοντά η νέα εικόνα που προκύπτει ακολουθεί την αρχική αναφορά.
Όπως μπορείτε να δείτε στο παράδειγμά μας, η εισαγωγή “cw 8” πολύ χαμηλά στην πραγματικότητα επέστρεψε αυτό που θέλαμε: το λευκό σμόκιν. Αν και τώρα έχει αφαιρέσει το χαρακτηριστικό προσοφθάλμιο του χαρακτήρα μας.
Λοιπόν, δεν υπάρχει τίποτα που μια «διαφορετική περιοχή» δεν μπορεί να διορθώσει — σωστά;
Λοιπόν, το έμπλαστρο ματιών τοποθετήθηκε σε λάθος μάτι… αλλά φτάσαμε εκεί!
Μπορείτε επίσης να συνδυάσετε πολλούς χαρακτήρες σε έναν χρησιμοποιώντας δύο ετικέτες “–cref” μαζί με τις αντίστοιχες διευθύνσεις URL τους.
Το χαρακτηριστικό κυκλοφόρησε νωρίτερα σήμερα το απόγευμα, αλλά καλλιτέχνες και δημιουργοί το δοκιμάζουν τώρα. Δοκιμάστε το μόνοι σας αν έχετε Midjourney. Και διαβάστε το πλήρες σημείωμα του ιδρυτή David Holz για το θέμα παρακάτω:
Γεια σας @everyone @εδώ, δοκιμάζουμε τη νέα δυνατότητα Αναφοράς χαρακτήρων σήμερα, αυτή είναι παρόμοια με τη λειτουργία Αναφοράς Μοτίβου, εκτός από το ότι αντί να ταιριάζει με ένα στυλ αναφοράς, προσπαθεί να κάνει τον χαρακτήρα να ταιριάζει με την εικόνα Αναφοράς χαρακτήρων.
Πως δουλεύει
- Αυτός γράφει
--cref URL
Αφού σας ζητηθεί η διεύθυνση URL της εικόνας του προφίλ σας - μπορείς να χρησιμοποιήσεις
--cw
Για να ρυθμίσετε την “δύναμη” της αναφοράς από 100 σε 0 - Αντοχή 100 (
--cw 100
) Προεπιλογή και χρησιμοποιεί πρόσωπο, μαλλιά και ρούχα - (έντονο 0)
--cw 0
) θα εστιάσει μόνο στο πρόσωπο (καλό για αλλαγή ρούχων/μαλλιών κ.λπ.)
Σε τι προορίζεται
- Αυτή η δυνατότητα λειτουργεί καλύτερα όταν χρησιμοποιείτε χαρακτήρες που δημιουργούνται από εικόνες Midjourney. Δεν έχει σχεδιαστεί για πραγματικούς ανθρώπους/εικόνες (και πιθανότατα θα τις παραμορφώσει όπως κάνουν οι κανονικές προτροπές εικόνας)
- Το Cref λειτουργεί παρόμοια με τις κανονικές προτροπές εικόνας, εκτός από το ότι “εστιάζει” σε χαρακτηριστικά χαρακτήρα
- Η ακρίβεια αυτής της τεχνικής είναι περιορισμένη, δεν θα αναπαράγει ακριβώς λακκάκια/ φακίδες/ ή λογότυπα πουκαμίσου.
- Το Cref λειτουργεί με κανονικά μοντέλα Niji και MJ και μπορεί επίσης να συνδυαστεί με
--sref
Προχωρημένες επιλογές
- Μπορείτε να χρησιμοποιήσετε περισσότερες από μία διευθύνσεις URL για να συνδυάσετε πληροφορίες/χαρακτήρες από πολλές εικόνες όπως αυτή
--cref URL1 URL2
(Αυτό είναι παρόμοιο με πολλές προτροπές εικόνας ή στυλ)
Πώς λειτουργεί στον ιστό alpha;
- Σύρετε ή επικολλήστε μια εικόνα στη γραμμή οπτικοποίησης, όπου τώρα περιέχει τρία εικονίδια. Καθορίστε αυτές τις ομάδες είτε είναι διάνυσμα εικόνας, αναφορά στυλ ή αναφορά χαρακτήρων. Shift+Επιλέξτε μια επιλογή για χρήση μιας εικόνας για πολλές κατηγορίες
Θυμηθείτε, αν και το MJ V6 βρίσκεται σε στάδιο άλφα, άλλα χαρακτηριστικά μπορεί να αλλάξουν ξαφνικά, αλλά η επίσημη έκδοση beta του V6 θα έρθει σύντομα. Θα θέλαμε πολύ να μοιραστούμε τις σκέψεις όλων για τις Ιδέες και τις δυνατότητες και ελπίζουμε να απολαύσετε αυτήν την πρώιμη κυκλοφορία και ελπίζουμε να σας βοηθήσει καθώς παίζετε στη δημιουργία ιστοριών και κόσμων
Η αποστολή του VentureBeat Πρόκειται να είναι μια ψηφιακή πλατεία πόλης για τους υπεύθυνους λήψης τεχνικών αποφάσεων ώστε να αποκτήσουν γνώσεις σχετικά με την τεχνολογία μετασχηματισμού και συναλλακτικών επιχειρήσεων. Ανακαλύψτε τις περιλήψεις μας.
“Τηλεοπτικός γκουρού. Υποστηρικτής της ζόμπι. Οπαδός του διαδικτύου. Πιστοποιημένος μπύρας. Υπερήφανος αναγνώστης. Φανταστικός αλκοόλ. Βραβευμένος επιχειρηματίας.”