Breaking
Σα. Νοέ 23rd, 2024

Εξασκηθείτε με τη γεννήτρια μουσικής της Google με τεχνητή νοημοσύνη

Εξασκηθείτε με τη γεννήτρια μουσικής της Google με τεχνητή νοημοσύνη

Πιστώσεις εικόνας: Jason Alden/Bloomberg/Getty Images

Μπορεί το AI να λειτουργήσει αντίστροφα από μια περιγραφή κειμένου για να δημιουργήσει ένα συνεκτικό τραγούδι; Αυτό είναι το σημείο εκκίνησης MusicLMτο εργαλείο δημιουργίας μουσικής με τεχνητή νοημοσύνη που κυκλοφόρησε χθες η Google κατά την έναρξη του I/O.

Το MusicLM, το οποίο έχει εκπαιδευτεί σε εκατοντάδες χιλιάδες ώρες ήχου για να μάθει να δημιουργεί νέα μουσική σε μια σειρά από στυλ, είναι διαθέσιμο σε προεπισκόπηση μέσω της εφαρμογής Google AI Test Kitchen. Έχω παίξει με αυτό την τελευταία μέρα περίπου, όπως και μερικοί από τους συντρόφους μου.

ετυμηγορία? Ας πούμε απλώς ότι η MusicLM δεν θα έρθει σύντομα σε δουλειές μουσικών.

Η χρήση του MusicLM στη δοκιμαστική κουζίνα είναι πολύ εύκολη. Μόλις εγκριθεί η πρόσβαση, θα εμφανιστεί ένα πλαίσιο κειμένου όπου μπορείτε να εισαγάγετε μια περιγραφή του τραγουδιού -όσο αναλυτικά θέλετε- και να ζητήσετε από το σύστημα να δημιουργήσει δύο εκδόσεις του τραγουδιού. Και τα δύο μπορούν να ληφθούν για ακρόαση εκτός σύνδεσης, αλλά η Google σάς ενθαρρύνει να κάνετε “μου αρέσει” ένα κομμάτι για να βελτιώσετε την απόδοση του AI.

Πιστώσεις εικόνας: Google

Όταν διασκέδασα το MusicLM για πρώτη φορά τον Ιανουάριο, πριν από την κυκλοφορία του, έγραψα ότι τα τραγούδια του συστήματος ακούγονταν σαν να συνθέτει ένας άνθρωπος καλλιτέχνης — αν και όχι απαραίτητα μουσικά εφευρετικά ή συνεκτικά. Τώρα δεν μπορώ να πω ότι επιμένω απόλυτα σε αυτά τα λόγια, καθώς φαίνεται ξεκάθαρο ότι έγινε κάποια σοβαρή συλλογή κερασιών με δείγματα από νωρίτερα μέσα στη χρονιά.

Τα περισσότερα από τα τραγούδια που έχω δημιουργήσει με το MusicLM ήχο βατό στην καλύτερη περίπτωση—και στη χειρότερη σαν χαμένο τετράχρονο ΚΑΛΙΑΚΟΥΔΑ. Κυρίως έμεινα στο EDM, προσπαθώντας να προσφέρω κάτι με ξεχωριστή δομή και μελωδία (καθώς και απαλή, ιδανικά). Αλλά όσο αξιοπρεπές κι αν είναι – ακόμα και καλό! – Ακούγεται σαν την αρχή των τραγουδιών του MusicLM, έρχεται μια στιγμή που τα τραγούδια καταρρέουν με έναν πολύ προφανή και μουσικά δυσάρεστο τρόπο.

READ  Random: Animation Reimagine Zelda: Tears Of The Kingdom As A Game Boy Τίτλος χρώματος

Για παράδειγμα, πάρτε αυτό το πρότυπο, το οποίο δημιουργήθηκε με ένα “EDM τραγούδι σε ένα ελαφρύ, χαρούμενο, ευάερο στυλ, καλό για χορό.” Ξεκινά πολλά υποσχόμενο, με μια βασική γραμμή και στοιχεία ενός κλασικού τραγουδιού των Daft Punk. Αλλά στα μισά της πορείας, ξεφεύγει από την πορεία του—πρακτικά άλλου είδους.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_edm_song_in_a_light_upbeat_and_airy_style_g-2.mp3?_=1

Αυτό είναι ένα σόλο πιάνου από ένα απλούστερο κύμα – “Ρομαντική και συναισθηματική μουσική πιάνου”. Θα παρατηρήσετε ότι τα εξαρτήματα φαίνονται και αισθάνονται καλά και ωραία – εξαιρετικά ακόμη και, τουλάχιστον όσον αφορά την εργασία με τα δάχτυλα. Τότε όμως είναι σαν να έχει πάθει εμμονή ο πιανίστας με τη μανία. Μια μίξη από νότες αργότερα, και το τραγούδι παίρνει μια ριζικά διαφορετική κατεύθυνση, σαν από ένα νέο φύλλο μουσικής – παρόμοιο με το πρωτότυπο.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_romantic_and_emotional_piano_music.mp3?_=2

Δοκίμασα το χέρι της MusicLM στα chiptunes για να το ελέγξω και σκέφτηκα ότι το AI μπορεί να είναι πιο εύκολο με τραγούδια με βασική κατασκευή. Δεν κάνουμε ζάρια. Το αποτέλεσμα (παρακάτω), αν και ελκυστικό εν μέρει, κατέληξε το ίδιο τυχαίο με τα άλλα δείγματα.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_house_music_in_chiptune_with_an_energetic_ba.mp3?_=3

Το θετικό είναι ότι το MusicLM κάνει, γενικά, πολύ καλύτερη δουλειά από το Jukebox, που είναι η προσπάθεια του OpenAI πριν από αρκετά χρόνια να δημιουργήσει μια γεννήτρια μουσικής AI. Σε αντίθεση με το MusicLM, τα τραγούδια που παράγονται από το Jukebox δεν είχαν τυπικά μουσικά στοιχεία, όπως ρεφρέν που επαναλαμβάνονταν και συχνά περιείχαν ανόητες λέξεις. Τα τραγούδια που παράγονται από τη MusicLM έχουν επίσης λιγότερα τεχνουργήματα και γενικά αισθάνονται σαν ένα βήμα προς τα πάνω από την άποψη της πιστότητας.

READ  Το Starfield περιλαμβάνει ένα απροσδόκητο Πασχαλινό αυγό Ghostbusters

Η εμφάνιση του Dance Diffusion έρχεται αρκετά χρόνια αφότου το OpenAI, το εργαστήριο με έδρα το Σαν Φρανσίσκο πίσω από το DALL-E 2, παρουσίασε λεπτομερώς το μεγαλειώδες πείραμά του με τη δημιουργία μουσικής, το οποίο ονομάζει Jukebox. Δεδομένου του είδους, του καλλιτέχνη και ενός αποσπάσματος στίχων, το Jukebox μπορεί να δημιουργήσει σχετικά συνεκτική μουσική με φωνητικά. Αλλά τα τραγούδια που παράγονται από το Jukebox δεν έχουν τις μεγαλύτερες μουσικές δομές, όπως τα επαναλαμβανόμενα ρεφρέν που περιέχουν συχνά ανόητες λέξεις.

Επιπλέον, η χρησιμότητα του MusicLM είναι κάπως περιορισμένη, χάρη στους τεχνητούς περιορισμούς στην πλευρά του ερεθίσματος. Μουσική με καλλιτέχνες ή φωνητικά δεν θα γεννιόταν, ούτε καν μέσα στυλ συγκεκριμένους μουσικούς. Δοκιμάστε να πληκτρολογήσετε ένα μήνυμα όπως “παρόμοιο με τον Barry Manilow” και θα λάβετε μόνο ένα μήνυμα σφάλματος.

Πιστώσεις εικόνας: Google

Ο λόγος είναι μάλλον νόμιμος. Η Deepfaked μουσική βρίσκεται σε μια διφορούμενη νομική βάση, σε τελική ανάλυση, καθώς ορισμένοι στη μουσική βιομηχανία υποστηρίζουν ότι οι παραγωγοί μουσικής με τεχνητή νοημοσύνη, όπως η MusicLM, παραβιάζουν τα πνευματικά δικαιώματα της μουσικής. Μπορεί να μην περάσει πολύς καιρός μέχρι να υπάρξει κάποια σαφήνεια σχετικά με το θέμα – αρκετές αγωγές που περνούν από τα δικαστήρια πιθανότατα έχουν αντίκτυπο στην τεχνητή νοημοσύνη για τη μουσική παραγωγή, συμπεριλαμβανομένης μιας υπόθεσης για τα δικαιώματα των καλλιτεχνών των οποίων η δουλειά χρησιμοποιείται για την εκπαίδευση συστημάτων AI. γνώση ή συναίνεση. Ο χρόνος θα δείξει.

Προς το παρόν, όμως, θα υποστήριζα ότι οι καλλιτέχνες δεν έχουν πολλούς λόγους να ανησυχούν. Το MusicLM, όπως και άλλες συσκευές παραγωγής μουσικής που κυκλοφόρησαν πρόσφατα, χρησιμεύει περισσότερο από οτιδήποτε άλλο ως παράδειγμα του πόσο μακριά πρέπει να φτάσει η τεχνολογία.

By Dionysos Alec

"Τηλεοπτικός γκουρού. Υποστηρικτής της ζόμπι. Οπαδός του διαδικτύου. Πιστοποιημένος μπύρας. Υπερήφανος αναγνώστης. Φανταστικός αλκοόλ. Βραβευμένος επιχειρηματίας."

Related Post

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *