Αυτή τη φορά πέρυσι, τα μέσα κοινωνικής δικτύωσης έσφυζαν από το viral “Deep Nostalgia” του MyHeritage, του οποίου η μαγεία της τεχνητής νοημοσύνης ζωντανεύει τις παλιές οικογενειακές μας φωτογραφίες με ανησυχητικό ρεαλισμό. Λοιπόν, αν φρικάρετε από αυτό, περιμένετε μέχρι να δείτε τη νέα λειτουργία που μόλις κάλεσα LiveStory.
Αυτή τη φορά, η τεχνολογία μιας διαδικτυακής γενεαλογικής εταιρείας δεν δημιουργεί ένα μικρό κλιπ 10-20 κλιπ με βάση μια παλιά φωτογραφία του συγγενή σας. Αντίθετα, το LiveStory προχωρά παραπέρα δημιουργώντας ένα μεγαλύτερο βίντεο κινουμένων σχεδίων του προγόνου σας που αφηγείται την ιστορία ολόκληρης της ζωής του, με ήχο με συγχρονισμό χειλιών και μια παρουσίαση παλιών φωτογραφιών.
Όπως και πριν, λειτουργεί χρησιμοποιώντας την τεχνολογία “αναπαράστασης” που τροφοδοτείται από AI που ζωντανεύει μια εικόνα του προσώπου του συγγενή σας. Αλλά αυτή τη φορά λαμβάνετε επίσης μια φωνή που δημιουργείται αυτόματα από το οικογενειακό δέντρο MyHeritage ή εισάγεται χειροκίνητα από εσάς. Στη συνέχεια, η τεχνολογία μετατροπής κειμένου σε ομιλία ζωντανεύει την ιστορία και η φωνή συγχρονίζεται με το κινούμενο ηχείο του συγγενή σας.
Πως δουλεύει?
Όπως και η περσινή τεχνολογία “Deep Nostalgia”, τα κινούμενα σχέδια του LiveStory δημιουργούνται χρησιμοποιώντας μια μεγάλη συλλογή από “βίντεο οδηγών”. Μόλις οι αλγόριθμοι της υπηρεσίας αναλύσουν την εικόνα που ανεβάσατε, τα κύρια χαρακτηριστικά της ή τα “χαρακτηριστικά” του προσώπου αντιστοιχίζονται στο βίντεο του οδηγού για να δημιουργήσουν την εντύπωση της κίνησης. Οι αλγόριθμοι συμπληρώνουν επίσης τυχόν λεπτομέρειες που λείπουν. Η συνθετική γεννήτρια φωνής δημιουργεί επίσης μια αφήγηση με βάση τις πληροφορίες στο προφίλ του ατόμου ή μπορείτε να δημιουργήσετε το δικό σας σενάριο από την αρχή. Μπορείτε επίσης να ανεβάσετε τη δική σας ηχογράφηση.
Η MyHeritage και η D-ID, η ισραηλινή εταιρεία που δημιουργεί και αδειοδοτεί την τεχνολογία, λέει ότι το τελικό αποτέλεσμα είναι πλήρως προσαρμόσιμο, δίνοντάς σας τη δυνατότητα να αλλάξετε την αφήγηση, τις εικόνες και τον ήχο πριν το στείλετε στην οικογένεια ή στα μέσα κοινωνικής δικτύωσης. Το LiveStory φαίνεται επίσης να υποστηρίζει 31 γλώσσες, δεκάδες διαλέκτους και εκατοντάδες φωνητικούς χαρακτήρες, μαζί με διαφορετικές επιλογές ανδρικής και γυναικείας φωνής.
Παρ ‘όλα αυτά, δεν υπάρχει αμφιβολία ότι η τεχνολογία είναι λίγο ανατριχιαστική και μας οδηγεί σε ένα ακόμη μεγαλύτερο ταξίδι στην παράξενη κοιλάδα. Για ορισμένους, η προσθήκη ήχου θα μπορούσε να πάρει τα πράγματα πολύ μακριά και το MyHeritage έπρεπε να προσθέσει ορισμένες δηλώσεις αποποίησης ευθύνης για να διασφαλίσει ότι δεν γίνεται κατάχρηση της τεχνολογίας. Λέει ότι το LiveStory “προορίζεται μόνο για χρήση σε φωτογραφίες αποθανόντων, συνήθως των προγόνων κάποιου” και ότι “δεν πρέπει ποτέ να χρησιμοποιείται σε φωτογραφία ενός ζωντανού ατόμου χωρίς την άδειά του”.
Ωστόσο, πολλοί στα μέσα κοινωνικής δικτύωσης ανακάλυψαν ότι η περσινή τεχνική «βαθιάς νοσταλγίας» ήταν ένας παρηγορητικός ή ακόμη και ζεστός τρόπος για σχέσεις που δεν είχαν ξαναδεί στην πραγματική ζωή. Όπως και αυτή η δυνατότητα, το LiveStory είναι προς το παρόν διαθέσιμο για δωρεάν δοκιμή στον ιστό για υπολογιστές και για κινητά (και τα δύο μέσω Ιστότοπος MyHeritage) και στην εφαρμογή για κινητά MyHeritage. Μπορείτε να δημιουργήσετε πολλά LiveStories δωρεάν, αλλά μετά από αυτό θα χρειαστεί να πληρώσετε για μια συνδρομή (από 119 $ / 89 £ ετησίως).
Ανάλυση: Μια πιο τολμηρή κίνηση στην παράξενη κοιλάδα
Ακριβώς όπως το περσινό “Deep Nostalgia”, είμαστε λίγο διχασμένοι με τη νέα λειτουργία “LiveStory” του MyHeritage. Δεν υπάρχει αμφιβολία ότι η τεχνολογία είναι εξαιρετική και το γεγονός ότι μπορεί να δημιουργήσει αυτόματα ένα βιογραφικό βίντεο 90 δευτερολέπτων από μια φωτογραφία, ένα οικογενειακό δέντρο και κάποιο κείμενο είναι εντυπωσιακό και τρομακτικό.
Ωστόσο, δεν μπορούμε να μην αισθανόμαστε ότι ένα μεγάλο μέρος της προηγούμενης viral επιτυχίας της τεχνολογίας (η οποία οδήγησε σε 100 εκατομμύρια κινούμενα σχέδια) οφείλεται στην ακρίβειά της. Τα κινούμενα πρόσωπα που παρήγαγε η Deep Nostalgia περιστασιακά αναβοσβήνουν ή έγερναν το κεφάλι τους, αλλά αυτό συνέβη – και αυτός ο περιορισμός βοήθησε στη δημιουργία μιας ψευδαίσθησης, συγκαλύπτοντας τους περιορισμούς της τεχνολογίας.
Η προσθήκη ήχου είναι ένα λογικό βήμα, και αναμφίβολα θα αποδειχθεί ένα δημοφιλές εργαλείο για όσους δεν έχουν τα ρίγη από τον αναμφισβήτητο παράγοντα ερπυσμού. Αλλά από τα παραδείγματα που έχουμε δει μέχρι στιγμής, ο τονισμός είναι μερικές φορές αυτοματοποιημένος και το γεγονός ότι ο ήχος δεν είναι δείγμα από το πρωτότυπο τον κάνει κάπως τεχνητό.
Επί του παρόντος, το LiveStory φαίνεται να είναι πιο κατάλληλο για μουσεία ή εκπαίδευση, όπου η ικανότητά του να ζωντανεύει ιστορικά πρόσωπα (και όχι προσωπικές σχέσεις) θα μπορούσε να είναι ένας χρήσιμος τρόπος για να γίνει η ιστορία πιο ελκυστική για τους επισκέπτες και τα παιδιά.
Φυσικά, υπάρχει επίσης πιθανότητα κακής χρήσης, αν και η D-ID (ο κατασκευαστής της τεχνολογίας) έχει θέσει ορισμένα εμπόδια για να αποτρέψει αυτό το ενδεχόμενο. Όλοι οι χρήστες πρέπει να αποδεχτούν τους όρους, συμπεριλαμβανομένης της υπόσχεσης ότι δεν θα το χρησιμοποιήσουν σε ζωντανούς ανθρώπους, προτού μπορέσουν να δημιουργήσουν ένα LiveStory. Υπάρχει επίσης ένας αλγόριθμος τροποποίησης κειμένου για τον έλεγχο για προσβλητικές, δυσφημιστικές ή ψευδείς πληροφορίες, αν και δεν είναι σαφές πώς ελέγχεται το τελευταίο.
πότε Μιλήσαμε στο D-ID πέρυσι σε μια αποκλειστική συνέντευξηΕίμαστε εντυπωσιασμένοι από τη δέσμευσή της να διασφαλίσει ότι η τεχνολογία AI της δεν χρησιμοποιείται με κακόβουλους τρόπους, αν και λίγο ενοχλημένη από την πρόβλεψή της ότι η πλειονότητα των οπτικών μέσων που βλέπουμε στο διαδίκτυο θα είναι συνθετικά «μέσα σε 5-10 χρόνια». Το LiveStory είναι σαφώς ένα ακόμη βήμα στη γραμμή. Αυτό το κομμάτι, αν όχι η κίνηση, είναι το viral smash που ήταν “βαθιά νοσταλγία” πέρυσι.
“Τηλεοπτικός γκουρού. Υποστηρικτής της ζόμπι. Οπαδός του διαδικτύου. Πιστοποιημένος μπύρας. Υπερήφανος αναγνώστης. Φανταστικός αλκοόλ. Βραβευμένος επιχειρηματίας.”