Δημιουργούν μια εφαρμογή που αλλάζει διαλέκτους

Για αυτούς, απλά δεν είχε νόημα. Μιλούσε άπταιστα αγγλικά και ισπανικά, πολύ φιλικός και ειδικός στη μηχανική συστημάτων. Γιατί δεν μπόρεσε να κρατήσει δουλειά στο τηλεφωνικό κέντρο;

Ο φίλος είπε ότι η προφορά του έκανε δύσκολο για πολλούς πελάτες να τον καταλάβουν. Κάποιοι έριξαν και βρισιές λόγω του τρόπου που μιλούσε.

Οι τρεις μαθητές συνειδητοποίησαν ότι το πρόβλημα ήταν μεγαλύτερο από την εμπειρία των φίλων τους. Έτσι δημιούργησαν μια startup για να το λύσουν.

Τώρα, η εταιρεία τους, Sanas, δοκιμάζει λογισμικό με τεχνητή νοημοσύνη που στοχεύει στην εξάλειψη της κακής επικοινωνίας αλλάζοντας τις προφορές των ανθρώπων σε πραγματικό χρόνο. Ένας υπάλληλος τηλεφωνικού κέντρου στις Φιλιππίνες, για παράδειγμα, μπορεί κανονικά να μιλήσει στο μικρόφωνο και να καταλήξει να μοιάζει με κάποιον από την KS σε έναν πελάτη στην άλλη άκρη.

Οι ιδρυτές της startup λένε ότι τα τηλεφωνικά κέντρα είναι μόνο η αρχή. Ο ιστότοπος της εταιρείας περιγράφει τα σχέδιά της ως «επανασχεδιασμένη συζήτηση».

Τελικά, ελπίζουν στην εφαρμογή που αναπτύσσουν Θα χρησιμοποιηθούν από μια ποικιλία βιομηχανιών και ιδιωτών. Μπορεί να βοηθήσει τους γιατρούς να κατανοήσουν καλύτερα τους ασθενείς, λένε, ή να βοηθήσει τα εγγόνια να κατανοήσουν καλύτερα τους παππούδες τους.

«Έχουμε ένα πολύ μεγάλο όραμα για τη Sanas», λέει ο CEO Maxim Serebryakov.

Και για τον Serebryakov και τους συνιδρυτές του, το έργο είναι προσωπικό.

Δεν ακούς τις φωνές των ανθρώπων όσο τις προφορές τους

Το τρίο που ίδρυσε τη Sanas συναντήθηκε στο Πανεπιστήμιο του Στάνφορντ, αλλά είναι όλοι αρχικά από διαφορετικές χώρες — ο Serebryakov, τώρα CEO, από τη Ρωσία. Ο Andrés Pérez Sodiri, τώρα Γενικός Οικονομικός Διευθυντής, είναι από τη Βενεζουέλα. και Shun Zhang, τώρα επικεφαλής τεχνολογίας, από την Κίνα.

Δεν είναι πλέον φοιτητές του Στάνφορντ. Ο Serebryakov και ο Peres αποφοίτησαν. Ο Τσανγκ αποσύρθηκε για να επικεντρωθεί στην επαναφορά του Σάνας στη ζωή.

Ξεκίνησαν την εταιρεία πέρυσι, δίνοντάς της ένα όνομα που μπορεί εύκολα να προφερθεί σε διαφορετικές γλώσσες «για να τονίσει την παγκόσμια αποστολή και την επιθυμία μας να φέρουμε τους ανθρώπους κοντά», λέει ο Perez.

READ  Οι πιο πρόσφατες πρακτικές εικόνες Samsung Galaxy Z Fold 5 δείχνουν μικρές αλλαγές στο σχεδιασμό

Με τα χρόνια, και οι τρεις λένε ότι έχουν πειραματιστεί με το πώς οι διάλεκτοι μπορούν να μπουν στο δρόμο τους.

“Όλοι προερχόμαστε από διεθνή υπόβαθρο”, λέει ο Serebryakov. “Έχουμε δει από πρώτο χέρι πώς οι άνθρωποι σας αντιμετωπίζουν διαφορετικά μόνο και μόνο λόγω του τρόπου που μιλάτε.” «Είναι σπαρακτικό μερικές φορές».

Ο Ζανγκ λέει ότι η μητέρα του, που ήρθε στις ΗΠΑ πριν από περισσότερα από 20 χρόνια από την Κίνα, τον βάζει ακόμα να μιλήσει στο ταμείο όταν πάνε μαζί για ψώνια γιατί νιώθει ντροπή.

«Αυτός είναι ένας από τους λόγους για τους οποίους συνέταξα τον Max και τον Andrés στην οικοδόμηση αυτής της εταιρείας και προσπαθώντας να βοηθήσω εκείνους τους ανθρώπους που πιστεύουν ότι η φωνή τους δεν ακούγεται τόσο όσο οι προφορές τους», λέει.

Ο Serebryakov λέει ότι έχει δει πώς αντιμετωπίζονται οι γονείς του στα ξενοδοχεία όταν έρχονται να τον επισκεφτούν στις ΗΠΑ – πώς οι άνθρωποι κάνουν υποθέσεις όταν ακούνε τις προφορές τους.

«Μιλάνε λίγο πιο δυνατά», λέει, «Αλλάζουν τη συμπεριφορά τους».

Ο Perez λέει ότι αφού φοίτησε σε ένα βρετανικό σχολείο, αρχικά δυσκολεύτηκε να καταλάβει τις αμερικανικές διαλέκτους όταν έφτασε στις Ηνωμένες Πολιτείες.

Και μην ξεκινήσετε με το τι συμβαίνει όταν ο μπαμπάς του προσπαθεί να χρησιμοποιήσει το Amazon Alexa που του έδωσε η οικογένειά του για τα Χριστούγεννα.

«Γρήγορα μάθαμε, όταν η Alexa άναβε φώτα σε τυχαία σημεία του σπιτιού και τα έκανε ροζ, η Alexa δεν καταλάβαινε καθόλου την προφορά του μπαμπά μου», λέει ο Perez.

Τα τηλεφωνικά κέντρα δοκιμάζουν τεχνολογία

Αγγλικά είναι tΕίναι η πιο ομιλούμενη γλώσσα στον κόσμο. Υπολογίζεται ότι το μιλούν 1,5 δισεκατομμύριο άνθρωποι – και οι περισσότεροι από αυτούς δεν είναι φυσικοί. Μόνο στις Ηνωμένες Πολιτείες, εκατομμύρια άνθρωποι μιλούν τα αγγλικά ως δεύτερη γλώσσα.

Αυτό έχει δημιουργήσει μια αυξανόμενη αγορά για εφαρμογές που βοηθούν τους χρήστες να εξασκήσουν την αγγλική τους προφορά. Αλλά ο Sanas χρησιμοποιεί την τεχνητή νοημοσύνη για να υιοθετήσει μια διαφορετική προσέγγιση.

Η υπόθεση: Αντί να μάθετε να προφέρετε λέξεις διαφορετικά, η τεχνολογία μπορεί να το κάνει για εσάς. Δεν θα υπάρχει πλέον ανάγκη για δαπανηρή ή χρονοβόρα εκπαίδευση για τη μείωση της προφοράς. Και η κατανόηση θα είναι σχεδόν άμεση.

READ  Η βάση στήριξης MagSafe Continuity Camera από την Belkin είναι μια εύκολη αναβάθμιση κάμερας web

Ο Serebryakov λέει ότι γνωρίζει ότι οι διάλεκτοι και οι ταυτότητες των ανθρώπων μπορούν να συνδέονται στενά και τονίζει ότι η εταιρεία δεν προσπαθεί να διαγράψει διαλέκτους ή να προτείνει ότι ένας τρόπος ομιλίας είναι καλύτερος από τον άλλο.

“Επιτρέπουμε στους ανθρώπους να μην χρειάζεται να αλλάξουν τον τρόπο που μιλάνε για να καταλάβουν μια θέση, να κατέχουν μια δουλειά. Η ταυτότητα και οι διάλεκτοι είναι κρίσιμες. Είναι αλληλένδετες”, λέει. «Ποτέ δεν θέλεις κάποιος να αλλάξει τον τόνο του μόνο και μόνο για να ευχαριστήσει κάποιον».

Ο αλγόριθμος του Sanas μπορεί επί του παρόντος να μετατρέψει τα αγγλικά προς και από αμερικανικές, αυστραλιανές, βρετανικές, φιλιππινέζικες, χίντι και ισπανικές διαλέκτους και η ομάδα σχεδιάζει να προσθέσει περισσότερες. Μπορούν να προσθέσουν έναν νέο τόνο στο σύστημα εκπαιδεύοντας ένα νευρωνικό δίκτυο με ηχογραφήσεις από επαγγελματίες ηθοποιούς και άλλα δεδομένα – μια διαδικασία που διαρκεί αρκετές εβδομάδες.

Η ομάδα Sanas έπαιξε δύο εκπομπές στο CNN. Σε ένα, ένας άντρας με ινδική προφορά ακούστηκε να διαβάζει μια σειρά από λογοτεχνικές προτάσεις. Αυτές οι ίδιες φράσεις στη συνέχεια μετατρέπονται σε αμερικανική διάλεκτο:

Ένα άλλο παράδειγμα με φράσεις που μπορεί να είναι πιο συνηθισμένες σε μια ρύθμιση τηλεφωνικού κέντρου, όπως “Εάν μου δώσετε το πλήρες όνομά σας και τον αριθμό παραγγελίας σας, μπορούμε να προχωρήσουμε και να αρχίσουμε να κάνουμε τη διόρθωση για εσάς”.

Τα αποτελέσματα με αμερικανική προφορά ακούγονται κάπως τεχνητά και ενσωματωμένα, όπως φωνές εικονικών βοηθών όπως η Siri και η Alexa, αλλά ο Perez λέει ότι η ομάδα εργάζεται για τη βελτίωση της τεχνολογίας.

«Ο τόνος αλλάζει, αλλά ο τονισμός διατηρείται», λέει. «Συνεχίζουμε να εργαζόμαστε για να κάνουμε το αποτέλεσμα όσο πιο φυσικό, συναισθηματικό και συναρπαστικό γίνεται».

Ο Perez λέει ότι τα πρώτα σχόλια από τα τηλεφωνικά κέντρα που έχουν δοκιμάσει αυτήν την τεχνολογία ήταν θετικά. Υποβάλετε, λοιπόν, σχόλια στον ιστότοπό τους καθώς διαδίδεται η είδηση ​​για το έργο τους.

Πώς βλέπουν το μέλλον της οι ιδρυτές της startup

Αυτό επέτρεψε στη Sanas να αυξήσει τον αριθμό των εργαζομένων της. Οι περισσότεροι υπάλληλοι του Palo Alto, με έδρα την Καλιφόρνια, προέρχονται από διεθνή υπόβαθρα. Αυτό δεν είναι τυχαίο, λέει ο Serebryakov.

READ  Το Nintendo Switch Sports ενδέχεται να υποστηρίζει την AMD FidelityFX Super Resolution

«Αυτό που χτίζουμε έχει απήχηση σε πολλούς ανθρώπους, ακόμη και στους ανθρώπους που προσλαμβάνουμε… Είναι πραγματικά συναρπαστικό να το βλέπεις», λέει.

Καθώς η εταιρεία μεγαλώνει, μπορεί να χρειαστεί λίγος χρόνος μέχρι να εμφανιστεί η Sanas στο App Store ή να εμφανιστεί σε ένα κινητό τηλέφωνο κοντά σας.

Η ομάδα λέει ότι συνεργάζεται με τις μεγαλύτερες εταιρείες εξωτερικής ανάθεσης τηλεφωνικών κέντρων αυτή τη στιγμή και επιλέγει πιο αργή διάθεση για μεμονωμένους χρήστες, ώστε να μπορούν να βελτιώσουν την τεχνολογία και να διασφαλίσουν την ασφάλεια.

Αυτό το στιγμιότυπο οθόνης δείχνει τι βλέπουν οι χρήστες στην εφαρμογή επιφάνειας εργασίας Sanas.

Αλλά τελικά ελπίζουν ότι όποιος το χρειάζεται θα το χρησιμοποιήσει — και σε άλλους τομείς.

Ο Perez οραματίζεται ότι παίζει σημαντικό ρόλο βοηθώντας τους ανθρώπους να συνδεθούν με τους γιατρούς τους.

«Κάθε δευτερόλεπτο που χάνεται είτε λόγω παρεξήγησης λόγω χαμένου χρόνου είτε λόγω λανθασμένων μηνυμάτων είναι πιθανό να έχει πολύ μεγάλο αντίκτυπο», λέει. «Θέλουμε πραγματικά να βεβαιωθούμε ότι τίποτα δεν θα χαθεί στη μετάφραση».

Μια μέρα, λέει, θα μπορούσε επίσης να βοηθήσει τους ανθρώπους να μάθουν γλώσσες, να βελτιώσουν τη μεταγλώττιση ταινιών και να βοηθήσουν τα έξυπνα ηχεία στα σπίτια και τους βοηθούς φωνής στα αυτοκίνητα να κατανοήσουν διαφορετικές διαλέκτους.

Και όχι μόνο στα αγγλικά – η ομάδα Sanas ελπίζει επίσης να προσθέσει άλλες γλώσσες στον αλγόριθμο.

Οι τρεις ιδρυτές εξακολουθούν να εργάζονται στις λεπτομέρειες. Αλλά το πώς αυτή η τεχνολογία θα μπορούσε να βελτιώσει τη συνδεσιμότητα στο μέλλον, λένε, είναι κάτι που είναι εύκολο να γίνει κατανοητό.

Αφήστε μια απάντηση

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *