Στο τέλος του I/O, του ετήσιου συνεδρίου προγραμματιστών της Google στο Shoreline Amphitheatre στο Mountain View, ο CEO της Google Sundar Pichai αποκάλυψε ότι η εταιρεία είπε “AI” 121 φορές. Αυτή ήταν, ουσιαστικά, η ουσία της δίωρης ομιλίας της Google – φέρνοντας την τεχνητή νοημοσύνη σε όλες τις εφαρμογές και τις υπηρεσίες της Google που χρησιμοποιούνται από περισσότερα από δύο δισεκατομμύρια ανθρώπους σε όλο τον κόσμο. Ακολουθούν όλες οι σημαντικές ενημερώσεις που ανακοίνωσε η Google στην εκδήλωση.
Ενημερώσεις Gemini 1.5 Flash και Gemini 1.5 Pro
Η Google ανακοίνωσε ένα ολοκαίνουργιο μοντέλο AI που ονομάζεται Gemini 1.5 Flash, το οποίο λέει ότι είναι βελτιστοποιημένο για ταχύτητα και αποτελεσματικότητα. Το Flash βρίσκεται ανάμεσα στο Gemini 1.5 Pro και το Gemini 1.5 Nano, το μικρότερο μοντέλο της εταιρείας που τρέχει εγγενώς στη συσκευή. Η Google είπε ότι δημιούργησε το Flash επειδή οι προγραμματιστές ήθελαν ένα ελαφρύτερο, λιγότερο ακριβό μοντέλο από το Gemini Pro για τη δημιουργία εφαρμογών και υπηρεσιών με τεχνητή νοημοσύνη, διατηρώντας παράλληλα ορισμένα πράγματα όπως ένα παράθυρο περιβάλλοντος μεγάλου εκατομμυρίου χαρακτήρων που ξεχωρίζει το Gemini Pro από ανταγωνιστικά μοντέλα. Αργότερα φέτος, η Google θα διπλασιάσει το παράθυρο περιβάλλοντος Gemini σε 2 εκατομμύρια διακριτικά, που σημαίνει ότι θα μπορεί να επεξεργάζεται 2 ώρες βίντεο, 22 ώρες ήχου και περισσότερες από 60.000 γραμμές κώδικα ή περισσότερες από 1,4 εκατομμύρια λέξεις με την ίδια αναπνοή . Η ωρα. .
Astra Project
Η Google παρουσίασε το Project Astra, μια πρώιμη έκδοση ενός παγκόσμιου βοηθού με τεχνητή νοημοσύνη, τον οποίο ο Demis Hassabis, Διευθύνων Σύμβουλος του DeepMind της Google, είπε ότι είναι η έκδοση της Google για έναν πράκτορα AI «που θα μπορούσε να είναι χρήσιμος στην καθημερινή ζωή».
Σε ένα βίντεο που η Google λέει ότι γυρίστηκε σε μία λήψη, ένας χρήστης του Astra κινείται στο γραφείο της Google στο Λονδίνο κρατώντας το τηλέφωνό του και στρέφοντας την κάμερα σε διάφορα πράγματα – ένα ηχείο, κάποιο κωδικό σε έναν πίνακα, έξω από ένα παράθυρο – και έχει μια φυσική συνομιλία με την εφαρμογή για το πώς φαίνεται Η εντολή. Και σε μια από τις πιο εντυπωσιακές στιγμές του βίντεο, λέει σωστά στον χρήστη πού άφησε τα γυαλιά της πριν χωρίς ο χρήστης να σηκώσει ποτέ τα γυαλιά της.
Το βίντεο τελειώνει με μια έκπληξη – όταν ο χρήστης βρει τα γυαλιά που λείπουν και τα φορέσει, μαθαίνουμε ότι έχει ενσωματωμένο σύστημα κάμερας και μπορεί να χρησιμοποιήσει το Project Astra για να συνομιλήσει απρόσκοπτα με τον χρήστη, κάτι που θα μπορούσε να προτείνει ότι Η Google ενδέχεται να εργάζεται σε έναν ανταγωνιστή των έξυπνων γυαλιών Ray Ban της Meta.
Ρωτήστε τις Εικόνες Google
Το Google Photos ήταν ήδη έξυπνο όταν επρόκειτο να αναζητήσει συγκεκριμένες φωτογραφίες ή βίντεο, αλλά με την τεχνητή νοημοσύνη, η Google πηγαίνει τα πράγματα στο επόμενο επίπεδο. Εάν είστε συνδρομητής του Google One στις ΗΠΑ, θα μπορείτε να κάνετε στο Google Photos μια περίπλοκη ερώτηση όπως “Δείξε μου την καλύτερη φωτογραφία από κάθε εθνικό πάρκο που έχεις επισκεφτεί” όταν η λειτουργία κυκλοφορήσει τα επόμενα λίγα μήνες. Το Google Photos θα χρησιμοποιήσει πληροφορίες GPS καθώς και τη δική του κρίση για το τι είναι «καλύτερο» για να σας παρέχει επιλογές. Μπορείτε επίσης να ζητήσετε από το Google Photos να δημιουργήσει λεζάντες για τη δημοσίευση φωτογραφιών στα μέσα κοινωνικής δικτύωσης.
Δείτε και Φανταστείτε 3
Οι νέες μηχανές δημιουργίας πολυμέσων της Google που λειτουργούν με τεχνητή νοημοσύνη ονομάζονται Veo και Imagine 3. Το Veo είναι η απάντηση της Google στο Sora του OpenAI. Η Google είπε ότι μπορεί να παράγει βίντεο “υψηλής ποιότητας” 1080p που μπορούν να διαρκέσουν “περισσότερο από ένα λεπτό” και μπορούν να κατανοήσουν κινηματογραφικές έννοιες όπως το time-lapse.
Εν τω μεταξύ, το Imagen 3 είναι μια συσκευή δημιουργίας κειμένου σε εικόνα που η Google ισχυρίζεται ότι χειρίζεται κείμενο καλύτερα από τον προκάτοχό της, Imagen 2. Το αποτέλεσμα είναι το μοντέλο κειμένου σε εικόνα υψηλότερης ποιότητας της εταιρείας με “εκπληκτικό επίπεδο λεπτομέρειας” για “ρεαλιστικό , ρεαλιστικές εικόνες.” ” και λιγότερα τεχνουργήματα — που ουσιαστικά το φέρνει απέναντι στο DALLE-3 του OpenAI.
Μεγάλες ενημερώσεις στην Αναζήτηση Google
Η Google κάνει μεγάλες αλλαγές στον τρόπο με τον οποίο λειτουργεί ουσιαστικά η αναζήτηση. Οι περισσότερες από τις ενημερώσεις που ανακοινώθηκαν σήμερα είναι σαν τη δυνατότητα να κάνετε πραγματικά πολύπλοκες ερωτήσεις («Βρείτε τα καλύτερα στούντιο γιόγκα ή Pilates στη Βοστώνη και δείτε λεπτομέρειες για προσφορές και χρόνους βόλτας από το Beacon Hill.») και να χρησιμοποιήσετε την αναζήτηση για να προγραμματίσετε γεύματα και διακοπές. Θα είναι διαθέσιμο μόνο εάν εγγραφείτε στο Search Labs, την πλατφόρμα της εταιρείας που επιτρέπει στους χρήστες να δοκιμάσουν λειτουργίες beta.
Ωστόσο, η μεγάλη νέα δυνατότητα, την οποία η Google ονομάζει AI Overviews και την οποία η εταιρεία δοκιμάζει εδώ και ένα χρόνο, θα κυκλοφορήσει επιτέλους σε εκατομμύρια ανθρώπους στις Ηνωμένες Πολιτείες. Η Αναζήτηση Google θα παρουσιάζει πλέον απαντήσεις που δημιουργούνται από AI στην κορυφή των αποτελεσμάτων από προεπιλογή και η εταιρεία λέει ότι θα κάνει τη λειτουργία διαθέσιμη σε περισσότερους από ένα δισεκατομμύριο χρήστες σε όλο τον κόσμο μέχρι το τέλος του έτους.
Gemini στο Android
Η Google ενσωματώνει το Gemini απευθείας στο Android. Όταν κυκλοφορήσει το Android 15 αργότερα αυτό το έτος, το Gemini θα γνωρίζει ποια εφαρμογή, φωτογραφία ή βίντεο παίζετε και θα μπορούν να το σύρουν ως επικάλυψη και να του κάνουν ερωτήσεις σχετικά με το πλαίσιο. Πού αφήνει αυτό το Google Assistant που το κάνει ήδη αυτό; Ποιον ξέρεις! Η Google δεν το ανέφερε καθόλου κατά τη σημερινή κεντρική ομιλία.
Υπήρξαν επίσης πολλές άλλες ενημερώσεις. Η Google είπε ότι θα προσθέσει ψηφιακά υδατογραφήματα σε βίντεο και κείμενα που δημιουργούνται από την τεχνητή νοημοσύνη, θα κάνει το Gemini προσβάσιμο στο πλαϊνό πλαίσιο στο Gmail και τα Έγγραφα, θα υποστηρίξει έναν εικονικό συνάδελφο με τεχνητή νοημοσύνη στο Workspace, θα ακούσει τηλεφωνικές κλήσεις και θα εντοπίσει εάν όντως σας εξαπατούν χρόνο, και πολλά άλλα.
Παρακολουθήστε ζωντανά όλα τα νέα από το Google I/O 2024 εδώ!
“Τηλεοπτικός γκουρού. Υποστηρικτής της ζόμπι. Οπαδός του διαδικτύου. Πιστοποιημένος μπύρας. Υπερήφανος αναγνώστης. Φανταστικός αλκοόλ. Βραβευμένος επιχειρηματίας.”