πολλαπλασιασμός μήτρας είναι Στην καρδιά Από πολλά hacks μηχανικής μάθησης, έχει γίνει πιο γρήγορο – δύο φορές πιο γρήγορα. Την περασμένη εβδομάδα, DeepMind ανακοινώνω Ανακαλύψτε έναν πιο αποτελεσματικό τρόπο εκτέλεσης πολλαπλασιασμού μήτρας, κατακτώντας ένα ρεκόρ 50 ετών. Αυτή την εβδομάδα, δύο Αυστριακοί ερευνητές στο Πανεπιστήμιο Johannes Kepler Linz Απαίτηση Ξεπέρασαν αυτό το νέο ρεκόρ κατά ένα βήμα.
πολλαπλασιασμός μήτρας Περιλαμβάνει Ο διπλασιασμός δύο ορθογώνιων συστοιχιών αριθμών βρίσκεται συχνά στο επίκεντρο της αναγνώρισης ομιλίας, της αναγνώρισης εικόνας, της επεξεργασίας εικόνας smartphone, της συμπίεσης και της δημιουργίας γραφικών υπολογιστή. Οι GPU είναι ιδιαίτερα καλές στην εκτέλεση πολλαπλασιασμού matrix λόγω της εξαιρετικά παράλληλης φύσης τους. Μπορούν να χωρίσουν ένα μεγάλο μαθηματικό πρόβλημα μήτρας σε πολλά μέρη και να επιτεθούν σε μέρη τους ταυτόχρονα χρησιμοποιώντας έναν ειδικό αλγόριθμο.
Το 1969, ένας Γερμανός μαθηματικός ονόματι Volker Strassen Ανακαλύπτω Προηγούμενος καλύτερος αλγόριθμος για τον πολλαπλασιασμό πινάκων 4×4, ο οποίος μειώνει τον αριθμό των βημάτων που απαιτούνται για την εκτέλεση υπολογισμού πινάκων. Για παράδειγμα, ο πολλαπλασιασμός δύο πινάκων 4×4 μαζί χρησιμοποιώντας την παραδοσιακή μέθοδο κλάσης απαιτεί 64 πολλαπλασιασμούς, ενώ ο αλγόριθμος Strassen μπορεί να εκτελέσει το ίδιο επίτευγμα 49 πολλαπλασιασμών.
Χρησιμοποιώντας ένα νευρωνικό δίκτυο που ονομάζεται AlphaTensor, η DeepMind ανακάλυψε έναν τρόπο να μειώσει αυτόν τον αριθμό στα 47 πολλαπλάσια και οι ερευνητές του δημοσίευσε μια εργασία Σχετικά με το επίτευγμα στη φύση την περασμένη εβδομάδα.
Η μετάβαση από τα 49 βήματα στα 47 δεν φαίνεται πολύ, αλλά αν λάβετε υπόψη τα τρισεκατομμύρια υπολογισμούς matrix που γίνονται στη GPU κάθε μέρα, ακόμη και οι σταδιακές βελτιώσεις μπορούν να μεταφραστούν σε σημαντικά κέρδη απόδοσης, επιτρέποντας στις εφαρμογές τεχνητής νοημοσύνης να εκτελούνται πιο γρήγορα σε υπάρχουσες υλικό.
Όταν τα μαθηματικά είναι απλώς ένα παιχνίδι, το AI κερδίζει
Το AlphaTensor είναι απόγονος του AlphaGo (το οποίο Υπεροχή Παγκόσμιος πρωταθλητής παει παίκτες το 2017) και Άλφα ΜηδένΑυτό αφορούσε το σκάκι και το σόγκι. Η DeepMind αποκαλεί το AlphaTensor “το πρώτο σύστημα τεχνητής νοημοσύνης που ανακάλυψε νέους, αποτελεσματικούς και αποδεδειγμένα σωστούς αλγόριθμους για βασικές εργασίες όπως ο πολλαπλασιασμός πινάκων”.
Για να ανακαλύψετε πιο αποτελεσματικούς αλγόριθμους μαθηματικών πινάκων, η DeepMind όρισε το πρόβλημα ως παιχνίδι ενός παίκτη. Εταιρία έγραψε για Η διαδικασία είναι πιο αναλυτική στην ανάρτηση ιστολογίου της περασμένης εβδομάδας:
Σε αυτό το παιχνίδι, ο πίνακας είναι ένας τρισδιάστατος τανυστής (πίνακας αριθμών) και καταγράφει πόσο μακριά είναι ο τρέχων αλγόριθμος από τη διόρθωσή του. Μέσω ενός συνόλου επιτρεπόμενων κινήσεων, που αντιστοιχούν στις οδηγίες του αλγορίθμου, ο παίκτης προσπαθεί να τροποποιήσει τον τανυστή και να ακυρώσει τις καταχωρίσεις του. Όταν ο παίκτης μπορεί να το κάνει αυτό, οδηγεί σε έναν αποδεδειγμένα σωστό αλγόριθμο πολλαπλασιασμού πινάκων για οποιοδήποτε ζεύγος πινάκων, η απόδοση του οποίου καταγράφεται από τον αριθμό των βημάτων που γίνονται για ένα μηδέν εκτός του τανυστή.
Στη συνέχεια, η DeepMind εκπαίδευσε το AlphaTensor χρησιμοποιώντας ενισχυτική εκμάθηση για να παίξει αυτό το φανταστικό αθλητικό παιχνίδι – παρόμοιο με το πώς το AlphaGo έμαθε να παίζει παειΣταδιακά βελτιώθηκε με την πάροδο του χρόνου. Τελικά, ανακάλυψε ξανά και στη συνέχεια ξεπέρασε το έργο του Στράσεν και άλλων μαθηματικών, σύμφωνα με το DeepMind.
Σε ένα πιο περίπλοκο παράδειγμα, το AlphaTensor ανακάλυψε έναν νέο τρόπο εκτέλεσης πολλαπλασιασμού μήτρας 5 x 5 σε 96 βήματα (έναντι 98 για την παλιά μέθοδο). Αυτή την εβδομάδα, ο Manuel Coors και ο Jacob Mossbauer από το Johannes Πανεπιστήμιο Kepler στο Λιντς της Αυστρίας, δημοσίευσε μια εργασία Ισχυρισμός ότι μείωσε αυτόν τον αριθμό κατά ένα, σε πολλαπλάσιο του 95. Δεν είναι τυχαίο ότι αυτός ο νέος αλγόριθμος που έσπασε ρεκόρ βγήκε τόσο γρήγορα επειδή δημιουργήθηκε από τη δουλειά του DeepMind. Οι Kauers και Moosbauer έγραψαν στην εργασία τους, «Αυτή η λύση προέκυψε από ένα σχέδιο [DeepMind’s researchers] Εφαρμόζοντας μια σειρά μετασχηματισμών που οδηγούν σε ένα σχήμα στο οποίο μπορεί να ακυρωθεί ένας πολλαπλασιασμός.
Οι τεχνολογικές εξελίξεις δημιουργούνται από μόνες τους και με την τεχνητή νοημοσύνη να αναζητά τώρα νέους αλγόριθμους, άλλα μακροχρόνια μαθηματικά αρχεία είναι πιθανό να πέσουν σύντομα. Παρόμοια με τον τρόπο σχεδίασης με τη βοήθεια υπολογιστή (Κάθαρμα – κακός) επέτρεψε την ανάπτυξη πιο περίπλοκων και ταχύτερων υπολογιστών, η τεχνητή νοημοσύνη μπορεί να βοηθήσει τους ανθρώπινους μηχανικούς να επιταχύνουν την κυκλοφορία της.
“Τηλεοπτικός γκουρού. Υποστηρικτής της ζόμπι. Οπαδός του διαδικτύου. Πιστοποιημένος μπύρας. Υπερήφανος αναγνώστης. Φανταστικός αλκοόλ. Βραβευμένος επιχειρηματίας.”