Συνιστάται, 2024

Επιλογή Συντάκτη

Όλα όσα πρέπει να ξέρετε για το TensorFlow του Google Brain

Όποιος έχει δοκιμάσει το Google Photos συμφωνεί ότι αυτή η δωρεάν υπηρεσία αποθήκευσης και διαχείρισης φωτογραφιών από την Google είναι έξυπνη. Συσκευάζεται σε διάφορες έξυπνες λειτουργίες όπως η προηγμένη αναζήτηση, η δυνατότητα ταξινόμησης των φωτογραφιών σας σε τοποθεσίες και ημερομηνίες, η αυτόματη δημιουργία λευκωμάτων και βίντεο βασισμένων σε ομοιότητες και η περιήγησή σας στη λωρίδα μνήμης, παρουσιάζοντάς σας φωτογραφίες της ίδιας ημέρας πριν από αρκετά χρόνια. Υπάρχουν πολλά πράγματα που μπορεί να κάνει η Google Photos ότι πριν από αρκετά χρόνια θα ήταν μηχανικά αδύνατη. Η Google Photos είναι μια από τις πολλές "έξυπνες" υπηρεσίες της Google που χρησιμοποιεί μια τεχνολογία μηχανικής μάθησης που ονομάζεται TensorFlow. Η λέξη μάθηση δείχνει ότι η τεχνολογία θα γίνει πιο έξυπνη από το χρόνο μέχρι το σημείο που οι τρέχουσες γνώσεις μας δεν μπορούν να φανταστούν. Τι είναι όμως το TensorFlow; Πώς μπορεί να μάθει μια μηχανή; Τι μπορείτε να κάνετε με αυτό; Ας ανακαλύψουμε.

Τι είναι το TensorFlow;

Το TensorFlow είναι το λογισμικό ανοιχτής προέλευσης και ισχυρής τεχνητής νοημοσύνης της Google, το οποίο εξουσιοδοτεί πολλές υπηρεσίες και πρωτοβουλίες από την Google. Πρόκειται για τη δεύτερη γενιά ενός συστήματος για εφαρμογές μεγάλης κλίμακας μηχανικής μάθησης, που δημιουργήθηκε από την ομάδα του Google Brain. Αυτή η βιβλιοθήκη αλγορίθμου διαδέχεται την DistBelief - την πρώτη γενιά.

Η τεχνολογία αντιπροσωπεύει τον υπολογισμό ως γραφικά σταδιακής ροής δεδομένων. Αυτό που καθιστά το TensorFlow μοναδικό είναι η ικανότητά του να μοντελοποιεί υπολογισμούς σε ένα τεράστιο φάσμα υλικού, από κινητές συσκευές σε επίπεδο καταναλωτών έως διακομιστές πολυ-GPU παγκόσμιας κλάσης. Μπορεί να λειτουργεί σε διαφορετικές μονάδες GPU και CPU και υπόσχεται την επεκτασιμότητα της μηχανικής μάθησης μεταξύ των διαφόρων συσκευών και συσκευών χωρίς να χρειάζεται να αλλάξει ένα σημαντικό ποσό κώδικα.

Το TensorFlow προέκυψε από την ανάγκη της Google να δώσει εντολή σε ένα σύστημα πληροφορικής για να μιμηθεί πώς λειτουργεί ο ανθρώπινος εγκέφαλος στη μάθηση και τη συλλογιστική. Το σύστημα, γνωστό ως νευρωνικά δίκτυα, θα πρέπει να μπορεί να εκτελέσει σε πολυδιάστατες συστοιχίες δεδομένων που αναφέρονται ως "τανυστές". Ο τελικός στόχος είναι να εκπαιδεύσει τα νευρικά δίκτυα για να ανιχνεύσει και να αποκρυπτογραφήσει τα πρότυπα και τις συσχετίσεις.

Τον Νοέμβριο του 2015, η Google έκανε αυτήν την τεχνολογία ανοικτού κώδικα και επέτρεψε την υιοθέτησή της σε όλα τα είδη προϊόντων και ερευνών. Οποιοσδήποτε, συμπεριλαμβανομένων των ερευνητών, των μηχανικών και των χομπίστων, μπορεί να βοηθήσει στην επιτάχυνση της ανάπτυξης της μηχανικής μάθησης και να την οδηγήσει σε υψηλότερο επίπεδο σε λιγότερο χρόνο.

Αυτή η κίνηση αποδείχθηκε ότι είναι η σωστή, επειδή υπάρχουν τόσες πολλές συμβολές από τους ανεξάρτητους προγραμματιστές στο TensorFlow που ξεπερνούν κατά πολύ τις συνεισφορές της Google. Η Wikipedia αναφέρει ότι "υπάρχουν 500 αποθετήρια στο GitHub που αναφέρουν το TensorFlow, εκ των οποίων τα 5 προέρχονται από την Google". Κάποια από τις συζητήσεις στην Quora υποψιάζονται ότι ο κώδικας ανοιχτού κώδικα που κυκλοφόρησε είναι η εκδοχή "cleaned up" που χρησιμοποιεί η Google στις υπηρεσίες της.

Πώς λειτουργεί το TenserFlow;

Χρησιμοποιώντας την απλή κανονική ανθρώπινη γλώσσα και μια βαριά απλοποίηση, θα μπορούσαμε να δούμε μία πλευρά του TensorFlow ως προηγμένη αυτόνομη τεχνολογία φιλτραρίσματος. Στην καρδιά της, η τεχνολογία είναι μια τεράστια βιβλιοθήκη λογισμικού της μηχανικής μάθησης. Χρησιμοποιεί τη βάση δεδομένων για να την βοηθήσει να "αποφασίσει".

Για παράδειγμα, κάποιος μεταφορτώνει μια φωτογραφία στο Google Photos. Η τεχνολογία θα συγκρίνει όλες τις λεπτομέρειες από την εικόνα στη βάση δεδομένων της και θα αποφασίσει αν πρόκειται για εικόνα ενός ζώου ή ενός ανθρώπου. Στη συνέχεια, αν είναι άνθρωπος, θα προσπαθήσει να καθορίσει το φύλο, την ηλικία σε όλη τη διαδρομή σε ποιος είναι το άτομο. Η ίδια διαδικασία επαναλαμβάνεται για άλλα αντικείμενα στη φωτογραφία.

Χρησιμοποιεί επίσης δεδομένα του χρήστη, όπως την ταυτότητα του ατόμου στην εικόνα και τη θέση λήψης της εικόνας, για να βελτιώσει τη βιβλιοθήκη του ώστε να μπορεί να αποφέρει καλύτερα αποτελέσματα στο μέλλον - τόσο για το άτομο που ανέβασε τη φωτογραφία όσο και για όλους αλλού. Εξ ου και ο όρος "μάθηση". Αλλά δεν σταματά απλώς στη γνώση και την εκμάθηση δεδομένων από τις φωτογραφίες. Υπάρχουν τόσα πολλά που μπορεί να κάνει η τεχνολογία με πληροφορίες από μια φωτογραφία. Για παράδειγμα, μπορεί να ομαδοποιήσει φωτογραφίες με παρόμοιες λεπτομέρειες όπως το ίδιο πρόσωπο, την ίδια τοποθεσία, την ίδια ημερομηνία. δείτε το πρότυπο των προσώπων για να προσδιορίσετε ποια οικογένεια και φίλους του ατόμου που ανήκει στη φωτογραφία και χρησιμοποιήστε τις πληροφορίες για να κάνετε βίντεο οικογενειακών διακοπών ή κινούμενων εικόνων από συνεχείς λήψεις.

Αυτός μόλις χαράζει την επιφάνεια του πώς λειτουργεί το TensorFlow, αλλά ελπίζω ότι μπορεί να σας δώσει μια γενική εικόνα της τεχνολογίας. Επίσης, χρησιμοποιώντας μόνο ένα παράδειγμα δεν μπορεί να αποδώσει το τι είναι ικανό.

Και για όλους τους ενθουσιώδες της Τεχνητής Νοημοσύνης εκεί έξω, αξίζει να σημειωθεί ότι η Google δημιούργησε ήδη μια τεχνολογία τσιπ υπολογιστή βελτιστοποιημένη για μηχανική μάθηση και ενσωμάτωση του TensorFlow σε αυτό. Ονομάζεται τσιπ ASIC τσιπ επεξεργασίας μονάδας (TPU) .

Όσοι θέλουν να μάθουν περισσότερα για το TensorFlow μπορούν να επισκεφτούν τη σελίδα του οδηγού.

Εφαρμογές του TensorFlow

Βρισκόμαστε σε πρώιμο στάδιο της τεχνολογίας μηχανικής μάθησης, έτσι κανείς δεν ξέρει πού θα μας πάρει. Αλλά υπάρχουν μερικές αρχικές αιτήσεις μπορεί να μας δώσουν το βλέμμα στο μέλλον. Δεδομένου ότι προέρχεται από την Google, είναι προφανές ότι η Google χρησιμοποιεί την τεχνολογία για πολλές από τις υπηρεσίες της.

  • Περισσότερα για την Ανάλυση Εικόνας

Συζητήσαμε το παράδειγμα χρήσης της τεχνολογίας για την ανάλυση εικόνας στο Google Photos. Ωστόσο, η εφαρμογή ανάλυσης εικόνας χρησιμοποιείται επίσης στη λειτουργία Street View του Google Maps. Για παράδειγμα, το TensorFlow χρησιμοποιείται για να συνδέσει την εικόνα με τις συντεταγμένες του χάρτη και για να θολώσει αυτόματα τον αριθμό της πινακίδας κυκλοφορίας οποιουδήποτε αυτοκινήτου τυχαία περιλαμβάνεται στην εικόνα.

  • Αναγνώρισης ομιλίας

Η Google χρησιμοποιεί επίσης το TensorFlow για το φωνητικό βοηθητικό λογισμικό αναγνώρισης ομιλίας. Η τεχνολογία που επιτρέπει στους χρήστες να εκφωνήσουν τις οδηγίες δεν είναι νέα, αλλά συμπεριλαμβανομένης της συνεχώς αναπτυσσόμενης βιβλιοθήκης του TensorFlow στο μείγμα μπορεί να φέρει το χαρακτηριστικό μέχρι λίγες διατρήσεις. Επί του παρόντος, η τεχνολογία αναγνώρισης ομιλίας αναγνωρίζει πάνω από 80 γλώσσες και παραλλαγές.

  • Δυναμική μετάφραση

Ένα άλλο παράδειγμα του τμήματος "μάθησης" της τεχνολογίας μηχανικής μάθησης είναι η δυνατότητα μετάφρασης της Google. Η Google επιτρέπει στους χρήστες της να προσθέτουν νέα λεξιλόγια και να διορθώνουν τα λάθη στο Google Translate. Τα συνεχώς αυξανόμενα δεδομένα μπορούν να χρησιμοποιηθούν για την αυτόματη ανίχνευση της γλώσσας εισαγωγής που επιθυμούν να μεταφράσουν άλλοι χρήστες. Αν το μηχάνημα κάνει λάθη στη διαδικασία ανίχνευσης γλώσσας, οι χρήστες μπορούν να διορθώσουν. Και το μηχάνημα θα μάθει από αυτά τα λάθη για να βελτιώσει τη μελλοντική του απόδοση. Και ο κύκλος συνεχίζεται.

  • Alpha Go

Ένα διασκεδαστικό παράδειγμα της χρήσης του TensorFlow είναι το Alpha Go. Πρόκειται για μια εφαρμογή που έχει προγραμματιστεί για αναπαραγωγή Go . Για όσους δεν είναι εξοικειωμένοι με τη Go, πρόκειται για ένα αφηρημένο επιτραπέζιο παιχνίδι για δύο παίκτες που προέρχονται από την Κίνα εδώ και πάνω από πέντε χιλιάδες πεντακόσια χρόνια και είναι το παλαιότερο επιτραπέζιο παιχνίδι που εξακολουθεί να παίζεται συνεχώς σήμερα. Ενώ οι κανόνες είναι απλοί - για να περιβάλλουν περισσότερα εδάφη από τον αντίπαλο, το παιχνίδι είναι απίστευτα περίπλοκο και, σύμφωνα με τη Wikipedia: "έχει περισσότερες δυνατότητες από τον συνολικό αριθμό των ατόμων στο ορατό σύμπαν".

Έτσι, είναι ενδιαφέρον τι μπορεί να κάνει μια τεχνολογία εκμάθησης μηχανών με τις άπειρες δυνατότητες. Στους αγώνες του εναντίον του Lee Sedol, του παγκόσμιου πρωταθλήματος Go 18 χρόνων, η Alpha Go κέρδισε 4 από τα 5 παιχνίδια και του δόθηκε η επίτιμη υψηλότερη βαθμίδα grandmaster Go.

  • Magenta Project

Μια άλλη ενδιαφέρουσα εφαρμογή του TensorFlow είναι το πρόγραμμα Magenta. Πρόκειται για ένα φιλόδοξο έργο για τη δημιουργία μηχανικής τέχνης . Ένα από τα πρώιμα απτά αποτελέσματα του πειράματος είναι η μελωδία για πιάνο 90 ​​δευτερολέπτων. Μακροπρόθεσμα, η Google ελπίζει να δημιουργήσει πιο προηγμένη τέχνη που παράγεται από μηχανές μέσω του έργου της Magenta και να δημιουργήσει μια κοινότητα καλλιτεχνών γύρω της.

Τον Φεβρουάριο του 2016, η Google πραγματοποίησε επίσης μια έκθεση τέχνης και δημοπρασία στο Σαν Φρανσίσκο, παρουσιάζοντας 29 ηλεκτρονικούς υπολογιστές - με λίγη βοήθεια από τα ανθρώπινα - έργα τέχνης. Έξι από τα μεγαλύτερα έργα πωλήθηκαν για $ 8.000. Ο υπολογιστής μπορεί να έχει ακόμα πολύ δρόμο για να μιμηθεί έναν πραγματικό καλλιτέχνη, αλλά το ποσό των χρημάτων που οι άνθρωποι είναι πρόθυμοι να πληρώσουν για την τέχνη μας δείχνουν πόσο μακριά έχει περάσει η τεχνολογία.

Υποστήριξη για iOS

Ενώ έχουμε ήδη δει τις δυνατότητες του TenserFlow στο Android, με την τελευταία του έκδοση, το TensorFlow προσθέτει τελικά υποστηρίξεις για συσκευές iOS. Δεδομένου ότι υπάρχουν αρκετοί μεγάλοι εφαρμογές για κινητά που διατίθενται αποκλειστικά για iOS ή που κυκλοφορούν πρώτα στην iOS, αυτό σημαίνει ότι μπορούμε να αναμένουμε περισσότερες προσεγμένες εφαρμογές για κινητά που θα υιοθετήσουν μηχανική μάθηση στο εγγύς μέλλον. Το ίδιο πράγμα μπορεί να ειπωθεί για τις δυνατότητες ευρύτερων υιοθεσιών και εφαρμογών του TensorFlow.

Το μέλλον του TensorFlow

Τι μπορεί να κάνει κάποιος με μια μηχανή που μπορεί να μάθει και να πάρει τη δική της απόφαση; Ως άτομο που ασχολείται με περισσότερες από μία γλώσσες, ως μέρος της καθημερινής ζωής, το πρώτο πράγμα που αναδύεται στο μυαλό μου είναι η μετάφραση των γλωσσών. Όχι στη λέξη ανά επίπεδο λέξης, αλλά περισσότερο στο μεγαλύτερο επίπεδο κειμένου, όπως έγγραφα ή ακόμα και βιβλία. Η σημερινή τεχνολογία μετάφρασης περιορίζεται στα λεξιλόγια. Μπορείτε να μάθετε εύκολα τι είναι "ύπνος" στα κινέζικα και αντίστροφα, αλλά προσπαθήστε να ρίξετε ένα κεφάλαιο από το Musashi του Eiji Yoshikawa στην αρχική του ιαπωνική γλώσσα και να μεταφράσετε το κεφάλαιο στα αγγλικά. Θα δείτε τι παίρνω.

Είναι επίσης διασκεδαστικό να δούμε τι μπορεί να κάνει το μέλλον της Τεχνητής Νοημοσύνης με τη μουσική. Παρόλο που εξακολουθεί να είναι πολύ βασικό, η εφαρμογή Memo Music της Apple μπορεί ήδη να παρέχει αυτόματη συνοδεία μπάσων και τυμπάνων στο εγγεγραμμένο τραγούδι σας. Θυμάμαι ένα επεισόδιο μιας τηλεοπτικής εκπομπής SciFi όπου ένας χαρακτήρας στην εκπομπή δημιούργησε ένα μηχάνημα που αναλύει όλα τα κορυφαία τραγούδια στα διαγράμματα και είναι σε θέση να γράψει τα τραγούδια του. Θα φτάσουμε ποτέ εκεί;

Και όπως η σκέψη κλεισίματος, θα ήθελα να αναφέρω Sunspring . Πρόκειται για μια μικρή ταινία επιστημονικής φαντασίας που γράφτηκε εξ ολοκλήρου από έναν σεναριογράφο AI που ονομάζεται Benjamin - ο οποίος συνθέτει ακόμη και το μουσικό παρελθόν του pop-τραγουδιού. Η ταινία δημιουργήθηκε από τον σκηνοθέτη Oscar Sharp για την 48ωρη εκδήλωση Film Challenge της Sci-Fi London.

Τώρα δεν μπορώ να σταματήσω να σκέφτομαι το Terminator. Καλώς ήλθατε στο μέλλον.

Πιστωτική εικόνα: Wikipedia, TechInsider, The Verge, Wall Street Journal

Top