Quiconque a essayé Google Photos conviendrait que ce service gratuit de stockage et de gestion de photos de Google est intelligent. Il intègre diverses fonctionnalités intelligentes, telles que la recherche avancée, la possibilité de classer vos images par lieu et par date, de créer automatiquement des albums et des vidéos basés sur des similitudes, et de parcourir la mémoire en vous montrant des photos du même jour il y a plusieurs années. Il y a beaucoup de choses que Google Photos peut faire qui, il y a plusieurs années, serait impossible à la machine. Google Photos est l'un des nombreux services «intelligents» de Google utilisant une technologie d'apprentissage automatique appelée TensorFlow. Le mot apprentissage indique que la technologie deviendra plus intelligente avec le temps, au point que nos connaissances actuelles ne peuvent plus l’imaginer. Mais qu'est-ce que TensorFlow? Comment une machine peut-elle apprendre? Que pouvez-vous en faire? Découvrons-le.
Qu'est-ce que TensorFlow?
TensorFlow est le puissant logiciel d'intelligence artificielle open source de Google, qui alimente de nombreux services et initiatives de Google. Il s’agit de la deuxième génération d’un système destiné aux implémentations de l’apprentissage automatique à grande échelle, construit par l’équipe Google Brain. Cette bibliothèque d’algorithmes succède à DistBelief - la première génération.
La technologie représente le calcul sous forme de graphiques de flux de données avec état. Ce qui rend TensorFlow unique, c'est sa capacité à modéliser les calculs sur une vaste gamme de matériels, des périphériques mobiles grand public aux serveurs multi-GPU de classe mondiale. Il peut fonctionner sur différents processeurs graphiques et GPU et promet l'évolutivité de l'apprentissage machine entre les divers périphériques et gadgets sans avoir à modifier une quantité importante de code.
TensorFlow est né du besoin de Google de charger un système informatique d'imiter le fonctionnement d'un cerveau humain dans l'apprentissage et le raisonnement. Le système, appelé réseaux de neurones, devrait pouvoir fonctionner sur des tableaux de données multidimensionnels appelés «tenseurs». Le but ultime est de former les réseaux de neurones à la détection et au déchiffrement de modèles et de corrélations.
En novembre 2015, Google a ouvert cette technologie à la technologie et l'a intégrée dans tous les types de produits et de recherches. N'importe qui, chercheurs, ingénieurs et amateurs, peut contribuer à accélérer la croissance de l'apprentissage automatique et l'amener à un niveau supérieur en moins de temps.
Cette décision s’est révélée être la bonne, car les développeurs indépendants de TensorFlow ont tellement contribué au projet qu’ils dépassent de loin les contributions de Google. Wikipedia mentionne qu '"il y a 1500 dépôts sur GitHub qui mentionnent TensorFlow, dont 5 proviennent de Google". Cela étant dit, l'une des discussions à Quora soupçonne que le code à code source ouvert publié est la version "nettoyée" du celui que Google utilise dans ses services.
Comment fonctionne TenserFlow?
En utilisant le langage humain normal simple et une lourde simplification, nous pourrions considérer l’un des côtés de TensorFlow comme une technologie de filtrage autonome avancée. À la base, la technologie est une immense bibliothèque de logiciels d’apprentissage automatique. Il utilise la base de données pour l'aider à «prendre une décision».
Par exemple, une personne télécharge une photo sur Google Photos. La technologie comparera tous les détails de l'image à sa base de données et décidera s'il s'agit d'une image d'un animal ou d'un humain. Ensuite, s’il s’agit d’un humain, il essaiera de déterminer le sexe, l’âge jusqu’à la personne. Le même processus est répété pour les autres objets de la photo.
Il utilise également les données de l'utilisateur, telles que l'identité de la personne sur la photo et le lieu où la photo a été prise, pour améliorer sa bibliothèque afin qu'elle puisse donner de meilleurs résultats dans le futur, à la fois pour l'individu qui a téléchargé la photo et pour tout le monde. autre. D'où le terme «apprentissage». Mais cela ne se limite pas à simplement connaître et apprendre des données à partir de photos. Il y a tellement de choses que la technologie peut faire avec les informations d'une photo. Par exemple, il peut regrouper des photos avec des détails similaires, telles que la même personne, le même lieu, la même date; observez le motif des visages pour déterminer à quelle famille et à quels amis appartient la personne sur la photo et utilisez-les pour créer des vidéos de vacances en famille ou d'animation à partir de prises de vue en continu.
Cela révèle à peine le fonctionnement de TensorFlow, mais j'espère que cela pourra vous donner une image générale de la technologie. En outre, l'utilisation d'un seul exemple ne peut rendre justice à ce dont il est capable.
Et pour tous les passionnés d’Intelligence Artificielle, il convient de mentionner que Google a déjà créé une technologie de puce informatique optimisée pour l’apprentissage automatique et pour l’intégration de TensorFlow. C'est ce qu'on appelle une puce ASIC Tensor Processing Unit (TPU) .
Ceux qui veulent en savoir plus sur TensorFlow peuvent visiter sa page de tutoriel.
Applications de TensorFlow
Nous sommes à un stade précoce de la technologie d’apprentissage automatique, donc personne ne sait où cela nous mènera. Mais il y a quelques applications initiales qui pourraient nous donner un aperçu du futur. Comme il provient de Google, il est évident que Google utilise la technologie pour bon nombre de ses services.
Plus sur l'analyse d'images
Nous avons discuté de l’utilisation de la technologie d’analyse d’images dans Google Photos. L'application d'analyse d'image est également utilisée dans la fonctionnalité Street View de Google Maps. Par exemple, TensorFlow est utilisé pour connecter l’image aux coordonnées de la carte et pour estomper automatiquement le numéro de la plaque d’immatriculation de toute voiture accidentellement incluse dans l’image.
Reconnaissance de la parole
Google utilise également TensorFlow pour son logiciel de reconnaissance vocale avec assistant vocal. La technologie qui permet aux utilisateurs de donner des instructions n’est pas nouvelle, mais l’inclusion de la bibliothèque toujours plus développée de TensorFlow dans le mix pourrait donner lieu à une amélioration de quelques crans. Actuellement, la technologie de reconnaissance vocale reconnaît plus de 80 langues et variantes.
Traduction dynamique
La fonctionnalité de traduction de Google est un autre exemple de la partie "apprentissage" de la technologie d'apprentissage automatique. Google permet à ses utilisateurs d'ajouter de nouveaux vocabulaires et de corriger les erreurs dans Google Translate. Les données en croissance constante peuvent être utilisées pour détecter automatiquement la langue de saisie que les autres utilisateurs souhaitent traduire. Si la machine commet des erreurs dans le processus de détection de la langue, les utilisateurs peuvent les corriger. Et la machine tirera les leçons de ces erreurs pour améliorer ses performances futures. Et le cycle continue.
Alpha Go
Alpha Go est un exemple amusant d’utilisation de TensorFlow. C'est une application qui est programmée pour jouer à Go . Pour ceux qui ne sont pas familiers avec Go, il s’agit d’un jeu de plateau abstrait pour deux joueurs originaire de Chine il ya plus de cinq mille cinq cents ans. Il s’agit du plus vieux jeu de plateau auquel on puisse encore jouer en permanence aujourd’hui. Alors que les règles sont simples - entourer plus de territoire que l'adversaire, le jeu est incroyablement complexe et, selon Wikipedia: "possède plus de possibilités que le nombre total d'atomes dans l'univers visible".
Il est donc intéressant de voir ce qu’une technologie d’apprentissage peut faire avec une infinité de possibilités. Lors de ses matchs contre Lee Sedol, 18 fois champion du monde de Go, Alpha Go a remporté 4 matchs sur 5 et s'est vu attribuer le rang de grand maître le plus honoré du jeu Go.
Projet Magenta
Le projet Magenta est une autre application intéressante de TensorFlow. C'est un projet ambitieux de créer de l' art généré par machine . L'un des premiers résultats tangibles de l'expérience est la mélodie au piano de 90 secondes. À long terme, Google espère générer un art plus avancé généré par une machine via son projet Magenta et créer une communauté d'artistes autour de lui.
En février 2016, Google a également organisé une exposition d'art et une vente aux enchères à San Fransisco, montrant 29 œuvres générées par ordinateur - avec un peu d'aide d'êtres humains - des œuvres d'art. Six des plus grandes œuvres ont été vendues jusqu'à 8 000 dollars. L'ordinateur a encore beaucoup de chemin à faire avant de pouvoir imiter un véritable artiste, mais le montant que les gens sont prêts à payer pour les œuvres d'art nous montre à quel point la technologie a évolué.
Prise en charge d'iOS
Alors que nous avons déjà vu les capacités de TenserFlow sur Android, avec sa dernière version, TensorFlow ajoute enfin des supports pour les appareils iOS. Comme il existe des tonnes d'excellentes applications mobiles disponibles exclusivement pour iOS, ou d'abord publiées sur iOS, cela signifie que nous pouvons nous attendre à ce que d'autres applications mobiles géniales adoptent l'apprentissage automatique dans un proche avenir. On peut en dire autant des possibilités d’adoptions et d’applications plus larges de TensorFlow.
L'avenir de TensorFlow
Que peut-on faire avec une machine capable d'apprendre et de prendre sa propre décision? En tant que personne qui traite plusieurs langues dans le cadre de la vie quotidienne, la première chose qui me vient à l’esprit est la traduction. Pas au niveau mot par mot, mais plutôt au niveau texte plus long, comme les documents ou même les livres. La technologie de traduction actuelle est limitée aux vocabulaires. Vous pouvez facilement savoir ce qui “dort” en chinois et vice-versa, mais essayez d'ajouter un chapitre du Musashi d'Eiji Yoshikawa dans son japonais original et de le traduire en anglais. Vous verrez où je veux en venir.
C'est également amusant de voir ce que l'avenir de l'intelligence artificielle peut faire avec la musique. Bien que cela reste très basique, l'application Music Memo d'Apple peut déjà donner un accompagnement automatique de la basse et de la batterie à vos chants enregistrés. Je me souviens d'un épisode d'une émission de télévision SciFi où un personnage de la série avait créé une machine qui analysait toutes les meilleures chansons des charts et pouvait écrire ses propres chansons à succès. Arriverons-nous jamais là-bas?
Et pour terminer, je voudrais mentionner Sunspring . C'est un court film de science-fiction entièrement écrit par un scénariste d'intelligence artificielle qui s'appelle Benjamin - qui a même composé l'interlude musical entre la chanson pop et la chanson. Le film a été monté par le réalisateur Oscar Sharp pour l'événement de 48 heures intitulé Film Challenge of Sci-Fi London.
Maintenant, je ne peux pas m'empêcher de penser à Terminator. Bienvenue dans le futur.
Crédit d'image: Wikipedia, TechInsider, The Verge, Wall Street Journal