Inhaltsverzeichnis:
Video: AI learns to play Google Chrome Dinosaur Game || Can you beat it?? (November 2024)
Makoto Koike ist ein Gurkenbauer in Japan. Koike ist ein ehemaliger Entwickler von eingebetteten Systemen, der jahrelang in der japanischen Automobilindustrie gearbeitet hat. 2015 kehrte er jedoch nach Hause zurück, um auf der Gurkenfarm seiner Eltern mitzuhelfen. Er erkannte bald, dass die manuelle Sortierung von Gurken nach Farbe, Form, Größe und Attributen wie "Dornigkeit" oft schwieriger und anstrengender war, als sie anzubauen. Inspiriert von der Deep-Learning-Innovation der künstlichen Intelligenz (KI) von Google, AlphaGo, machte er sich daran, diese Aufgabe zu automatisieren.
Unternehmen beginnen, praktische KI auf vielfältige Weise umzusetzen, aber man kann mit Sicherheit sagen, dass niemand die KI-Gurkensortierlösung von Koike kommen sah. Koike hatte noch nie zuvor mit KI-Techniken gearbeitet, aber mit der Open-Source-Bibliothek TensorFlow Machine Learning (ML) begann er, Bilder von Gurken einzugeben. Dank Computer-Vision-Algorithmen zum Erkennen von Objekten und tiefem Lernen, TensorFlow in den Nuancen verschiedener Gurken zu trainieren, erkannte Koike, dass es das Gemüse mit einem hohen Maß an Genauigkeit identifizieren und sortieren konnte. Dann baute Koike mit TensorFlow und einem billigen Raspberry Pi 3-Computer eine automatische Sortiermaschine, die die Farm noch heute verwendet.
TensorFlow ist einer der vielen Open-Source-Algorithmen und -Tools, die revolutionieren, was Unternehmen und Entwickler mit AI lösen können. Mit der Veröffentlichung von Google.ai auf der Google I / O-Konferenz erweiterte das Unternehmen seine Mission, "die Vorteile der KI für alle nutzbar zu machen" und bündelte alle KI-Ressourcen in einer einheitlichen Plattform. Google integriert diese Techniken und APIs (Application Programming Interfaces) in alle seine Aktivitäten, integriert ML in seine Produkte und definiert die Funktionsweise seiner Software grundlegend neu.
PCMag besuchte kürzlich Googleplex und sprach mit Führungskräften von G Suite, Google Cloud Platform (GCP) und dem ML ASL (Machine Learning Advanced Solution Lab) des Unternehmens darüber, wie Google sich mit AI neu aufbaut.
Künstliche Intelligenz überall
Angenommen, einer Ihrer Kunden hat ein Problem. Ein Agent aus der Helpdesk-Abteilung Ihres Unternehmens führt über eine Chat-App, in der Daten auf der Google Cloud Platform gespeichert werden, einen Live-Chat mit dem Kunden. Um das Problem zu lösen, muss der Benutzer dem Agenten einige vertrauliche personenbezogene Daten senden. Angenommen, der Kunde ist Ihre Oma. Der Kundendienstmitarbeiter bittet Oma um ein paar Daten. Stattdessen sendet Oma viel mehr Informationen, als sie benötigt, wenn sie ein Bild ihrer Sozialversicherungskarte in den Chat hochlädt.
Anstatt dass Google diese personenbezogenen Daten (PII) archiviert, wird das Bild mit der Sozialversicherungsnummer und anderen automatisch redigierten PII angezeigt. Der Agent sieht keine Informationen, die er nicht benötigt, und keine dieser Daten gehen in das verschlüsselte Archiv von Google. Während einer Demo der DLP-API-Technologie in der Google-Zentrale in Mountain View, Kalifornien, zog das Unternehmen den Vorhang zurück, wie ML-Algorithmen Text und Bilder analysieren, um dies zu ermöglichen.
Rob Sadowski, Marketingleiter für Vertrauenswürdigkeit und Sicherheit bei Google Cloud, erklärte, dass die automatische Redaktion von Googles DLP-API (Data Loss Prevention) zur Klassifizierung vertraulicher Daten ausgeht. Der Algorithmus macht dasselbe mit Daten wie Kreditkartennummern und kann auch Muster analysieren, um festzustellen, ob eine Nummer gefälscht ist. Dies ist nur ein Beispiel für Googles subtile Strategie, KI in seine Erfahrungen einfließen zu lassen und Unternehmen und Entwicklern wie Koike die Ressourcen zur Verfügung zu stellen, um dies auch zu tun.
Google ist bei weitem nicht der einzige Technologiegigant, der eine Schicht aus Verbindungsinformationen in seine Software einbaut. Zusammen mit Amazon und Microsoft verfügt Google jedoch über die wohl am weitesten verbreitete Bandbreite an Cloud-basierten Intelligence-Tools und -Diensten. Wenn Sie die Produkte des Unternehmens aufschlüsseln, finden Sie Google Assistant und verschiedene ML- und Computer Vision-APIs, die fast überall verwendet werden.
Die Google-Suche verwendet ML-Algorithmen in ihrem RankBrain AI-System, um Abfragen zu verarbeiten und zu verfeinern, die Rangfolge zu ändern und Daten basierend auf einer Vielzahl sich ändernder Faktoren zu aggregieren, um die Qualität der Suchergebnisse kontinuierlich zu verbessern. Google Fotos verwendet Computer Vision, um verwandte Fotos in Erinnerungen zusammenzufügen und mehrere Aufnahmen desselben Ortes zu Panoramen zu kombinieren. Der Posteingang bietet Benutzern automatisch generierte intelligente Antworten zur Auswahl und zeigt relevante E-Mails an, indem ähnliche Kategorien gebündelt werden. In der neuen Google Allo-Chat-App des Unternehmens ist Google Assistant integriert. Die Liste wird fortgesetzt.
Alle diese Apps werden in der Cloud-Infrastruktur von Google ausgeführt. Das Unternehmen wendet sogar ML in seinen Rechenzentren an, um den Stromverbrauch zu senken, indem Kühlpumpen basierend auf Last- und Wetterdaten angepasst werden. Sadowski sagte, dies sei auch die letzte Verteidigungsstufe in Googles Sicherheitsstrategie, bei der das Unternehmen mithilfe von Computerintelligenz und Risikobewertung innerhalb seines Sicherheitsstapels mithilfe von Predictive Analytics ermittelt, ob ein System kompromittiert ist.
"Google verwendet all diese ML- und AI-Modelle, die wir entwickelt haben, und optimiert sie für die Sicherheit", erklärte Sadowski. "Die Sicherheit ändert sich viel radikaler als in den meisten IT-Bereichen. Produkte, die vor drei oder vier Jahren den Kern Ihrer Sicherheitsinfrastruktur bildeten, wie Firewalls und Endpoint-Schutz, sind nach wie vor wichtig, aber wir möchten eine umfassende, umfassende und umfassende Verteidigung gewährleisten Standardmäßig über eine mandantenfähige Infrastruktur mit Millionen täglich aktiven Benutzern.
"Es beginnt mit der zugrunde liegenden Rechenzentrums-Hardware", fuhr Sadowski fort. "Hinzu kommen Anwendungsdienste und Authentifizierung mit vollständig verschlüsselten Daten und Kommunikation. Hinzu kommt die Benutzeridentität. Und die letzte Verteidigungsstufe ist die Art und Weise, wie wir rund um die Uhr überwachen, erkennen und auf Vorfälle reagieren. So arbeiten wir." Lösung für Aufgaben wie den sicheren Remotezugriff mit dem identitätsbewussten Proxy: Es handelt sich um den programmgesteuerten DLP-Dienst, der das Auffinden und Verhindern von Datenlecks sowie die Unterstützung der Datenverwaltung und -sicherheit ermöglicht."
Eine intelligentere G-Suite
ML ist auch in den Produktivitäts-Apps von Google G Suite integriert. Allan Livingston, Director Product Management bei G Suite, erläuterte einige der Möglichkeiten, mit denen AI G Suite intelligenter und kontextbezogener macht, ohne dass die Benutzer es überhaupt bemerken.
"Denken Sie darüber nach, wie G Suite all diese Anwendungen auf natürlich integrierte Weise zusammenbringt", sagte Livingston. "Sie beginnen Ihre Arbeit in einem von ihnen und durchlaufen sie nach Bedarf. Sie öffnen einen Gmail-Anhang in Drive, der Sie in Google Text & Tabellen weiterleitet. Dies erfolgt automatisch.
"Wir versuchen, dem Benutzer das Nachdenken zu nehmen, und dazu gehört auch maschinelles Lernen. Wir haben mit intelligenten Antworten im Posteingang begonnen und mit Google Mail gute Erfolge erzielt. Dies hat zu der Funktion" Durchsuchen "in" Dokumente "geführt und Folien."
Explore wurde im vergangenen Herbst eingeführt und wendet die Verarbeitung natürlicher Sprache (NLP) auf die In-App-Produktivität an. In Docs bietet Explore Ihnen sofortige Vorschläge basierend auf dem Inhalt Ihres Dokuments und empfiehlt automatisch verwandte Themen und Ressourcen. In Folien werden Entwurfsvorschläge generiert, um die Formatierung der Präsentation zu reduzieren. Der interessanteste Anwendungsfall ist jedoch Sheets. Livingston erklärte, wie Explore ML verwendet, um Datenanalysen und Einblicke in Business Intelligence (BI) zu vereinfachen.
"Viele Benutzer wissen nicht, was so etwas wie eine Pivot-Tabelle ist oder wie sie damit ein Datenblatt visualisieren können", erklärte Livingston. "Nehmen wir an, Sie haben es mit Verkaufsdaten für einen Kunden zu tun, wobei jede Zeile ein Artikel ist, der verkauft wurde. Mit Explore können Sie Abfragen in natürlicher Sprache wie" Was ist der beste Artikel am schwarzen Freitag? "Eingeben. und spuckt eine Antwort aus wie 'Du hast 563 Hosen verkauft.' Wir befassen uns mit der Datenanalyse auf eine Weise, die Zeit spart, wenn datengetriebene Entscheidungen getroffen werden, und verwenden maschinelles Lernen, um ein allgemeines Problem auf natürliche Weise zu verbessern."
Eine Demo der Explore-Funktion in Sheets von der Google Cloud NEXT-Konferenz im vergangenen März.
Laut Livingston plant Google, diese Art der ML-gesteuerten Cloud-Suche auf Dritte auszudehnen und ein Ökosystem darum herum aufzubauen. Die übergeordnete Idee ist ein allgemeines Thema in der praktischen KI: Manuelle Prozesse zu automatisieren, um den Benutzern mehr Freiraum für kreatives Arbeiten zu geben. Diese Idee steht im Mittelpunkt der meisten Apps von ML-Apps: die Automatisierung wiederholbarer Geschäftsprozesse und alltäglicher Aufgaben, einschließlich der Gurkensortierung.
"In Unternehmen und bei Verbrauchern haben Benutzer diese natürlichen Interaktionsmuster. Die Verlagerung in die Cloud und zur mobilen Produktivität verändert die Art und Weise, wie Menschen arbeiten. Diese angewandten Techniken des maschinellen Lernens sind für sie von grundlegender Bedeutung", sagte Livingston. "Aufgrund unserer Stärke im maschinellen Lernen, aufgrund unserer Produkte, die als Basis dienen, und aufgrund aller Daten in unserer Cloud sind wir in der einzigartigen Lage, dies anzuwenden und unbegrenzt zu skalieren."
Revolution des maschinellen Lernens
Die Grundlage für alles, was Google in Bezug auf KI unternimmt, sind seine APIs, Algorithmen und Open-Source-Tools. Die TensorFlow-Bibliothek des Unternehmens ist das am häufigsten verwendete ML-Tool auf GitHub, mit dem Apps wie der Gurkensortierer von Koike erstellt werden. Die API-Suite, die Google Cloud zugrunde liegt - Algorithmen für Computer Vision, Video Intelligence, Sprache und NLP, Vorhersagemodellierung und groß angelegte ML über die Google Cloud Machine Learning Engine - ist die Technologie, mit der alle KI-Funktionen in die Apps und Dienste von Google integriert werden jetzt auch die Plattform Google.ai.
Francisco Uribe, Produktmanager für das AI / ML-Team von Google Cloud, arbeitet im Zentrum der Engine, die die Funktionsweise von Google umschreibt. Uribe beaufsichtigt Googles oben erwähnte ML ASL, ein Labor mit einem umfassenden Programm, in dem Google ML-Experten direkt mit Unternehmen zusammenarbeiten, um KI-Lösungen zu implementieren. Mithilfe der APIs von Google und der Cloud ML Engine arbeitet das Labor mit Unternehmen zusammen, um ihre eigenen Modelle zu schulen und in der Produktion bereitzustellen.
Uribe arbeitet seit mehr als einem Jahrzehnt im KI-Bereich. Er gründete BlackLocus, ein datengesteuertes Startup, das eine automatisierte Preisfindungs-Engine für Einzelhändler entwickelte und 2012 von Home Depot übernommen wurde. Danach wechselte er zu Google und arbeitete vier Jahre lang im Search Ads-Team, um die Anzeigenerfahrung mithilfe von ML zu verbessern. Im Jahr 2016 wechselte er in eine Forschungsrolle, in der er die ML ASL leitete und als Mentor in Googles Launchpad Accelerator fungierte. Laut Uribe ist er immer wieder überrascht, wie Unternehmen und Entwickler die Tools von Google einsetzen.
"Wir haben Anwendungsfälle auf ganzer Linie gesehen - von der Gesundheitsversorgung über die Finanzen bis zum Einzelhandel und der Landwirtschaft", sagte Uribe. "Wir versuchen, Kunden dabei zu unterstützen, ihre Wahrnehmungsfähigkeiten zu verbessern. Sprachübersetzung, Bildanalyse, Video-APIs, natürliche Sprache: Sie alle sind Teil der Demokratisierung des Zugangs zu Algorithmen für maschinelles und tiefes Lernen, die endlich in die Anwendbarkeit übergegangen sind."
Die ML ASL hat mit der HSBC Bank plc, einer der größten Banken- und Finanzdienstleistungsorganisationen der Welt, an ML-Lösungen zur Bekämpfung von Geldwäsche und zur prädiktiven Kreditbewertung gearbeitet. Die ML ASL hat auch mit der United Services Automobile Association (USAA), einer Fortune 500-Unternehmensgruppe für Finanzdienstleistungen, zusammengearbeitet, um die Ingenieure der Organisation in ML-Techniken zu schulen, die auf bestimmte Versicherungsszenarien angewendet werden. eBay nutzte die Tools von Google, um seinen digitalen ShopBot-Assistenten zu schulen. Wenn die ML ASL mit einem Unternehmen zusammenarbeitet, erklärt Uribe die vier Säulen, aus denen der Prozess besteht.
"Sie benötigen ein leistungsstarkes Computing-Angebot, um den extremen Anforderungen von ML-Aufträgen gerecht zu werden, und das verteilte Glasfaser-Backbone von GCP überträgt Daten sehr effizient von Knoten zu Knoten", so Uribe. "Wir haben die Cloud Machine Learning Engine, mit der Kunden Modelle trainieren können. Wir helfen Kunden dabei, Daten zu verarbeiten, indem sie auf die über 800.000 aktiven Datenwissenschaftler von Kaggle zugreifen. Schließlich muss das Talent vorhanden sein, also auf der Forschungsseite." Wir haben das Brain Residency-Programm, um Ingenieure für komplexe ML-Lehrpläne auszubilden. Wir sehen dies als Bausteine, die Kunden bei der Erstellung intelligenter Anwendungen unterstützen."
Dies alles fließt in die Open-Source-Community und das Drittanbieter-Ökosystem ein, das Google auf der Grundlage seiner KI-Technologie aufbaut. Das Unternehmen kündigte Anfang dieses Jahres sogar einen ML-Startup-Wettbewerb an, bei dem ML-Startups Investitionen in Höhe von bis zu 500.000 US-Dollar gewährt werden. Uribe sprach über einige der innovativen Anwendungen, die er bereits von Googles Technologie gesehen hat, und wo andere Möglichkeiten liegen könnten.
"Nehmen wir an, Sie sind ein Unternehmen für Kundendienstanalysen. Überlegen Sie sich eine Sprach-API, um den Inhalt von Anrufen zu transkribieren, und dann eine Stimmungsanalyse, um die Qualität Ihres Kundendienstes zu verbessern", sagte Uribe. "Verwenden Sie die Vision-API, um ein Foto von einem Straßenschild in einem fremden Land zu machen, und anschließend die Übersetzungs-API, um diese Inhalte in Echtzeit über eine App zu übersetzen. Es geht nicht nur um die Steigerung der Effizienz, sondern um die Schaffung neuer und einzigartiger Benutzererlebnisse."
Für Uribe sind Tools wie TensorFlow der beste Wegbereiter für die groß angelegte Einführung von ML auf dem Markt. Diese Technologien sind nicht nur der Kern dessen, was Google ist und wie der Technologieriese mit der Produktentwicklung umgeht, sondern Uribe ist auch der Ansicht, dass die weit verbreitete ML-Technologie dazu beiträgt, Unternehmen zu optimieren, neue Einnahmequellen zu erschließen und eine neue Klasse intelligenter Apps zu erfinden.
"Betrachten Sie es als eine neue industrielle Revolution", sagte Uribe. "Wir sehen, dass diese Tools Effizienzsteigerungen und Erfahrungen ermöglichen, die Sie noch nie zuvor gesehen haben. Es ist erstaunlich zu sehen, wie Startups sie anwenden. Sehen Sie sich den Gurkenbauer in Japan an. Er hat TensorFlow verwendet, um ein Modell für die Klassifizierung zu erstellen." und Gurken nach Mustern, Größe, Texturen usw. zu sortieren und dann spezielle Hardware zu bauen, um sie auszuführen. Dieser Demokratisierungsgrad ist unglaublich und wir haben die Oberfläche kaum zerkratzt."