Zuhause Geschäft Google vereinfacht maschinelles Lernen mit SQL

Google vereinfacht maschinelles Lernen mit SQL

Inhaltsverzeichnis:

Video: Was ist Machine Learning? Maschinelles Lernen einfach erklärt! (November 2024)

Video: Was ist Machine Learning? Maschinelles Lernen einfach erklärt! (November 2024)
Anonim

Google hat seine Google BigQuery, das Cloud-Datenbankangebot des Unternehmens im Petabyte-Bereich (PB), um Funktionen für maschinelles Lernen (ML) erweitert. Mit der neuen Version, die jetzt als BigQuery ML bezeichnet wird, können Sie einfache SQL-Anweisungen (Structured Query Language) verwenden, um ML-Modelle für prädiktive Analysen zu erstellen und bereitzustellen.

Das sind nicht nur gute Nachrichten für Datenwissenschaftler, die Google verwenden. Dies ist auch gut für Unternehmer, die ihre Datenanalysemöglichkeiten erweitern möchten, da eine relativ kleine Liste von Anbietern, die in der Lage sind, diese Komplexität über die Cloud bereitzustellen, um einen weiteren effektiven Wettbewerber erweitert wird. Die beiden bekanntesten Namen sind Amazon Relational Database Service und Microsoft Azure SQL. Weitere Informationen finden Sie in unserer aktuellen Zusammenfassung der Cloud-Datenbankdienste.

Die Qualifikationslücke war schon immer der Fluch aller Anbieter und Käufer von Datenprodukten. Dies gilt insbesondere für diejenigen, die sich für ML und Predictive Analytics interessieren, da diese Disziplinen häufig Kenntnisse über neue Technologien und das Abfragen von Sprachen erfordern.

"Für jeden einzelnen Datenwissenschaftler arbeiten Hunderte von Analysten mit Daten, und die meisten verwenden SQL", sagte Sudhir Hasbe, Director of Product Management bei Google Cloud, gegenüber PCMag. Es musste sich etwas ändern, wenn die Macht einer Armee von Datenanalysten aus dem von zu wenigen und zu überarbeiteten Datenwissenschaftlern verursachten Engpass gelöst werden sollte.

Googles Antwort auf dieses Dilemma ist geradezu bemerkenswert. Während ML ein heißer Trend ist und in Produkten aller Art überall auftaucht, ist es immer noch ein festes Gebiet für Datenwissenschaftler. Viele Anbieter haben Fortschritte bei der Vereinfachung der Technologie gemacht, aber die hässliche Wahrheit ist, dass Sie diese um ein Vielfaches vereinfachen können und es für mehr als 99 Prozent der menschlichen Bevölkerung immer noch zu schwierig ist, sie zu verwenden. Wir müssen es jedoch verwenden können, weil ML mehr kann und es schneller als eine Gruppe superschlauer Menschen kann.

Google setzt ML in Google BigQuery ein, damit es näher an den Daten liegt. Die Anwendung bietet ML-Funktionen zum Teil schneller als herkömmliche ML-Modelle, da die Datenanalyse an der Quelle durchgeführt werden kann. BigQuery ML ist jetzt in der Beta-Phase und ermöglicht Analysten (und Datenwissenschaftlern) die Durchführung prädiktiver Analysen, z. B. die Prognose von Verkäufen und die Erstellung von Kundensegmenten direkt über den Daten, in denen sie gespeichert sind. Das allein ist eine respektable und bemerkenswerte Verbesserung.

Google ging jedoch noch einen Schritt weiter und fügte eine Funktion hinzu, mit der Datenanalysten einfache SQL-Anweisungen zum Erstellen und Bereitstellen von ML-Modellen verwenden können. Derzeit sind die Optionen lineare Regression und logistische Regressionsmodelle für die prädiktive Analyse, da dies die beiden am häufigsten verwendeten Modelle sind.

Im Folgenden wird anhand einer von Google bereitgestellten Illustration veranschaulicht, wie Datenanalysten diese Funktion nutzen würden:

Laut Hasbe plant Google, im Laufe der Zeit weitere ML-Optionen zu dieser Funktion hinzuzufügen. "Wir müssen von unseren Kunden erfahren, welche Modelle wir hinzufügen sollen, damit wir die nützlichsten zuerst bereitstellen können", sagte er.

Zusätzliche Google BigQuery-Upgrades

Ganz oben auf der umfangreichen Liste der Upgrades nach ML stehen Clustering-Funktionen, BigQuery GIS (Geographic Information Systems), ein neuer Google Sheets-Datenconnector und ein neuer Google Sheets-Datenconnector.

Das Clustering befindet sich ebenfalls in der Betaphase und ermöglicht die Erstellung von Clustertabellen in einem Datenoptimierungsschritt, bei dem Zeilen mit ähnlichen Clusterschlüsseln zusammengefasst werden. Dies senkt die Kosten, da die Leistung verbessert wird und Google BigQuery dem Benutzer nur die gescannten Daten und nicht die gesamte Tabelle oder Partition in Rechnung stellt.

BigQuery GIS ist derzeit in Alpha und wird für die Geodatenanalyse verwendet. Während das Google Cloud-Team mit Google Earth Engine zusammengearbeitet hat, um BigQuery GIS zu erstellen, müssen Sie Ihre eigenen Geodaten in die Tabelle aufnehmen. Dies ist in und über mehrere Branchen hinweg kein Problem, einschließlich vernetzter Autosysteme, des Internets der Dinge (Internet of Things, IoT), des verarbeitenden Gewerbes, des Einzelhandels, intelligenter Städte und der Telematik. Ganz zu schweigen von Regierungsbehörden, die von der Environmental Protection Agency (EPA) und der National Geospatial-Intelligence Agency über die National Oceanic and Atmospheric Administration (NOAA) bis hin zu allen militärischen Zweigen reichen.

BigQuery GIS verwendet die S2-Bibliothek, die mittlerweile über eine Milliarde Benutzer mit einer Vielzahl von Produkten wie Google Earth Engine und Google Maps hat. Wenn Sie mehr Geodaten benötigen, gibt die Bundesregierung eine immense Menge davon auf GeoPlatform weiter.

Ein neuer Google Sheets-Datenconnector wird wahrscheinlich viele Datenanalysten begeistern, nur weil er für den täglichen Gebrauch so praktisch ist. Sie können über Google Sheets (Tabellenkalkulationsprogramm) auf Google BigQuery zugreifen und Google Sheets-Tools wie Explore verwenden, ein kombiniertes Tool für die Zusammenarbeit, Datenvisualisierung und Abfrage natürlicher Sprachen.

Google BigQuery verfügt jetzt auch in der Beta über eine neue Benutzeroberfläche. Eines der interessantesten Elemente ist die Ein-Klick-Visualisierungsfunktion, die von Google Data Studio unterstützt wird. Alles in allem ist es eine großartige Aufrüstungsrunde für einen bereits eleganten Service. Diese Upgrades werden in der nächsten Runde der Database-as-a-Service (DBaaS) -Lösungsprüfungen von PCMag getestet, nachdem die Fehler behoben wurden und die Produkte ihren jeweiligen Alpha- und Betastatus überschritten haben.

PCMag EIC Dan Costa diskutiert die Zukunft der Daten:
Google vereinfacht maschinelles Lernen mit SQL