Zuhause Geschäft 7 Tipps für den Erfolg des maschinellen Lernens

7 Tipps für den Erfolg des maschinellen Lernens

Inhaltsverzeichnis:

Video: Was ist eigentlich Maschinelles Lernen? Beispiele & Anwendungen von Machine Learning | Kurz erklärt (November 2024)

Video: Was ist eigentlich Maschinelles Lernen? Beispiele & Anwendungen von Machine Learning | Kurz erklärt (November 2024)
Anonim

Im ersten Teil unseres Business Guide to Machine Learning (ML) wurde erläutert, wie das Dachkonzept von ML in einem Geschäftsumfeld weitaus differenzierter ist. Die effektivsten Strategien befassen sich mit ML im praktischen Sinne. Dabei werden sowohl komplexe Deep-Learning- als auch weniger intensive "billige" Lerntechniken eingesetzt, um Unternehmensprozesse zu optimieren und konkrete Einblicke in Business Intelligence (BI) zu gewinnen.

Das Ziel des Einsatzes von ML in Ihren Geschäftsanwendungen besteht darin, Ihr Geschäftsergebnis zu verbessern oder den Wettbewerbsvorteil Ihres Unternehmens zu steigern. In der Gesamtstruktur Ihres Unternehmens geht es jedoch weit über die Algorithmen hinaus, die Zeit und die Ressourcen, die Sie in diesen Prozess investieren, optimal zu nutzen. Die IT-Entscheidungsträger in Ihrem Unternehmen müssen sicherstellen, dass alles, was Sie in Ihre ML-Implementierung einfließen lässt - von den Daten und der Logistik bis hin zur Interaktion mit den Benutzern -, kohärent zusammenarbeitet, um die Effektivität zu maximieren.

Ted Dunning, Ph.D., ist Chief Application Architect bei MapR, einem Unternehmen für Unternehmenssoftware, das verschiedene Big-Data-Distributionen und Datenverwaltungstools anbietet. Dunning hat außerdem zwei Bücher über das, was er als "praktisches maschinelles Lernen" bezeichnet, mitverfasst und im Laufe der Jahre ML-Technologien für eine Reihe von Unternehmen entwickelt, darunter das von LifeLock gekaufte ID Analytics-Betrugserkennungssystem und die Musicmatch Jukebox-Software. welches später Yahoo Musik wurde. Derzeit ist er außerdem Vice President of Incubation bei der Apache Software Foundation.

Dunning hat die Entwicklung des ML-Bereichs über Jahrzehnte beobachtet und viel darüber gelernt, was in einem praktischen Geschäftsumfeld funktioniert und was nicht. Im Folgenden werden sieben Best Practices für die Entwicklung von Geschäftslösungen aufgeführt, die auf ML basieren.

1. Logistik nicht vergessen

Bei erfolgreicher ML geht es nicht nur darum, das richtige Tool oder den richtigen Algorithmus auszuwählen. Im Mahnwesen heißt es, dass Sie auch herausfinden müssen, welcher Ansatz gut zu Ihnen passt, und ihn für die jeweilige Situation gestalten müssen, die Sie ansprechen. Zum Beispiel sprach Dunning in einer Online-Marketingkampagne von ML im Gegensatz zu weitaus komplizierteren Szenarien wie Algorithmen zur Steuerung eines autonomen Autos. Es lohnt sich für das Auto, Ihre Ressourcen für eine inkrementelle Algorithmusverbesserung aufzuwenden, aber im Marketing-Szenario würden Sie eine weitaus bessere Rendite erzielen, wenn Sie die gesamte Logistik rund um das Auto optimieren.

"Häufig ist es für Unternehmen die Logistik, nicht das Lernen, die den Wert ausmacht. Dafür sollten Sie Ihre Zeit und Ressourcen aufwenden", sagte Dunning. "Wenn Sie den Algorithmus anpassen, erhalten Sie eine kleine Verbesserung. Wenn Sie jedoch die Daten, die grafische Benutzeroberfläche und die Art und Weise anpassen, in der Sie Ihre Benutzer ansprechen und mit ihnen in Kontakt treten, können Sie eine 100-prozentige Verbesserung erzielen. Die Optimierung des Algorithmus ist nur einen Bruchteil wert." viel für Unternehmen wie für Ihre Nutzer."

Um diesen Punkt zu veranschaulichen, erläuterte Dunning, wie er einst ein Modell zur Identifizierung von Anwendungsbetrug (Eröffnung gefälschter Konten mit gestohlenen Identitäten) in der Kundendatenbank eines Unternehmens erstellte. Das Modell, das er baute, erzielte großartige Ergebnisse, aber Dunning bemerkte, dass es das Geschlecht des Bewerbers sehr stark belastete.

Es stellte sich heraus, dass die Logistik ausgeschaltet war. So wie der Bewerbungsprozess funktionierte, gab der Bewerber sein Geschlecht erst an, nachdem er bereits Kunde war und eine Reihe von Überprüfungsschritten durchlaufen hatte, um Betrüger herauszufiltern. Durch die Nutzung des Geschlechterbereichs hat das ML-Modell die Logistik des gesamten Betrugsprozesses betrogen. Das hat nichts mit dem Algorithmus zu tun und alles damit, wie das Unternehmen seine Daten erhalten hat.

2. Achten Sie auf Ihre Daten

Mahnwesen steckt voller eingängiger Weisheiten. Nachdem er mit "es ist die Logistik, nicht das Lernen" begonnen hatte, sagte er, die andere Hälfte dieser Idee sei "es sind die Daten, nicht die Algorithmen". Ein großer Teil der Sicherstellung, dass Ihre ML-Algorithmen wertvolle Erkenntnisse liefern, besteht darin, sicherzustellen, dass Sie ihnen die richtigen Daten zuführen. Laut Dunning liegt es häufig daran, dass Sie nicht die richtigen Daten verwenden, wenn Sie nicht das gewünschte Ergebnis erhalten.

"Die Leute sind alle mit bestimmten Algorithmen konfrontiert und an ihr Ego gebunden, aber heutzutage können alle und ihre Mutter dank der verfügbaren Tools alle möglichen neuen Algorithmen entwickeln", sagte Dunning. "Die Daten sind viel wichtiger und geben Ihnen viel mehr Auftrieb, als Ihre Algorithmen endlos zu optimieren. Wenn Sie an einem schwierigen Problem wie Spracherkennung oder Computer Vision arbeiten, ist das eine Sache. Aber dies ist ein datengetriebenes Feld. In den meisten Szenarien profitieren Sie viel mehr davon, wenn Sie die von Ihnen erhaltenen Daten anpassen und die Frage ändern."

Das hat Dunning Mitte der 2000er-Jahre getan, als er eine Videoempfehlungs-Engine bei einem Unternehmen namens Veoh Networks aufbaute. Das Team arbeitete daran, Paare von Videos zu identifizieren, auf die Nutzer mehr als erwartet geklickt hatten, aber der Algorithmus funktionierte nicht. Sie dachten in Bezug auf Musik, bei der Benutzer ihre Lieblingskünstler und -lieder mit Namen kennen. Sie änderten die Frage, indem sie die Benutzeroberfläche optimierten, ohne den Algorithmus selbst zu berühren.

"In von Nutzern erstellten Videos weiß niemand, dass die Künstler und viele Videos wirklich spammige Titel hatten, um mehr Aufrufe zu erhalten. Das Durchlaufen von Algorithmus-Optimierungen hätte nie zu guten Ergebnissen geführt", sagte Dunning. "Wir haben die Benutzeroberfläche so geändert, dass alle 10 Sekunden ein Beacon-Signal ausgegeben wird. Wir haben festgestellt, dass wir mit dem Beacon anstelle von Klicks für die Rohdaten des Empfehlers fantastische Ergebnisse erzielt haben. Der Lift für diese eine Änderung war mehrere hundertprozentige Verbesserung des Engagements aufgrund von Empfehlungen ohne algorithmische Änderungen."

3. Algorithmen sind keine Wundermittel

ML-Implementierungen leben von kontinuierlichem Versuch und Irrtum. Egal wie gut Ihre Algorithmen sind, wenn Ihr System mit Menschen interagiert, muss es im Laufe der Zeit angepasst werden. Das Mahnwesen betonte, dass Unternehmen ständig die Gesamteffektivität ihrer Implementierung messen und die Änderungen und Variablen identifizieren sollten, die sie verbessern und verschlechtern. Das hört sich vielleicht nach einer Gemeinheit an, aber Dunning sagte, dass nur sehr wenige Leute dies tun oder es gut machen, obwohl es so offensichtlich klingt.

"Viele Leute möchten ein System bereitstellen oder Maßnahmen ergreifen und möchten, dass ihr Algorithmus für immer perfekt funktioniert", sagte Dunning. "Kein Algorithmus wird ein Wundermittel sein. Kein Benutzeroberflächendesign wird für immer Bestand haben. Keine Datenerfassungsmethode wird niemals ersetzt werden. All dies kann und wird passieren, und Unternehmen müssen sorgfältig messen, bewerten und neu bewerten, wie ihre System funktioniert."

4. Verwenden Sie ein vielfältiges Toolset

Es stehen Dutzende von ML-Tools zur Verfügung, von denen Sie viele kostenlos verwenden können. Sie haben beliebte Open-Source-Framework-Bibliotheken wie Caffe, H20, Shogun, TensorFlow und Torch sowie ML-Bibliotheken in einer Reihe von Projekten der Apache Software Foundation (ASF), darunter Mahout, Singa und Spark. Darüber hinaus gibt es abonnementbasierte Optionen, darunter Amazon Machine Learning, BigML und Microsoft Azure Machine Learning Studio. Microsoft hat auch ein kostenloses Cognitive Toolkit.

Es stehen unzählige Ressourcen zur Verfügung. Das Mahnwesen hat mit zahlreichen Unternehmen, Datenwissenschaftlern und ML-Praktikern gesprochen und sie immer gefragt, wie viele verschiedene Frameworks und Tools sie verwenden. Dunning gab an, dass die meisten von ihnen im Durchschnitt mindestens 5-7 Werkzeuge und oft weitaus mehr verwenden.

"Sie können sich nicht auf ein Tool festlegen. Sie müssen mehrere Tools verwenden. Daher sollten Sie Ihr System besser so aufbauen, dass es agnostisch ist", sagte Dunning. "Wer versucht, Sie davon zu überzeugen, dass dieses Tool das einzige ist, das Sie jemals brauchen, verkauft Ihnen eine Stückliste.

"Nächste Woche könnte etwas passieren, das den Apfelkarren aus dem Gleichgewicht bringt, und bei der Innovationsrate, die wir sehen, wird dies noch mindestens fünf bis zehn Jahre so bleiben", fuhr Dunning fort. "Schauen Sie sich ein billiges Lernbeispiel an, in dem Sie möglicherweise einen vorhandenen Bildklassifizierer wiederverwenden, um Bilder in einem Katalog zu analysieren. Das ist tiefgreifendes Lernen mit eingebauter Computer-Vision. Aber es gibt Tools, die alles zusammengestellt haben. Sie brauchen." Um verschiedene Tools zu messen, zu bewerten und zwischen ihnen hin und her zu pendeln, muss Ihre Infrastruktur dies begrüßen."

5. Experimentieren Sie mit Hybrid Learning

Mahnwesen sagte, Sie können auch billig und Deep Learning in etwas von einem Hybrid mischen. Wenn Sie beispielsweise ein vorhandenes Computer-Vision-Modell verwenden und die wenigen obersten Ebenen, in denen eine Entscheidung getroffen wird, neu konstruieren, können Sie ein vorhandenes Framework für einen völlig neuen Anwendungsfall auswählen. Dunning wies auf einen Kaggle-Wettbewerb hin, bei dem die Teilnehmer genau das taten. Sie nahmen einen Datensatz und schrieben einen neuen Algorithmus darüber, um einem Computer zu helfen, Katzen von Hunden zu unterscheiden.

"Das Unterscheiden von Katzen und Hunden ist eine sehr subtile Sache für einen ML-Algorithmus. Denken Sie an die Logik: Katzen haben spitze Ohren, German Shepherds. Hunde haben keine Flecken, außer Dalmatiner usw. Das kann ziemlich schwer zu erkennen sein an und für sich ", sagte Dunning. "Der Gewinner entwickelte ein System, das dies mit einer Genauigkeit von 99 Prozent tat. Aber ich war mehr beeindruckt von der Person, die auf dem dritten Platz landete. Anstatt von Grund auf neu zu bauen, nahm er ein bestehendes Bilderkennungsprogramm aus einer anderen Aufgabe und nahm das Er gab einige Beispiele und bald war es zu 98 Prozent genau, Katzen von Hunden zu unterscheiden. Der ganze Vorgang dauerte drei Stunden."

6. Billig bedeutet nicht schlecht

Trotz der offensichtlichen Konnotation, sagte Dunning, dass billiges Lernen nicht schlechtes Lernen bedeutet. Die Zeit, die Sie für eine ML-Implementierung aufwenden, korreliert nicht direkt mit dem Geschäftswert. Die wichtigere Qualität sei, sicherzustellen, dass der Prozess reproduzierbar und zuverlässig ist. Wenn das Unternehmen dies erreichen kann, ohne übermäßig viele Ressourcen zu investieren, ist das umso besser.

"Billig heißt nicht schlecht. Wenn es funktioniert, funktioniert es. Wenn es billig ist und funktioniert, ist es großartig. Aber der Aufwand, den Sie in den Bau stecken, definiert den Wert nicht. Das ist ein Fehlschluss der Gesamtkosten", sagte Dunning. "Was den Wert definiert, ist, wie er das Geschäft verbessert. Wenn der Gewinn verbessert oder die Kosten senkt oder Ihre Wettbewerbssituation verbessert. Es ist der Effekt, nicht der Aufwand."

7. Nennen Sie es nicht AI

Das Mahnwesen betonte, dass Unternehmen, wenn sie über diese Techniken sprechen, die genaue Terminologie verwenden sollten: ML, Computer Vision oder Deep Learning. All dies fällt in der Regel unter den Oberbegriff "Künstliche Intelligenz", aber für Dunning ist die Definition von KI einfach "Dinge, die noch nicht funktionieren".

"Die beste Definition, die ich je für KI gehört habe, ist, dass es die Dinge sind, die wir noch nicht erklären können. Die Dinge, die wir nicht herausgefunden haben", sagte Dunning. "Jedes Mal, wenn wir etwas zum Arbeiten bringen, sagen die Leute: 'Oh, das ist keine KI, das ist nur Software. Es ist nur eine Regel-Engine. Es ist wirklich nur eine logistische Regression.' Bevor wir etwas herausfinden, nennen wir es AI. Danach nennen wir es immer etwas anderes. In vielerlei Hinsicht wird AI besser als ein Wort für die nächste Grenze verwendet, und in AI wird es immer eine nächste Grenze geben wo wir hingehen, nicht wo wir bereits angekommen sind."

7 Tipps für den Erfolg des maschinellen Lernens