Zuhause Vorausdenken Kognitive und Konversations-Tools stehen bei Microsoft Build im Mittelpunkt

Kognitive und Konversations-Tools stehen bei Microsoft Build im Mittelpunkt

Video: Microsoft Build 2020 (November 2024)

Video: Microsoft Build 2020 (November 2024)
Anonim

Was mich auf der Microsoft Build-Konferenz in dieser Woche am meisten überraschte, war die Betonung der kognitiven Dienste und der Konversationsdienste, als Microsoft seine Vision vorstellte, wie solche Dienste Anwendungen in Zukunft transformieren werden, und versuchte, Entwickler davon zu überzeugen, sich dieser Vision anzuschließen. Vieles wird den Endbenutzern erst später auffallen - die wichtigsten Funktionen für Endbenutzer sind derzeit Verbesserungen des Cortana-Personal Assistant und neue Funktionen für das Einfärben in der "Anniversary Edition" von Windows 10, die in diesem Sommer verfügbar sein wird. Die Bemühungen, sicherzustellen, dass Microsoft mit seinen Konkurrenten bei maschinellem Lernen, intelligenten Agenten und Messaging-Apps mithalten kann, richten sich jedoch vorerst eher an Entwickler, da das Unternehmen bereits über grundlegende Anwendungen verfügt, jedoch ein Ökosystem benötigt, um sie eindrucksvoller zu machen.

Das größte neue Thema, das von CEO Satya Nadella eingeführt wurde, war "Gespräche als Plattform", bei denen es anscheinend darum geht, Gesprächsplattformen - von Cortana über Skype bis hin zu Anwendungen von Drittanbietern - zu nutzen und ihnen Informationen hinzuzufügen. Die Idee ist, solchen Anwendungen Verständnis, Präferenzen und insbesondere Kontext hinzuzufügen.

Er sagte, es gibt drei Hauptakteure in solchen Gesprächen: Menschen, digitale Assistenten und Bots. Von Person zu Person sprach er über Anwendungen wie Skype Translate, die versuchen, bessere Konversationen in mehreren Sprachen zu ermöglichen. Ein digitaler Assistent werde Sie auf mehreren Geräten kennen und bei alltäglichen Aufgaben, wie dem Planen von Terminen, behilflich sein. Bots sind neue Anwendungen, mit denen Sie sich in natürlicher Sprache unterhalten können, und er sprach über eine Vision, in der Sie Bots innerhalb eines Gesprächs anrufen können.

All dies führe zu einer neuen Plattform, auf der die menschliche Sprache zur Benutzeroberfläche wird, Bots zu neuen Anwendungen werden und digitale Assistenten wie "Meta-Apps" wie der Browser existieren, um andere Anwendungen aufzurufen mit all diesen Anwendungen, einschließlich Intelligenz. Er sagte, dies würde eine ebenso große Änderung der Plattform bedeuten wie die GUI, das Web oder Touch on Mobile.

Nadella sprach darüber, wie die Vision war "nicht Mensch gegen Maschine, sondern Mensch mit Maschinen", wobei Menschen Empathie, Emotionen und Urteile lieferten und Maschinen Rechenleistung lieferten. Aber er sagte, es sei wichtig, einen "prinzipiellen Ansatz" für maschinelles Lernen zu haben und ihn zu nutzen, um die menschlichen Fähigkeiten und Erfahrungen zu verbessern, vertrauenswürdig (in Bezug auf Datenschutz, Sicherheit und Compliance), inklusiv und respektvoll zu sein.

Zum letzten Punkt sagte er, es sei wichtig, dass solche Anwendungen "das Beste der Menschheit, nicht das Schlimmste" darstellen, und wies auf Tay hin, Microsofts fehlgeschlagenes Experiment, in der vergangenen Woche einen Chat-Bot einzuführen, der einen Tag später abgeschaltet werden musste als es anfing, beleidigende Bemerkungen zu wiederholen. Nadella gab zu, dass das Unternehmen einen Fehler begangen hatte und sagte, "wir haben schnell erkannt, dass dies nicht der Fall ist", sagte aber, dass das Unternehmen solche Technologien weiter ausbauen werde, wobei sie feststellte, dass seine Bots in China und Japan nicht die gleichen Probleme hatten.

Unter den neuen Details befindet sich Cortana in Outlook, damit es Ihre E-Mails, Kontakte und Ihren Kalender besser versteht, Termine neu terminiert - eine großartige, wenn auch nicht völlig neue Idee - und Ihnen Vorschläge unterbreiten kann, die Sie möglicherweise als Nächstes ausführen möchten basierend auf Ihrem Kalender, Ihrer E-Mail oder den Gesprächen, die Sie geführt haben. Eine neue Version von Skype bietet jetzt Unterstützung für Cortana und kann Bots in seinen Video-Chats unterstützen, um beispielsweise kurze Videoanrufe zu transkribieren und für alle Arten von Diensten erreichbar zu sein. Microsoft nannte dies Skype als "Konversationsfläche". Auch dies scheint keine neue Idee zu sein - Dinge wie WeChat und Facebook Messenger hatten schon lange Bots -, aber es zeigt, wie Microsoft versucht, dies in eine Plattform umzuwandeln. Es wird auch gezeigt, wie dies plattformübergreifend funktionieren kann. Die Demonstration beginnt auf einem Windows-PC und endet in Skype auf einem Android-Telefon.

Die meiste echte Neuigkeit scheint jedoch in neuen Angeboten für Entwickler zu liegen, die jetzt als Cortana Intelligence Suite (ehemals Cortana Analytics Suite, ein gutes Beispiel dafür, welche Begriffe in einem bestimmten Jahr aktuell sind) bekannt sind.

Hierbei handelt es sich im Grunde genommen um eine Laufzeit, die auf der Azure-Plattform basiert und ein Bot-Framework, kognitive Dienste und maschinelles Lernen umfasst.

Das Bot-Framework erleichtert es, einen Bot zu erstellen oder einen mit anderen Diensten zu verbinden. Entwickler können diese in node.js oder C # erstellen. In einer Demo wurde ein Bot erstellt, der Pizzen bei Domino bestellt. Am interessantesten fand ich hier, dass es sich um ein offenes Framework mit Bots handelt, die nicht nur in Cortana und Skype, sondern auch in Slack, Telegram, einfachen SMS und anderen Diensten funktionieren können. Natürlich standen einige der interessantesten alternativen Dienste nicht auf dieser Liste - darunter Apples Siri, Amazons Alexa oder Facebooks Messenger oder WhatsApp.

Eine weitere Demo zeigte, wie einige der kommenden Tools es Entwicklern erleichtern werden, Regeln für Bots hinzuzufügen oder zu ändern, und wie sie die natürliche Sprache verstehen. Es kann vorschlagen, dass andere Wörter verwendet werden, die ähnliche Bedeutungen haben, das maschinelle Lernen als Grundlage für das Verständnis natürlicher Sprachen verwenden, um den Wortschatz im Laufe der Zeit zu verbessern, oder Anfragen an einen menschlichen Assistenten weiterleiten, wenn der Bot nicht versteht, was zu tun ist.

Schließlich führte das Unternehmen eine viel größere Reihe von kognitiven Diensten ein, von denen im letzten Jahr 5 auf 22 verschiedene Dienste aufgestockt wurden. Diese Dienste decken eine breite Palette von Szenarien ab, einschließlich Objekterkennung, Sprache, Wissen und Suche. Ein Beispiel war ein Caption Bot, der mithilfe einer Kombination aus Objekterkennung und natürlicher Sprache Bildunterschriften hinzufügt. Ein anderes Tool namens CRIS (Custom Recognition Intelligence Service) schien die Umwandlung von Sprache in Text weitaus besser zu machen als herkömmliche Methoden. Schließlich demonstrierten sie die Verwendung der Tools, um Analysen in Twitter-Feeds durchzuführen und Profilbilder zu sammeln, um das Alter und das Geschlecht eines Posters zu bestimmen.

Natürlich kündigte Microsoft auch eine Reihe anderer Tools an, die sich an Entwickler richten, und forderte insbesondere, dass Windows die Plattform sein sollte, die sie für die Entwicklung von Anwendungen unabhängig von der Plattform verwenden. Das überraschendste dieser neuen Tools - zumindest bis zu den Gerüchten der letzten Woche - ist das Hinzufügen der BASH-Shell von Linux. Andere Tools umfassen jedoch einen Desktop-App-Konverter zum Verschieben traditioneller Win32-Desktop-Anwendungen auf neue Universal-Apps. Ein großer Schub für die Xamarin-Cross-Development-Tools, der darauf hindeutet, dass Entwickler den Kern einer plattformübergreifenden Anwendung und die spezifischen Änderungen für jede Umgebung, einschließlich Android und iOS sowie Windows, auf einer Windows-Plattform erstellen können.

Darüber hinaus zeigte Microsoft den "dev mode", ein Tool, mit dem eine Xbox One in den Computer einer Entwicklerplattform verwandelt werden kann, der heute ausgeliefert wird. und sagte, dass die erste Version von HoloLens ab heute auch Entwicklern zur Verfügung stand.

Nadella begann den Morgen damit, darüber zu sprechen, wie wir jetzt mehr Diskussionen über die Rolle der Technologie in unserer Gesellschaft sehen, weil Technologie zum Mainstream geworden ist und in unser tägliches Leben, Unternehmen und Volkswirtschaften eingebettet ist. Er sagte, es gebe Fragen, ob Technologie das Wirtschaftswachstum für alle treibe oder ob das Wirtschaftswachstum trotz der Ausgaben für Technologie ins Stocken geraten sei. ob es Arbeitsplätze ermöglicht oder sie verlagert; und ob es dauerhafte Werte wie Privatsphäre ermöglicht oder ihnen im Weg steht.

"Ich bin ein Optimist", sagte er, der Überzeugung, dass Technologie das Wirtschaftswachstum auf der ganzen Welt vorantreiben, uns in unserem täglichen Leben stärken und unseren dauerhaften Wert unterstützen kann. Um dies zu erreichen, müssen wir sicherstellen, dass wir die Technologie so einsetzen, dass dies möglich ist, und sie in das aktuelle Unternehmensleitbild von Microsoft übernehmen, um "jede Person und jedes Unternehmen auf dem Planeten zu mehr Leistung zu befähigen". Dies müsse bei den Entwicklern beginnen.

Er beendete die Keynote mit einem Video, das zeigte, wie Saqib Shaikh, ein blinder Entwickler bei Microsoft, kognitive Techniken mit der Pivothead-Brille einsetzen konnte, um Informationen über die Welt um ihn herum zu erhalten. Beispiele sind das Hören von Menschen, die in einem Park spielen, und das Wischen seiner Brille, um zu hören, dass es sich um ein junges Mädchen handelt, das einen Frisbee wirft. Dies ist nur ein Forschungsprojekt, aber es war ziemlich inspirierend und Nadella brachte den Entwickler auf die Bühne.

Für mich bedeutete die Keynote die Etablierung neuer Plattformen, die auf maschinellem Lernen und auf Bots basieren. Außerdem erkannte ich, dass Microsoft, so erfolgreich Windows war, in der Cloud alles andere als dominant ist und den Kampf im Grunde verloren hat eine wichtige Handy-Plattform zu werden. (Tatsächlich wurde nur eine Demo der gesamten Keynote unter Windows Phone erstellt, und das war eine Skype-Demo, die auch unter Android problemlos möglich gewesen wäre.) Daher ist es nicht überraschend, dass Microsoft auf die nächste Plattform blickt. Natürlich wird es sowohl mit traditionellen als auch mit neuen Wettbewerbern zu tun haben.

Kognitive und Konversations-Tools stehen bei Microsoft Build im Mittelpunkt