Video: Wunderwaffe Virtuelle Assistenten: Einsatzgebiete, Do´s and Don´ts (November 2024)
Virtuelle Assistenten wie Siri und Google Now werden in den nächsten zwei Jahren erheblich leistungsfähiger, sagt Paul Ricci (oben), CEO des führenden Spracherkennungs-Anbieters Nuance Communications.
"Wir werden in zwei Jahren virtuelle Assistenten sehen, die in Bezug auf die gängigsten Domänen, die Sie auf einem Smartphone verwenden möchten, recht robust sind", sagte Ricci. Dazu gehören Dinge wie Restaurants und Medien. Solche Anwendungen beherrschen die Steuerung und Kontrolle, haben ein gewisses Kontextbewusstsein und transportieren einige persönliche Informationen über Geräte hinweg, sagte er.
Ricci sagte, das Unternehmen wisse, dass es ein 20-jähriger Weg sein werde, um spracherkannte persönliche Assistenten zu verwirklichen. Das Unternehmen zeigte in seinen frühen Präsentationen Beispiele aus Star Trek, auch wenn es nur Dragon Naturally Speaking- und Callcenter-Anwendungen gab.
Die Sprache sei weit fortgeschritten, sagte er, und das heutige Diktat sei "ziemlich ausgereift". Zwar räumte er ein, dass die Spracherkennung in lauten Umgebungen noch Arbeit erfordert, doch die eigentlichen Verbesserungen müssen darin bestehen, Software zu entwickeln, die wirklich versteht, was der Benutzer wünscht, die Domäne versteht und die richtige Antwort für den Benutzer erhält.
Das Telefon benötigt Spracherkennung und einige Informationen zu seinem Benutzer. Dann kann es Benutzern nützliche Informationen liefern. Nuance macht all diese Dinge und verkauft bestimmte Teile an verschiedene Kunden. Er wollte nicht speziell über Siri sprechen, obwohl er anzeigte, dass es bekannt ist, dass der Spracherkennungsteil von Nuance stammt, aber die Verarbeitung natürlicher Sprache und andere Dinge begannen mit der Siri-Firma, die Apple erwarb. Nuance stellt Google keine Technologie zur Verfügung, sagte aber, dass es Technologie für eine Vielzahl von Android-Anwendungen zur Verfügung stellt, einschließlich der Spracherkennung für Samsungs S-Voice und eines virtuellen Assistenten für HTC.
Er sagte auch, er erwarte, dass in Fernsehgeräten routinemäßig Spracherkennung eingebaut wird, und er glaubt, dass jeder der großen Elektronikhersteller virtuelle Assistenten mit seinen eigenen Fähigkeiten bauen wird. Das Smartphone ist wahrscheinlich der Mittelpunkt, sagte er, aber virtuelle Assistenten werden Ihnen zu anderen Geräten, einschließlich Fernsehern und Autos, folgen.
Auf die Frage, ob der Spracherkennungsdienst eingebettet oder cloudbasiert ist, sagte er, dass dies von der Anwendung abhänge. In Autoanwendungen benötigen Sie beispielsweise beide Lösungen, da diese auch dann funktionieren müssen, wenn keine Verbindung zur Cloud besteht. Siri sei cloudbasiert, aber andere Telefonanwendungen könnten entweder einen Ansatz oder eine Kombination verwenden.
Die Hauptstrategie von Nuance bestand seit jeher darin, Technologie für Großkunden bereitzustellen und sie in die Marken ihrer Kunden einzubetten. Neben der Spracherkennung werden auch Produkte wie die Swype-Tastatur mit Vorhersagefunktion hergestellt. Er wollte nicht viel über Klagen reden, merkte aber an, dass der mobile Bereich sehr streitig ist. "Die Unternehmen, die am besten abschneiden, konzentrieren sich auf die langfristige Vision", sagte er.