Industrielle Fertigung
Industrielles Internet der Dinge | Industrielle Materialien | Gerätewartung und Reparatur | Industrielle Programmierung |
home  MfgRobots >> Industrielle Fertigung >  >> Industrial Internet of Things >> Eingebettet

Verbesserte Technologien beschleunigen die Akzeptanz von Sprachassistenten

Die Erfindung des Telefons vor mehr als 150 Jahren löste eine Revolution in der Kommunikation aus. Heute befindet sich die Revolution der Sprachkommunikation mitten in einem neuen Quantensprung, da neue Klassen intelligenter Geräte es der künstlichen Intelligenz (KI) ermöglichen, Bedeutung aus Klang zu extrahieren und den Menschen neue Möglichkeiten zu bieten, mit ihrer Welt intuitiver zu interagieren Weg. Dieser Artikel untersucht, wo wir heute stehen, und gibt eine Vorschau auf Technologien, die allgegenwärtige Sprachassistenten zu einem natürlichen Bestandteil unseres Lebens machen werden.

„Herr. Watson, komm her….“

Die berühmten Worte von Alexander Graham Bell im Jahr 1876 waren das erste Mal, dass Schall elektrisch übertragen wurde. Diese weltverändernde Innovation steht im Zentrum dramatischer Veränderungen in der Art und Weise, wie wir arbeiten, leben und spielen – und ist ein wesentlicher Bestandteil neuer Durchbrüche in der Art und Weise, wie wir mit der Welt um uns herum interagieren.

In seinem ersten Jahrhundert verband das kabelgebundene Telefonnetz Menschen auf der ganzen Welt. Dann machte die elektronische Revolution der letzten 50 Jahre Sprach- und Videogespräche drahtlos und tragbar. In diesem Jahrzehnt haben wir uns von freihändigen Telefongesprächen zwischen Menschen zu Gesprächen mit Maschinen bewegt. Obwohl noch rudimentär, treibt diese neue Art der Mensch-Maschine-Interaktion den nächsten Innovationssprung voran.

Computer, Smartphones und intelligente Lautsprecher verfügen jetzt über integrierte Sprachassistenten, die Cloud-basierte Deep-Learning-Systeme verwenden, damit wir Fragen stellen und Aktionen programmieren können. Dieselbe Funktion wird bald in andere Geräte integriert, die wir täglich verwenden. Schätzungen zufolge werden laut Statistica bis 2020 bis zu 1,8 Milliarden Menschen auf ihren Geräten und auf anderen Plattformen zu Hause und sogar in Geschäftsumgebungen Zugang zu einem Sprachassistenten haben.

Der Erfolg von Sprachassistenten wird jedoch immer noch durch die Einschränkungen der heutigen Technologien in Frage gestellt. Fortschritte in der KI, spezialisierten Prozessoren und empfindlicheren Mikrofonen werden die Leistung von Sprachassistenten verbessern und die Marktakzeptanz beschleunigen.

Unterhaltungen menschlich machen

Eine Herausforderung für Sprachassistenzsysteme besteht darin, dass menschliche Gespräche unglaublich reichhaltig und interaktiv sind. Manchmal kann ein Freund auf Ihre Aussagen reagieren, bevor Sie einen Satz beendet haben. Technisch gesehen werden Reaktionszeiten, wenn Menschen miteinander sprechen, in Dutzenden von Millisekunden gemessen. Während eine gelegentliche langsame, nachdenkliche Reaktion beim Gespräch mit Freunden ganz natürlich ist, stellen Sie sich vor, wie umständlich Ihre täglichen Interaktionen wären, wenn die normale Gesprächslücke Verzögerungen von bis zu mehreren Sekunden oder häufige Notwendigkeiten, eine Frage oder einen Befehl erneut zu formulieren, einschließen würde.

Das langsame „Gespräch“ des Sprachassistenten hängt mit mehreren Aspekten der zugrunde liegenden Technologie zusammen. Die Algorithmen, die die Spracherkennung und -antwort ermöglichen, erfordern viel Rechenleistung, daher zeichnen die heutigen Smartphone- und intelligenten Lautsprechersysteme Sprache auf und leiten sie dann an Computerressourcen in der Cloud weiter. Um die Möglichkeit von Übertragungsverzögerungen zu minimieren, übertragen Systeme typischerweise Audiodateien geringer Qualität, was zu hohen Fehlerraten führt. Und das Internet selbst ist ein Medium mit variabler Geschwindigkeit, sodass sich die Übertragungsgeschwindigkeit ändern kann. Die Kombination dieser beiden Faktoren wird sich immer auf die Qualität von Sprachassistenten auswirken, die auf die Cloud angewiesen sind, um die schwere Arbeit der Spracherkennung zu erledigen.

Trotz dieser Nachteile sind die Verbraucher offensichtlich von der Technologie begeistert. Der Verkauf von intelligenten Lautsprechersystemen, dem ersten völlig neuen Produkt nach Smartphones mit Sprachassistenten, wächst so schnell wie seit der Einführung der ersten Smartphones nicht mehr. Die Geräteverkäufe in den USA stiegen 2018 um 40 % und die 66,4 Millionen Neuverkäufe erhöhten die Zahl der intelligenten Lautsprecher auf 133 Millionen, was laut voicebot.ai etwas mehr als 26 % der Erwachsenen in den USA entspricht.

Es ist auch unvermeidlich, dass Sprachassistenten weiterhin besser darin werden, Gespräche zu emulieren. Die Gesprächsverzögerung wird schrumpfen und die Verbesserung der Algorithmen wird die Interaktion mehr wie eine menschliche Interaktion erscheinen lassen. Ein großer Teil dieser Verbesserungen wird daraus resultieren, dass die Verarbeitung dem Benutzer näher gebracht wird.

Konversation auf den Punkt bringen

Die Technologie, die Cloud-basierte Sprachassistenten jetzt Realität werden lässt, schreitet in einem Tempo voran, das diese Geräte viel persönlicher machen wird. Aktuelle Sprachassistenten leiten Informationen in die und aus der Cloud weiter. Morgen wird die KI, die dies ermöglicht, im Edge-Gerät untergebracht sein und Vorteile in Bezug auf Privatsphäre, Stromverbrauch und Reaktionsfähigkeit des Systems bieten. Kurz gesagt verspricht Edge Computing, Sprachassistenten effektiver zu machen, indem KI aus der Cloud zu uns nach Hause, zu unserem Arbeitsplatz und zu anderen Geräten in unserer Umgebung verlagert wird. In einem Schritt in diese Zukunft hat Infineon kürzlich die Edge-Keyword-Erkennungslösung mit dem niedrigsten Stromverbrauch der Welt vorgestellt.

Ein vielversprechender Bereich für intelligentere Sprachassistenten ist die medizinische und persönliche Gesundheitsüberwachung. Ein hochempfindliches Mikrofon kann beispielsweise Atemgeräusche im Schlaf überwachen und das Einsetzen von Schlafstörungen wie Schlafapnoe vorhersagen. Viele Menschen fühlen sich möglicherweise unwohl, wenn diese Art von persönlichen Gesundheitsinformationen zur Verarbeitung in die Cloud übertragen werden. Die Edge-Verarbeitung wird es ermöglichen, diese Informationen zu überwachen und zu analysieren, indem die Audioaufnahme, Berechnung und Speicherung der analysierten Daten lokalisiert wird. Die Benutzer können dann verwalten, wie und wann die Daten weitergegeben werden. Ein Sprachassistent, der ein höheres Maß an Privatsphäre gewährleistet, erleichtert die Überwachung der Herz- und Atemwegsgesundheit, des Schlafzustands und des allgemeinen Wohlbefindens.

Die Fortschritte in der KI, die wir heute sehen, werden durch die Deep-Learning-Forschung und neue Arten von Hardware angetrieben, die zum Aufbau spezialisierter Deep-Learning-Systeme verwendet werden. Infineons Partner Syntiant, ein Pionier auf diesem Gebiet, baut eine neue Chipklasse, die Deep Learning in Edge-Geräte bringt. Innerhalb weniger Jahre wird die Mensch-Maschine-Interaktion mit Hilfe von Sprachassistenten für Milliarden von Menschen zum Alltag gehören. Und die für intelligentere Sprachassistenten entwickelte Technologie wird über Leistungsmerkmale verfügen, die eine kleine, batteriebetriebene intelligente Audioerkennung für viele andere Anwendungen ermöglichen. Um vorherzusagen, wo die Technologie sonst noch Wert hat, sollten Sie sich überlegen, wie sich die Geräusche, die Sie hören, auf Ihre Interaktion mit der Welt auswirken. Außerhalb der Sichtweise des Alltagsnutzers wird die Sprachassistenten-Technologie ein Teil der Sensorsuite in intelligenten Maschinen, die im Internet der Dinge (IoT) und als Teil von Industrie 4.0 arbeiten.

Autonome Fahrzeuge werden auch den Audioeingang in Kombination mit anderen Sensoren verwenden, um die Umgebung zu erkennen und darauf zu reagieren. Geräusche wie Fahrräder, Züge, anderer Verkehr und schreiende Kinder sind alle Eingaben in das KI-Netzwerk, das es Autos ermöglicht, Objekte um Ecken zu „sehen“. In einer Fabrik können die Geräusche des Betriebs von Maschinen in intelligenten Steuerungsnetzwerken verwendet werden, die potenzielle Probleme diagnostizieren, bevor sie auftreten. Smart City-Systeme „hören“ ungewöhnliche Ereignisse wie Glasbruch oder einen Fahrzeugunfall und alarmieren die zuständigen Behörden. Und zukünftige Robotergenerationen werden Audiosysteme als Teil des Sensornetzwerks verwenden, das eine intelligente Bedienung und Interaktion unterstützt. Tatsächlich ist die Liste möglicher Anwendungen endlos.

— Pradyumna Mishra ist Unternehmerin bei Infineon Technologies


Eingebettet

  1. Wie 5G das industrielle IoT beschleunigen wird
  2. Automotive-Bildsensoren bieten einen verbesserten Dynamikbereich
  3. Schlüsseltechnologien vereinen sich in fortschrittlichen Robotersystemen
  4. Spezialisierte Prozessoren beschleunigen Endpoint-KI-Workloads
  5. Wird das IoT jemals erwachsen?
  6. Wird COVID-19 die Robotik in der Lieferkette beschleunigen?
  7. 12 neue Technologien in der Elektronik, die unsere Zukunft verändern werden
  8. Forrester Research:Die globale Pandemie wird Automatisierungspläne verändern und beschleunigen
  9. Nearshoring wird einen Anstieg der Arbeitsplätze in der Fertigung beschleunigen
  10. Technologien, die die Fertigung im Jahr 2021 dominieren werden