Industrielle Fertigung
Industrielles Internet der Dinge | Industrielle Materialien | Gerätewartung und Reparatur | Industrielle Programmierung |
home  MfgRobots >> Industrielle Fertigung >  >> Industrial Internet of Things >> Internet der Dinge-Technologie

Dev-Kits beschleunigen die Alexa-Integration

Konstrukteure können Hardwaremodule und Softwaredienste einsetzen, um den Alexa Voice Service (AVS) in Smart Home-, Automobil- und Wearable-Geräte zu integrieren; das die Cloud-basierten Alexa-Erlebnisse auf Produkte überträgt, die von tragbaren Lautsprechern über intelligente Geräte bis hin zu Infotainment im Fahrzeug reichen. Entwickler können Alexa in sprachbasierte Produkte integrieren und eine Begleit-App schreiben, um ein Produkt in ein vernetztes zu verwandeln.

Seit Amazon 2014 das ursprüngliche Alexa-Gerät auf den Markt gebracht hat, haben Amazon Web Services (AWS) sowie mehrere Chiphersteller Referenzdesigns vorgestellt, die Ingenieuren bei der Integration der Spracherkennungstechnologie und der AVS-Schnittstelle von Amazon helfen, indem sie vorgefertigte und vorab getestete Designs bereitstellen.

Wenn Ihr Unternehmen also nicht viele Ingenieure für die Hardware- und Softwareentwicklung hat, erleichtern Referenzdesigns die Entwicklung einfacher und kostengünstiger natürlicher Sprachverständlichkeit und Sprachschnittstellen für Alexa-basierte Designs. Ansonsten macht die Integration einer hochwertigen Audioverarbeitung die Entwicklung von sprachfähigen Geräten langwierig und kompliziert.


Abbildung 1. Referenzdesigns für AVS-basierte Sprachanwendungen wurden entwickelt, um die Spracherkennungstechnologie von Amazon nahtlos in sprachgesteuerte Geräte zu integrieren. Quelle:STMicroelectronics

Weckworterkennung

Alles beginnt mit einer robusten Wake-Word-Engine (WWE), die auf das Schlüsselwort „Alexa“ lauscht, bevor das System Maßnahmen ergreift. Es gibt eine Cloud-basierte Wake-Word-Verifizierung, die den Kontext validiert und sicherstellt, dass der Benutzer Alexa wirklich will. Hier verbessert der Sprachaufnahmeteil des Referenzdesigns die „Alexa“-Weckworterkennung, indem er eine Audioaufnahme unter realen Bedingungen durchführt. Damit Designer selbst aus mäßiger Entfernung laute Umgebungen unterbrechen können.

Nehmen Sie das Beispiel des Voice Capture Development Kit von Cirrus Logic für Amazon AVS-Anwendungen. es bietet akustisches Tuning mit bewährten Hard- und Softwarekomponenten. Das Kit verbessert die Wake-Word-Erkennung von „Alexa“ sowohl in leisen als auch in lauten Umgebungen, selbst wenn der Benutzer mehrere Meter vom Gerät entfernt ist. Dies geschieht durch die Unterdrückung von Rauschen und anderen realen Störungen für genauere und zuverlässigere Sprachinteraktionen.


Abbildung 2. Das Fernfeld-AVS-Referenzdesign richtet sich an intelligente Lautsprecher und andere sprachgesteuerte Smart-Home-Geräte. Quelle:Cirrus Logic

Wie oben gezeigt, enthält das Kit ein Voice-Capture-Board mit dem Zwei-Mikrofon-Array, Raspberry Pi 3 (RPi3), Lautsprecher und eine microSD-Karte, auf der die erforderliche Firmware für sofortige Produktivität vorinstalliert ist. Eine Steuerkonsole vereinfacht die Bedienung der verschiedenen RPi3-Anwendungen und bietet eine benutzerfreundliche Schnittstelle zur Durchführung von akustischen Abstimmungs- und Diagnosefunktionen.

Das Voice-Capture-Board verfügt über den intelligenten Codec CS47L24 von Cirrus Logic, digitale MEMS-Mikrofone CS7250B und SoundClear-Algorithmen für Sprachsteuerung, Rauschunterdrückung und Echounterdrückung. Hier integriert der intelligente Codec Hi-Fi-DACs, einen Stereo-Kopfhörerverstärker und einen Mono-Lautsprecherverstärker, um den Platzbedarf auf der Platine und die Stückliste (BOM) zu reduzieren.

Als nächstes sorgen die MEMS-Mikrofone mit extrem niedrigem Grundrauschen und einem breiten Dynamikbereich von 103 dB für eine präzise Sprachaufnahme unter schwierigen Lärmbedingungen. Schließlich blockieren die SoundClear-Algorithmen Geräusche, die sonst das Alexa-Weckwort stören würden.

Dadurch kann das Kit die „Alexa“-Weckworterkennung und die Audioaufnahme unter realen Bedingungen effizient durchführen, selbst aus mäßigen Entfernungen in lauten Umgebungen, sodass Benutzer laute Musik- oder Alexa-Reaktionswiedergabe zuverlässig unterbrechen können.

Audio-Frontend

Die Basishardware in einem AVS-basierten Design umfasst mehrere Mikrofone und ein Audio-Frontend (AFE), das die „Alexa“-Weckworterkennung sowohl in leisen als auch in lauten Umgebungen sicherstellt. Das macht das Audio-Frontend zu einem kritischen Baustein jedes AVS-Referenzdesigns.

Das Audio-Frontend nimmt die Stimme des Benutzers auf, verstärkt sie, reduziert Hintergrundgeräusche und sendet sie an die Cloud. Es ist schwierig, und daher ist die Verwendung eines Entwicklungskits eine großartige Möglichkeit, ein Audio-Frontend zu erstellen.

Nehmen Sie TalkTo, das Audio-Front-End von DSP Concepts mit AVS-qualifizierter integrierter Sprachverarbeitung; Es wurde für das AWS IoT Core-Referenzdesign von STMicroelectronics basierend auf den STM32-MCUs des Chipherstellers eingeführt. Das TalkTo-Audio-Front-End bietet Rauschunterdrückung, Echounterdrückung und Signalverarbeitung basierend auf fortschrittlichem Beamforming für die Fernfeld-Audioerkennung. Es wird über Audio Weaver bereitgestellt, ein kostenloses Tool, das Entwicklern bei der Feinabstimmung von AVS-Designs hilft.


Abbildung 3. Eine Single-Chip-Lösung mit Audio-Front-End-Verarbeitung, lokaler Wake-Word-Erkennung, Kommunikationsschnittstellen und Speicherinhalten einschließlich RAM und Flash reduziert Stücklistenkosten und vereinfacht das Layout. Quelle:STMicroelectronic

Das 36×65-mm-Board von ST kombiniert ein Wi-Fi-Modul mit einer STM32H743-MCU, die Audio-Front-End-Verarbeitung, lokale Wake-Word-Erkennung, Kommunikationsschnittstellen und Speicher in einem einzigen Chip integriert. Die Referenzdesign-Hardware enthält auch ein Audio-Daughterboard als separates Modul, um die Entwicklung und das Prototyping weiter zu vereinfachen.

Das Daughterboard umfasst einen FDA903D-Audiocodec, Benutzer-LEDs und -Tasten sowie zwei MP23DB01HP-MEMS-Mikrofone mit einem Abstand von 36 mm für Designs mit eingeschränkter Größe. Dadurch können Entwickler auch einen Datenschutzmodus integrieren, der die Mikrofone ausschaltet, sodass eine rote LED die Benutzer darüber informiert, dass Alexa keine Sprachbefehle hören kann.

Fernfeld-Spracherkennung

Auch andere Chiphersteller haben sich mit Referenzdesigns eingemischt, die die Fernfeld-Spracherkennungstechnologie von Amazon integrieren. NXP hat zum Beispiel eine Referenzplattform vorgestellt, die behauptet, die Anfrage eines Benutzers von der anderen Seite des Raums zu erkennen, selbst wenn laute Musik gespielt wird.

Die Referenzplattform von NXP für Amazon Alexa umfasst ein 7-Mikrofon-Array-Design, Audioverarbeitungsalgorithmen und Beamforming-Technologie. Es integriert die Fernfeld-Spracherkennungstechnologie von Amazon in die i.MX-Anwendungsprozessoren von NXP und soll gleichzeitig die Erstellung sprachgesteuerter Geräte vereinfachen.

Die sprachgesteuerten Designs wie Alexa verändern die Art und Weise, wie Benutzer mit intelligenten Dingen interagieren, von Toastern über Herde und Thermostate bis hin zu Jalousien. Hier bieten Referenzplatinen und Voice-Capture-Kits den schnellsten Weg zur Markteinführung für verschiedene Alexa-fähige Produkte und gewährleisten gleichzeitig eine hochpräzise Auslösung von Weckwörtern und eine Befehlsinterpretation selbst in lauten Umgebungen.

Wir stehen ganz am Anfang der sprachgestützten Geräterevolution, und die Vielfalt dieser Anwendungen bedeutet, dass vorgefertigte und vorgetestete Referenzplatinen und -kits wahrscheinlich eine wichtige Rolle spielen werden. Ihre Rolle wird entscheidend sein, um sprachgesteuerte Produkte schneller auf den Markt zu bringen und ihre Designkomplexität zu umgehen.

>> Dieser Artikel wurde ursprünglich veröffentlicht am unsere Schwesterseite EDN.


Internet der Dinge-Technologie

  1. Tachometer
  2. Sprachbiometrielösung zielt auf Authentifizierung ab
  3. Kostengünstige Entwicklungskits beschleunigen die LoRaWAN-Entwicklung
  4. Entwicklungskit beschleunigt das Design von Fahrzeugsteuergeräten
  5. Entwicklungskits verwenden 1 x 1-mm-Bildsensor
  6. MajorTom:Alexa Voice Controlled ARDrone 2.0
  7. Übersicht über HARTING MICA® Starter Kits
  8. Übersicht über die HARTING MICA® Starter Kits
  9. Facebook entwickelt KI, die in der Lage ist, die Stimme jedes Einzelnen mit beispielloser Genauigkeit zu kopieren
  10. 5G-Integration in IIoT-Systeme beschleunigen die Einführung von Industrie 4.0