Industrielle Fertigung
Industrielles Internet der Dinge | Industrielle Materialien | Gerätewartung und Reparatur | Industrielle Programmierung |
home  MfgRobots >> Industrielle Fertigung >  >> Industrial Internet of Things >> Internet der Dinge-Technologie

Sprachbiometrielösung zielt auf Authentifizierung ab

Fortschritte in der künstlichen Intelligenz ermöglichen heute eine ausreichende Genauigkeit der Sprachbiometrie, die nicht nur für die Identifizierung und Personalisierung, sondern auch für Anwendungen wie die Zahlungsauthentifizierung verwendet werden kann. Eine neue Lösung von Synaptics und ID R&D bietet KI-gestützte Sprachbiometrie und Anti-Spoofing-Algorithmen, die auf einem Synaptics-SoC im Edge-Gerät ausgeführt werden können. Die Software wurde speziell für die Neural Processing Unit (NPU) der VS600-Serie von Synaptics für Smart-Home-Geräte wie Set-Top-Boxen (STBs), intelligente Lautsprecher und Sicherheitssysteme optimiert.

Synaptics verkauft seine KI-fähigen SoCs an Smart-Home-Produkte, die Videostreaming, Audiostreaming und Imaging verarbeiten müssen. Ein typischer Anwendungsfall könnte beispielsweise eine STB mit Kameras für Videokonferenzen sein.


Die Sprachbiometrie ist jetzt genau genug, um die Zahlungsauthentifizierung in Smart-Home-Geräten zu ermöglichen

„Was die Set-Top-Box-Anwendung gemeinsam hat und mit der Zeit immer häufiger wird, ist die Möglichkeit, Sprache als Schnittstelle zu verwenden“, sagte Vineet Ganju, Vice President of Marketing bei Synaptics EE Times . „Die Fernbedienung kann sprachaktiviert werden, sodass Sie in sie sprechen können, um in Ihrem Netflix-Konto zu navigieren und nach Filmen zu suchen … die Sprache als Benutzeroberfläche wird in diesen Anwendungen fast zum Standard.“

Wenn auf einer STB Netflix ausgeführt wird, müssen Benutzer als Erstes auswählen, welches Profil verwendet werden soll. Mit Sprachbiometrie würde die STB sofort wissen, wer zusieht, was einen Schritt aus dem Prozess erspart.

„Bei Pay-per-View-Inhalten können Sie beispielsweise nicht nur per Sprache suchen und bestimmte Filme finden, die möglicherweise nicht Teil Ihres Abonnements sind, sondern Sie sind auch bereit, 5 US-Dollar für das Ansehen zu zahlen“, sagte Ganju. „Dann möchten [die Betreiber] sich sofort authentifizieren und Sie den Film vor Ort kaufen lassen. Sie sehen dies als eine enorme Reduzierung der Reibungsverluste, da sie den Nutzern nicht nur helfen, auf sie zugeschnittene Inhalte zu finden, sondern auch für diese Inhalte bezahlen und sie ansehen können.“

Registrierung auf dem Gerät

Die Voice Biometrics AI von ID R&D extrahiert mehr als 400 Merkmale aus der Stimme, einschließlich Kombinationen von Parametern in Bezug auf Frequenz/Tonhöhe und andere Dinge wie Aussprache und Akzente.

„Es ist nicht so eingeschränkt wie einige der früheren Generationen von Sprachbiometrie“, sagte John Amein, Senior Vice President of Sales bei ID R&D gegenüber EE Times , fügt hinzu, dass die KI-Sprachbiometrie erst im letzten Jahr die Genauigkeit erreicht hat, die für Anwendungen wie die Zahlungsauthentifizierung erforderlich ist.

Der Algorithmus lernt die Stimme des Benutzers durch einen Prozess namens „Einschreibung“ zu erkennen, bei dem der Benutzer einen Satz dreimal wiederholt. Jeder Satz kann verwendet werden und funktioniert sofort in jeder Sprache. Die Registrierung wird auf dem Edge-Gerät verarbeitet.

Der KI-Algorithmus von ID R&D kann registrierte Benutzer mit einer falschen Akzeptanzrate von unter 1 zu 10.000 identifizieren, die Amein mit der Wahrscheinlichkeit vergleicht, dass jemand Ihre PIN errät. Die Rate der falschen Ablehnung – die Rate, mit der die Stimme des registrierten Benutzers fälschlicherweise abgelehnt wird – liegt nahe bei 5 %. Und die Spoof-Acceptance-Rate (SAR) für Spoofing-Angriffe wie das Aufzeichnen der Stimme des Benutzers, die dem System wiedergegeben wird, ist besser als 7 %, was der Standardgrenzwert für die biometrische Entsperrung von Android-Geräten ist.

„Da der biometrische Abgleich bei einer falschen Akzeptanzrate von eins zu 10.000 liegt und die Anti-Spoofing-Rate besser ist als die vom Android-Standard geforderte 7-%-Rate, treffen wir wirklich beide Dinge, die für die Akzeptanz von Sprachbiometrie erforderlich sind als sicher genug für eine Zahlungsautorisierung“, sagte Amein.

Anti-Spoofing

Auch die Anti-Spoofing-Technologie von ID R&D basiert auf KI.

„Gesprochene Stimme hat eine Bandbreite von bis zu 3500 Hz, und wir sampeln mit einer viel höheren Rate“, sagte Amein. „Wir hören also Frequenzen, die höher sind als die gesprochene Stimme. Wir hören in diesen höheren Bereichen auf unterschiedliche Eigenschaften.“

Die menschliche Stimme, die durch Sprechen durch unseren röhrenförmigen Vokaltrakt erzeugt wird, erzeugt charakteristische Frequenzen, die sich stark von Klängen unterscheiden, die durch die Vibration einer flachen Oberfläche wie in einem Lautsprecher erzeugt werden. Dies ist eines der Elemente, die die Anti-Spoofing-KI verwendet, um eine Live-Stimme von einer Aufnahme zu unterscheiden.

„Wir können auch synthetisierte Stimmen erkennen, wie zum Beispiel Text-to-Speech-Anwendungen“, sagte Amein. „Viele davon sind nicht so toll, aber sie werden immer lebensechter. Und in diesem Szenario gibt es immer noch Anomalien im Signal – es ist in einigen Fällen zu perfekt oder es gibt nur Übergänge oder Phasenunterschiede, die das Ohr nicht hören kann, die [KI] jedoch kann.“

Neurale Verarbeitungseinheit

Die SoCs der VS600-Serie von Synaptics verfügen über eine Neural Processing Unit (NPU); Die NPU des VS680 bietet 6,75 TOPS, während der neu angekündigte VS640 1 TOPS bietet und auf "mehr Mainstream-Kosten und Leistung und Leistungspunkte" ausgerichtet ist, sagte Vineet Ganju von Synaptics. Die NPU beider Teile verfügt über „mehr als genug“ Rechenleistung, um die biometrischen Sprachalgorithmen und Anti-Spoofing von ID R&D gleichzeitig auszuführen, sagte er. Die NPU konnte die Sprachbiometrie-Inferenz um den Faktor 10 beschleunigen, verglichen mit der Verwendung der CPU des Chips, deren Auslastung um den Faktor 3 reduziert wurde.

Synaptics bietet ein Toolset, mit dem Unternehmen wie ID R&D ihre Technologien für die NPU optimieren können. ID R&D ist in dieser Hinsicht der erste Partner von Synaptics, das Unternehmen wird jedoch in Zukunft mit weiteren Partnern für Anwendungen außerhalb der Sprachbiometrie zusammenarbeiten.

„Basierend auf unseren Gesprächen mit Spracherkennungsunternehmen können wir tatsächlich eine vollständige Spracherkennungs-Engine für englischsprachiges Vokabular auf dem Gerät erstellen, die innerhalb der 1 TOPS-Fähigkeit der NPU liegt“, sagte Ganju. „So können Sie in Bezug auf die Spracherkennung ein vollständiges Offline-Produkt haben … zum Beispiel bei Produkten, bei denen Benutzer es nicht sofort mit ihrem WLAN verbinden, kann die integrierte Spracherkennung ihnen helfen, bereits vor dem Auspacken eine gute Erfahrung zu machen es ist verbunden.“

Der erste Software-Build von ID R&D wird noch in diesem Monat für die VS600-Entwicklungskits von Synaptics verfügbar sein.

>> Dieser Artikel wurde ursprünglich veröffentlicht am unsere Schwesterseite EE Times.


Internet der Dinge-Technologie

  1. Eine IIoT-Sensor-zu-Cloud-Gateway-Lösung
  2. Differentialgleichungen
  3. Minterm vs. Maxterm-Lösung
  4. pH-Messung
  5. Fertigungsmobilität:Daten, Sprache, Video und Standort
  6. Fragen und Antworten mit einem Industrie-4.0-Lösungsarchitekten
  7. Siemens, Bentley führt Lösung zur Beschleunigung der Anlagendigitalisierung ein
  8. Azima DLI-Lösung zielt auf Programme zur Überwachung des Maschinenzustands ab
  9. Kundenstimme auf CNC-Maschine
  10. HMI-SPS-Integration