Persönliche Assistenten für Roboter allgegenwärtig machen
Ich habe vor kurzem den MWC Shanghai besucht. Roboter waren groß – sehr groß. Ich sah Dutzende von Unternehmen, die nach Kunden suchten, um sie in einer von vielen Anwendungen zu präsentieren und anzubieten. Nehmen Sie nur eine Beispielanwendung – Tug, die Roboterkrankenschwester. Dies sieht unserem Science-Fiction-Image von Robotern nicht sehr ähnlich, es sei denn, Sie denken an einige der eher zweckmäßigen Beispiele in Star Wars. Es ist eine Kiste auf Rädern, aber sie hat viele der Funktionen, die wir von mobilen Robotern erwarten, einschließlich Navigation und Hindernisvermeidung. Es kann durch ein Krankenhaus navigieren, es stoppt, wenn jemand davorsteht, und es steuert um einen verirrten IV-Stand; es kann auch einen Aufzug rufen, um in eine andere Etage zu gelangen.
Der Zweck von Tug besteht darin, Patienten Medikamente und Lebensmittel zu liefern, und es wird bereits in 37 VA-Krankenhäusern in den USA eingesetzt. Stellen Sie sich die Arbeitsbelastung vor, die vielbeschäftigten Candy-Stripers von den Schultern nimmt. Es gibt zahlreiche andere Assistenzanwendungen in der Altenpflege, in der Lehrunterstützung, in Restaurants und Hotels. Betrachten Sie dies als das nächste große Ding bei persönlichen Assistenten nach intelligenten Lautsprechern (Amazon hat bereits mehr als 100.000 Roboter in seinen Lagerhäusern, also arbeiten sie offensichtlich an Heimrobotern als Fortsetzung des Echo). Dies ist keine Science-Fiction; Home Assistant-Roboter werden heute ausgeliefert.
Roboter-Gesundheitsassistent (Quelle:CEVA/Shutterstock)
Es gibt offensichtliche technische Herausforderungen bei der Herstellung dieser Art von Robotern, die den Problemen des autonomen Fahrens nicht unähnlich sind, obwohl es einige klare Unterschiede gibt. Navigation und Hindernisvermeidung sind üblich, aber Konzepte für freie Fahrspuren und Verkehrsmanagement gelten für diese Roboter nicht; es geht um Hindernisvermeidung und Navigation innerhalb eines Gebäudes (mit Neuzuordnung, um temporäre unbewegliche Hindernisse zu umgehen). Und während eine Schnittstelle in natürlicher Sprache in einem Auto ein nettes Accessoire sein kann, kann sie für Roboterassistenten unerlässlich sein. Wer will schon lernen, Knöpfe zu drücken, wenn die Apotheke die falschen Medikamente geschickt hat oder das Restaurant deine Bestellung vermasselt hat?
Gartner hat kürzlich eine Top-10-Liste der KI- und Sensoranforderungen für Roboter erstellt, darunter:
Computer Vision – Szenenanalyse, Objekterkennung usw.
Biometrische Erkennung und Authentifizierung – wer spricht mit mir und dürfen diese Befehle erteilen
Eine Dialogschnittstelle – Spracherkennung und natürliche Sprachverarbeitung
akustische Szenerieanalyse – Erkennung von markanten Geräuschen wie Hundegebell oder Glasbruch
Standorterkennung – wo bin ich und was/wer ist in meiner Nähe
Autonome Bewegung – Möglichkeit, sich zu einem Ziel an anderer Stelle im Gebäude zu bewegen, ohne mit Objekten oder Personen zu kollidieren
KI-Funktionen im Roboter – nicht nur Cloudabhängig
Der Standardansatz zum Erstellen von Systemen mit diesen Fähigkeiten beginnt heute mit dem Einbau eines KI-Systems in den Roboter, das auf einer Multicore-GPU-Plattform basiert. Dies ist verständlich – Produkthersteller können eine Lösung mit einer handelsüblichen Plattform prototypisieren, ohne sich um ASIC-Details kümmern zu müssen, ähnlich wie sie ein CPU-Entwicklungsboard für traditionellere Anwendungen verwenden würden. Aber wenn das Produktvolumen steigt oder Sie es vorantreiben, werden Kosten und Kundenzufriedenheit / Differenzierung immer wichtiger. Standardlösungen sind teuer, energiehungrig und es ist schwer zu unterscheiden, wenn Sie dieselbe Plattform wie alle anderen verwenden. Aus diesem Grund wenden sich unweigerlich großvolumige Lösungen an ASIC-Plattformen. Sie müssen nicht alle Investitionen aufgeben, die Sie in Ihren Prototyp gesteckt haben; eine kostengünstigere GPU-Plattform könnte Teil der Lösung bleiben, aber ein erhebliches Maß an KI-Funktionalität kann auf eine viel kostengünstigere und stärker integrierte Plattform ausgelagert werden.
Die Vorteile der Leistung pro Watt von DSPs gegenüber GPUs in Anwendungen des maschinellen Lernens (ML) sind bekannt, teilweise aufgrund von Festkomma- gegenüber Gleitkomma-Operationen und der Flexibilität bei der Quantisierung in einigen Plattformen. Und die Preisvorteile (im Volumen) von Sonderlösungen sind bekannt. Aus diesem Grund sehen Sie in volumen-/preissensitiven ML-Anwendungen eher einen eingebetteten DSP am Edge als eine Standard-GPU.
Aber können Sie alles tun, was Sie in der GPU tun können? Es stellt sich heraus, dass Sie ziemlich viel tun können. Nehmen wir Computer Vision – zum Beispiel Positionierung, Tracking, Objekterkennung und Gestenerkennung. Diese Ebene der Bildverarbeitung ist bereits heute in einigen eingebetteten DSP-basierten Plattformen verfügbar. Oder nehmen Sie die autonome Bewegung, die lokale Umschulungen unterstützt (ohne in die Cloud gehen zu müssen). Auch hier sind die Kernerkennungsfunktionen zur Unterstützung dieser Intelligenz, die gleichen Funktionen, die Sie auch auf einer GPU finden würden, auf einem DSP verfügbar.
Spracherkennung/Authentifizierung und akustische Szenenanalyse können ebenfalls ausgelagert werden. Diese (zusammen mit den anderen Beispielen hier) verdeutlichen, warum das Auslagern so sinnvoll ist. Jede dieser intelligenten Operationen gliedert sich in mehrere Schritte, beispielsweise von der Sprachaufnahme und Richtungsauflösung bis hin zur vielleicht grundlegenden Worterkennung und schließlich sogar zur natürlichen Sprachverarbeitung (NLP). Der letzte Schritt ist eine Herausforderung und erfordert möglicherweise einen Wechsel in die Cloud. Aber die Schritte davor lassen sich in einer Embedded-Lösung sehr komfortabel handhaben. Bei einigen Anwendungen, bei denen nur ein begrenztes Vokabular erkannt werden muss oder Sie nonverbale Hinweise wie einen Fensterbruch erkennen möchten, benötigen Sie möglicherweise überhaupt keine Cloud (oder eine lokale GPU). Es gibt bereits Hinweise, dass in naher Zukunft sogar eingeschränktes NLP am Edge unterstützt werden könnte.
Zur Unterstützung dieser Frontend-Funktionen mit KI am Edge, in der Frontend-Sprachverarbeitung und im Deep Learning im IoT ist ein umfangreiches Lösungsangebot entstanden. Mit diesen Lösungen können Entwickler aufkommende Herausforderungen leichter angehen, wenn es darum geht, Roboter-Assistenten allgegenwärtig zu machen.
Moshe Sheier ist Director of Strategic Marketing, CEVA, wo er die Unternehmensentwicklung und strategische Partnerschaften für CEVAs Kernzielmärkte und zukünftige Wachstumsbereiche überwacht. Moshe arbeitet mit führenden SW- und IP-Unternehmen zusammen, um innovative DSP-basierte Lösungen auf den Markt zu bringen. In seiner Freizeit fährt Moshe Mountainbike und übt Aikido.
Internet der Dinge-Technologie
- Ist meine Fabrik bereit für einen Roboter?
- Industrieroboter
- Gantry-Roboteranwendungen
- Industrieroboter in der Automobilindustrie
- Die 10 besten Hersteller von SCARA-Robotern
- Arduino Spider Robot (vierfach)
- Handgeführte Roboter
- 5 Ws von Roboterhelfern im Gesundheitswesen
- Heres eine Idee:Krankenhausroboter
- Roboter intelligenter und sicherer machen