Sprachsteuerung für Maschinen
Unser Angebot: Entwicklung eines Systems zur Spracheingabe und Sprachsteuerung von Industriemaschinen
Das Ziel
- Schaffung einer Möglichkeit, Industriemaschinen, die über eine SPS oder einen IPC gesteuert werden, mittels Sprache zu bedienen. Dazu zählen sowohl die Sprachein- wie auch die -ausgabe.
- Die Spracheingabe soll hierzu im Zusammenspiel mit herkömmlichen Ein- und Ausgabesystemen,
insbesondere Touchpanels, realisiert werden. Konkret können Funktionen des Touchpanels ganz oder teilweise durch Sprachein-/ausgabe ergänzt oder ersetzt werden. - Folgende Bedürfnisse des Betreibers und/oder Bedieners können befriedigt werden:
- Komfortgewinn.
- User Experience auf Niveau von Consumer Electronics = Verbesserung der Akzeptanz.
- Effizienzsteigerung, weil Wege zum Panel entfallen können.
- Mehr Flexibilität, weil der Bediener beide Hände parallel zur Bedienung anderweitig verwenden kann (z. B. an einem Handmontageplatz).
- Mehr Prozesssicherheit durch das berührungslose Auslösen von Befehlen auch bei widrigen oder sensiblen Umgebungsbedingungen.
Unsere Lösung
- Entwicklung einer kundenspezifischen Lösung auf Basis einer am Markt erhältlichen und bewährten Spracherkennungssoftware.
- Reine Softwarelösung, die auf der ohnehin notwendigen Maschinensteuerung lauffähig ist; es ist also keine zusätzliche Hardware erforderlich (im Falle offener Systeme).
- Offline-Lösung; es ist keine permanente Internetanbindung erforderlich.
- Befehle und Dialoge sind frei konfigurierbar. Grundsätzlich ist jede Eingabe, die ansonsten über andere Bedienelemente ermöglicht wird, auch über die Spracheingabe realisierbar.
Analoges gilt für die Ausgabe von Meldungen. - Freie Ausgestaltung der Befehle, Rückmeldungen und Dialoge. Die jeweilige Sprachanwendung kann über ein Webtool erstellt werden.
- Vor der Eingabe eines Sprachbefehles wird das System über ein Wake-Word aktiviert; das Wake Word kann frei gewählt werden.
- Erkennung von Synonymen durch Hinterlegen in der Sprachanwendung.
- Extraktion mehrerer Begriffe aus einem Satz, wobei die Reihenfolge keine Rolle spielt.
- 30 Sprachen verfügbar.
- Verwendung beliebiger Mikrofone und Lautsprecher möglich, auch Headsets.
- Ausblendung/Reduktion von störenden Hintergrundgeräuschen erfolgt über die Mikrofone.
Auswahl passender Lösungen im Rahmen der Entwicklung auf Basis von Versuchen. - Erkennungsrate ca. 90-95%.
Technische Daten & Systemanforderungen
- Runtime: ca. 6 MByte
- Sprachmodell: bis 6,3 MByte je Sprache
- Anwendungsspezifische Sprachressourcen:
• ca. 10 kByte einfache Kommandosteuerung mit 10 Wörtern
• ca. 500 kByte umfangreiche Sprachsteuerung mit 1.000 Wörtern - Hauptspeicher: ab 16 MByte (je nach Anwendung)
- Kommunikation mit Maschinensteuerung: MQTT im JSON-Format
Am 17. November 2020 hat die Redaktion von elektrotechnik.de einen Online-Beitrag über dieses Projekt veröffentlicht.