Sprachsteuerung für Maschinen

Sprachsteuerung für Maschinen

Unser Angebot: Entwicklung eines Systems zur Spracheingabe und Sprachsteuerung von Industriemaschinen

Das Ziel

  • Schaffung einer Möglichkeit, Industriemaschinen, die über eine SPS oder einen IPC gesteuert werden, mittels Sprache zu bedienen. Dazu zählen sowohl die Sprachein- wie auch die -ausgabe.
  • Die Spracheingabe soll hierzu im Zusammenspiel mit herkömmlichen Ein- und Ausgabesystemen,
    insbesondere Touchpanels, realisiert werden. Konkret können Funktionen des Touchpanels ganz oder teilweise durch Sprachein-/ausgabe ergänzt oder ersetzt werden.
  • Folgende Bedürfnisse des Betreibers und/oder Bedieners können befriedigt werden:
    • Komfortgewinn.
    • User Experience auf Niveau von Consumer Electronics = Verbesserung der Akzeptanz.
    • Effizienzsteigerung, weil Wege zum Panel entfallen können.
    • Mehr Flexibilität, weil der Bediener beide Hände parallel zur Bedienung anderweitig verwenden kann (z. B. an einem Handmontageplatz).
    • Mehr Prozesssicherheit durch das berührungslose Auslösen von Befehlen auch bei widrigen oder sensiblen Umgebungsbedingungen.


Unsere Lösung

  • Entwicklung einer kundenspezifischen Lösung auf Basis einer am Markt erhältlichen und bewährten Spracherkennungssoftware.
  • Reine Softwarelösung, die auf der ohnehin notwendigen Maschinensteuerung lauffähig ist; es ist also keine zusätzliche Hardware erforderlich (im Falle offener Systeme).
  • Offline-Lösung; es ist keine permanente Internet­anbindung erforderlich.
  • Befehle und Dialoge sind frei konfigurierbar. Grundsätzlich ist jede Eingabe, die ansonsten über andere Bedienelemente ermöglicht wird, auch über die Spracheingabe realisierbar.
    Analoges gilt für die Ausgabe von Meldungen.
  • Freie Ausgestaltung der Befehle, Rückmeldungen und Dialoge. Die jeweilige Sprachanwendung kann über ein Webtool erstellt werden.
  • Vor der Eingabe eines Sprachbefehles wird das System über ein Wake-Word aktiviert; das Wake Word kann frei gewählt werden.
  • Erkennung von Synonymen durch Hinterlegen in der Sprachanwendung.
  • Extraktion mehrerer Begriffe aus einem Satz, wobei die Reihenfolge keine Rolle spielt.
  • 30 Sprachen verfügbar.
  • Verwendung beliebiger Mikrofone und Laut­sprecher möglich, auch Headsets.
  • Ausblendung/Reduktion von störenden Hintergrundgeräuschen erfolgt über die Mikrofone.
    Auswahl passender Lösungen im Rahmen der Entwicklung auf Basis von Versuchen.
  • Erkennungsrate ca. 90-95%.

Technische Daten & Systemanforderungen

  • Runtime: ca. 6 MByte
  • Sprachmodell: bis 6,3 MByte je Sprache
  • Anwendungsspezifische Sprachressourcen:
    • ca. 10 kByte einfache Kommandosteuerung mit 10 Wörtern
    • ca. 500 kByte umfangreiche Sprachsteuerung mit 1.000 Wörtern
  • Hauptspeicher: ab 16 MByte (je nach Anwendung)
  • Kommunikation mit Maschinensteuerung: MQTT im JSON-Format


Am 17. November 2020 hat die Redaktion von elektrotechnik.de einen Online-Beitrag über dieses Projekt veröffentlicht.

© 2024 MGA Ingenieurdienstleistungen GmbH