Sprachassistent für ZEISS

Sprachassistent für ZEISS

Introduction

In Kooperation mit der Firma ZEISS Industrial Quality Solutions sollte die Aufgabe: „Alexa als Bedienassistent bzw. Wartungsassistent" gelöst werden. Die Aufgabenstellung beinhaltet das Entwerfen einer Sprachsteuerung beziehungsweise einem Sprachassistent, sodass ohne Hände mit einer Zeiss Messmaschine interagiert werden kann. Messvorgänge sollen über Sprachbefehle gestartet werden können. Auch andere Prozesse sollen durch Spracherkennung gesteuert werden können. Sprachassistenz als Feedbacksystem ist eine weitere Aufgabe, die erfüllt werden kann. Hierbei soll die Messmaschine Fehlercodes menschenfreundlich über ein audiovisuelles Interface wiedergeben können.


Die Sprache ist die natürlichste und einfachste Kommunikations- und Umgangsform im Kontakt mit anderen Menschen. Sie wird früh erlernt und gehört zu den wichtigsten Fähigkeiten des Menschen. Die Sprache soll genutzt werden, um auf einem natürlichen und angenehmen Weg mit Maschinen zu kommunizieren ohne vorher schwierige Programme, Programmiersprachen oder Interfaces gelernt zu haben. Sie soll vorhandene Programme unterstützen und erweitern, sowie die Erlernung und Nutzung eben dieser zu vereinfachen. Weitere Ziele sind die Zeitersparnis bei der Nutzung von Maschinen und die Prozessoptimierung, um so eine höhere Effizienz gewährleisten zu können.

Voicecontrol

Ein Voice Interface soll den Maschinenführer bei einfachen Aufgaben unterstützen. So kann er z.B. den Messvorgang von überall starten und muss nicht extra zu dem an der Messmaschine montierten Desktop-PC laufen und mehrere Knöpfe drücken. Weitere Befehle, die in Sprache umgewandelt werden können, ist ein Stopp-Befehl, ein Safespot-Befehl, ein Temperatur-Befehl und ein Messkopf-kalibrieren-Befehl.
Von Vorteil sind diese Prozesse auch, wenn die arbeitende Person volle Hände hat und so den PC nicht bedienen kann, ohne beispielsweise Werkstücke abzulegen.
Außerdem ist der Umgang natürlicher und die Einlernzeit an der Maschine ist für Anfänger nicht so lang.

Wakeword

Bei Nennung des Wake Words ertönt ein akustisches Signal, dann ist die Sprachsteuerung aktiv und empfängt weitere Befehle. Bei unabsichtlichem Aktivieren schaltet sich die Spracherkennung nach einer vordefinierten Zeit ab. Das Wake Word ist der Typ der Maschine, z.B. „Prismo“ + [optionaler Parameter]. Der optionale Parameter kann definiert werden, wenn mehrere Maschinen vom gleichen Typ in unmittelbarer Nähe beispielsweise im gleichen Raum stehen, um eine eindeutige Identifikation zu garantieren. Somit kann es zu keinen Falscheingaben kommen und Komplikationen werden vermieden.

Vorteile eines Wakewords:

  • Kein Bildschirm, Knopf oder anderweitige Aktivierungsmethoden notwendig
  • Einfaches, angenehmes Anwendungserlebnis, nur durch nennen des Wakewords

Nachteile eines Wakewords:

  • Findung mehrerer Wakewords bei vielen Maschinen
  • Nur eine Maschine soll bei Nennung des einzigartigen Wake Words reagieren

Kein Wake Word:

  • Entfremdung des eigentlichen Zwecks, da so immer noch eine physikalische Schnittstelle benötigt wird.

Ziel ist es simple Befehle per Spracherkennung an das Messgerät weiterzuleiten, um so Zeit gegenüber konventionellen Methoden,wie das Calypso-Interface oder manuelle Steuerung mit dem Control Panel, sparen zu können.

Finaler Prototyp

Durch die nun einfachere Bedienbarkeit, aufgrund der Sprachbefehle, lässt sich mit den Maschinen intuitiver arbeiten. Der Vorteil entsteht durch die Sprache, welches die herkömmliche Steuerung über ein Display und Knöpfe unterstützt und teilweise komplett ersetzt. Dies hat zur Folge, dass weniger Handlungsschritte bis zum Ziel benötigt werden. Das System lässt sich so gut integrieren und ist so auch für neue Mitarbeiter schnell und einfach zu erlernen. Dazu kommt, dass der Handlungsablauf deutlich verbessert wird, da die Möglichkeit besteht zur gleichen Zeit verschiedene Aufgaben zu erledigen. Trotz voller Hände lässt sich die Messmaschine bedienen und erspart einem anfallende Wartezeiten. Auch Laufwege fallen so größtenteils weg, da das Wechseln zwischen den verschiedenen Bedienelementen bei grundlegenden Handlungen weg fällt.