Persona Design für Sprachportale / Dialog Design

Die zwei Seiten der Erkennung

See Menschen neigen dazu, in dem Stil zu antworten, in dem sie angesprochen werden. Je salopper die Persona des Dialogsystems daherkommt, desto ungezwunger werden die Nutzer antworten. Das ist zunächst einmal nichts schlechtes. Denn die Sprach-Erkenner wurden auf natürliche Aussagen trainiert - ihre Erkennungsleistung ist also am höchsten, wenn der Nutzer normal spricht.

Doch die Spracherkennung ist nur die eine Seite der Input-Verarbeitung. Die andere ist die Grammatik. Dort ist alles hinterlegt, was der Dialog Designer als Eingabe des Nutzers erwartet. Der Sprach-Erkenner erkennt nur das, was in der Grammatik steht - und zwar umso besser, je kleiner die Grammatik ist.

Das Nadelöhr beim Nutzer-Dialog ist also nicht die reine Spracherkennung (also die Umwandlung von Schallwellen in einen digitalen Output), sondern die Größe der Grammatik. Wenn also ein Dialog-System einen Nutzer nicht versteht, kann das immer zwei Ursachen haben: Die Eingabe wurde nicht erkannt, oder sie ist nicht in der Grammatik enthalten.

Dazu ein Beispiel: Ein Nutzer soll seine Automarke nennen. In der Grammatik steht unter anderem “Mercedes Benz”, nicht aber “Daimler Benz” (das hat der Autor schlicht vergessen). Die Eingabe “Daimler Benz” kann also prinzipiell nicht verarbeitet werden.

Nutzer reagieren darauf gerne, indem sie mit dem Dialogsystem reden wie mit ihrem schwerhörigen Opa - laut und abgehackt. Was meistens wenig hilfreich ist. Denn wenn das Problem bei der Erkennung liegt, wird die Erkennungsleistung durch künstlich deutliches Sprechen eher schlechter als besser - im Gegensatz zum Großvater. Und wenn die Eingabe nicht in der Grammatik enthalten ist, ist es ohnehin egal, wie deutlich der Nutzer spricht.

Um das zu vermeiden, sind viele Dialogsysteme so gestaltet, dass dem Nutzer die Antwortmöglichkeiten (“Bitte antworten Sie Audi, BMW, Mercedes Benz...”) vorgegeben werden ("Mixed Initiative Dialog") und so der mögliche Input begrenzt wird. Das widerspricht allerdings dem Anspruch, einen Dialog möglichst natürlich klingen zu lassen, denn ein Mensch würde so nicht sprechen. Walter Rolandi meint dazu: “Persona Design ist wichtig, aber Effizienz ist wichtiger.”4

<<

>>