Siri, was liegt an?

Das iPhone 4S ist da und mit ihm auch Siri.
Siri ist eigentlich eine Software um das iPhone per Sprache zu steuern. Nein, eigentlich falsch, man steuert das iPhone nicht, denn Siri kann keine beliebigen Anwendungen starten. Siri ist also eher eine Software um Routineaufgaben im Sprachdialog zu erledigen.

Da diese Software so programmiert wurde, dass sie auch über eine gut verständliche Sprachausgabe verfügt, bekommt das iPhone direkt so etwas wie eine Persönlichkeit. Man spricht nicht mit seinem iPhone, man redet mit Siri. Die Entwickler haben dabei durchaus viel Liebe zum Detail gezeigt und lassen Siri auf gleiche Fragen nicht immer identische Antworten geben – also Inhaltlich schon aber die Formulierungen unterscheiden sich doch. Auch auf lustige oder ungewöhnliche Fragen reagiert Siri teils erstaunlich.

Wie Siri im Detail funktioniert kann ich nicht sagen. Das Prinzip ist aber folgendes:

mehr nach dem Klick

  • Man stellt Siri eine Frage oder gibt „Ihr“ eine Aufgabe. Dazu hält man entweder den unteren Knopf etwas länger gedrückt oder tippt ihn nur einmal kurz an und hält das iPhone dann ans Ohr.
  • Das iPhone speichert das gesprochene, bereitet es auf und komprimiert es und lädt es dann ins Internet. Das bedeutet auch: Bei schlechter Datenverbindung ist das Gespräch eher zäh, bei fehlender Datenverbindung geht es gar nicht.
  • Die Server bei Apple analysieren die Aufzeichnung, erkennen die gesprochenen Worte, erkennen den Kontext und die Satzbauteile und schicken in einem Datenbank entsprechende Kommandos und Antwort-Texte zurück auf das Gerät, wo Siri diese dann wiedergeben kann.

Das Prinzip erlaubt es Apple, das System immer weiter auszubauen – Und das ist auch dringend erforderlich.

Bei meinen ersten Tests und auch richtigen Anwendungen war ich schon wirklich erstaunt, wie gut Siri funktioniert. Die Grenzen liegen da eher auf der technischen Seite.

Schwierigkeiten mit englischen Namen

Man kann sich z. B. Musik abspielen lassen und ein „Spiele Musik von Herbert Grönemeyer“ funktioniert gut. Möchte man aber etwas von Peter Gabriel hören, so sollte man nicht „Pieter Gäibriäl“ sagen sondern wirklich ein deutsches „Peter Gahbriehl“. Musik von „Fury in the Slaughterhouse“ war mir nicht möglich zu starten genauso wenig wie „Xavier Naidoo“. „U2“, also „Ju Tu“ funktionierte dagegen hervorragend und ich musste nicht „Uh Zwei“ sagen.

Es steht und fällt also mit dem Vokabular der jeweiligen Sprache. Apple muss seiner Siri-Datenbank beibringen, dass auch deutsche Anwender die Künstlernamen englisch aussprechen, wenn es sich um englischsprachige Künstler oder Namen handelt. Gleiches gilt natürlich für die Songtitel.

Schwierigkeiten mit Namen

Auch mit Namen generell tut sich Siri oft schwer. So wurde „Amelia“ nicht erkannt und stattdessen ein zufälliges Wort-Kauderwelsch geschrieben. „Birte“ wird bei mir konstant als „Dörte“ erkannt. Auch hier gilt, was für die Künstler-Namen geschrieben wurde: Die Siri-Datenbank muss noch dazu lernen. Es müssen viel mehr Namen hinterlegt werden und Apple sollte hinterlegen, dass auch in Deutschland ausländische Namen genutzt werden.

Ganz so trivial wird es bei Tiernamen natürlich nicht. Möchte man jemandem schreiben, dass „Die Weide, auf der Rain steht, wieder saftig“ ist, so muss natürlich zum einem erkannt werden, dass man „Rain“ gesagt hat und auch, dass man in der deutschen Sprache damit natürlich keinen Regen meinte sondern es ein Name sein muss.

Keine Karten, Keine Wissensdatenbank

In den USA kann Siri neben Wetter, SMS, Mail, Kalender aber noch mehr, nämlich z. B. Routen berechnen oder herausfinden, wie viel Milliliter zwei Tassen sind, wo das nächste italienische Restaurant ist und so weiter. Das Hintergrundwissen kommt dabei von Wolfram Alpha. Die Routen von Google-Maps.

In Deutschland funktioniert das nicht. Die Einschränkungen sind aber recht leicht erklärbar, denke ich:

  • Routen: Um per Sprache eine Route zu planen, müssten ja erst einmal alle Ortsbezeichnungen als Sprachcode auf den Server hinterlegt sein, in deutscher Aussprache natürlich. Hier gilt ja prinzipiell das gleiche Problem, was Siri auch beim diktieren von Namen hat. Der Sprachstamm muss also erst einmal aufgebaut werden.
  • Restaurants und andere „Points of Interest“: Ich vermute, dass diese ebenfalls über die Google-Maps kommen, bin mir da aber nicht 100%ig sicher. Nachtrag: Siri nutzt Yelp als Restaurantführer. Es müsste also ein deutsches Restaurant-Verzeichnis angebunden werden. Wenn dem so ist, dann müsste der deutsche Sprachstamm für alle diese Dinge aufgebaut werden und entsprechende Verknüpfungen hinterlegt werden. Also „Ich würde gerne Spaghetti essen“, soll ja zu ital. Restaurants führen. Natürlich muss die Datenbank erst einmal erklärt bekommen, dass Spaghetti ein italienisches Gericht sind. Gleiches gilt für Döner, Gyros, Hamburger aber auch Wopper für andere Lokalitäten.
  • Wolfam Alpha gibt es seit knapp 2,5 Jahren. Seine Anfragen kann man auf der Webseite in Textform eintragen – in englisch. Solange diese Datenbank also nur mit englischen Wörtern und deren Grammatik/Semantik klar kommt, so lange wird auch Siri daran nichts ändern können.

Einiges funktioniert gut, wenn man Siri auf dem iPhone einfach auf englisch umstellt. Man kann dann probieren, ob die eigene englische Aussprache eher amerikanisch, britisch oder australisch ist. Die Routen funktionieren aber trotzdem nicht weil die deutschen Ortschaften vermutlich auch in englischer Aussprache noch nicht in der Siri-Datenbank stecken.

Fazit

Das Potential ist aber auch deutscher Sprache zu sehen und eine kurze Erinnerung ist per Sprache tatsächlich oft schneller angelegt als getippt – auch wenn nur EDGE zur Verfügung steht. Auch im Auto, bei langsamer Fahrt ausprobiert, konnte ich mir SMS vorlesen lassen und darauf antworten – ohne das Gerät zu berühren, vom einmaligen Druck auf den Knopf abgesehen. Namen, von denen man schon vermutet, dass Siri sie nicht kennt, kann man zur Not einfach buchstabieren. Das funktioniert auch mitten in einem Satz, also zum Beispiel: „Die Weide von Er Ah Ih Enn ist schön grün“ führt erwartungsgemäß zu „Die Weide von RAIN ist schön grün“. Während man buchstabiert kann man auch „Leerzeichen“ ansagen. „Punkt“, „Komma“ funktioniert ebenfalls.

Apple hat Siri als „Beta“ betitelt. Das lässt hoffen, dass nicht nur weitere Sprachen sondern weitere Inhalte der Sprachen eingepflegt werden und zukünftig auch Namen und ausländische Künstler in deutscher Sprache erkannt werden. Vielleicht kann man ja auch bald per Sprache twittern smile

Nachtrag: Routen und Lokalitäten sollen 2012 folgen

0 Kommentare zu “Siri, was liegt an?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.