Ich habe drüben bei @SZ etwas Kleines zu den Microsoft-Chatbots geschrieben. Ich bin mir noch nicht sicher, ob die Idee einer „conversational UI“ nicht auf die falsche Fährte führt und wir eher eine Vorform dessen erleben, über das ich vor ein paar Monaten unter dem Schlagwort Stream OS gebloggt habe. Aber ich arbeite mich auch gerade erst wieder in die aktuelle Debatte zum Thema ein.
Strategisch halte ich besonders Microsoft, Amazon und Facebook, das auf der F8 sicher einiges zu Bots im Messenger zu erzählen haben wird, für interessant. Alle drei haben kein* mobiles OS, das daraus resultierende Problem ist banal wie fatal: Es gibt keinen Zugriff auf die Systemsteuerung, sprich auf Funktionen und Apps bei Android und iOS.
Alle drei müssen deshalb genau diese Ebene durch eine Art Meta-OS umgehen: Amazon hat mit Echo (inklusive der Assistentin Alexa) dafür eine Hardware entwickelt, die (noch) ihren festen Platz im Wohnzimmer hat und andere Dienste integrieren kann. Facebook baut nach Vorbildern wie WeChat den Messenger zum Hub für (teilweise bis vollständig automatisierte) Mini-Programme aus, dessen Schnittstelle vermutlich vor allem das Web und dessen Funktionen sein dürften (das für Nutzer dann ins Backend verschwindet). Und Microsoft entwickelt einerseits Cortana plattformneutral und gibt andererseits Entwicklern die Werkzeuge, um Chatbots für Software/Firmen/Sensoren zu basteln und sie an Schnittstellen proprietärer Dienste zu platzieren (Slack, Skype etc.), sicherlich auch – oder vor allem – als Köder für Azure.
Ich weiß nicht, ob man das als Evolution bezeichnen kann, denn die Überlegungen dahinter sind fast noch stärker von der Firmenstrategie als von technologischer Entwicklung getrieben. Die Systemzugriffe von Apple und Google sind ein Vorteil, aber kein entscheidender: Wenn – wie von den drei oben genannten Firmen beabsichtigt – das App-Ökosystem an Relevanz verlieren würde, wäre Apple geschwächt; wenn die Datengenerierung über andere Anbieter laufen würden und/oder die Suche/Web-Nutzung mobil hinter Chatbot-Kommunikation verschwindet, hat Google ein Problem (insgesamt erscheint Big Goog aber als Software-Firma besser aufgestellt). Wir werden in den nächsten Monaten sehen, wie die Antworten rund um Siri/Google Now und darüber hinaus aussehen werden.
Zwei Sachen beim Thema Chatbots/Conversational UI scheinen mir noch wichtig:
(1) Es geht IMO nicht so sehr um Text-/Sprach-Eingabe als UI und Navigation, sondern um Automatisierungen im Hintergrund -> die Reduzierung von Klicks/Touch-Eingaben auf ein Minimum (Beispiel: Spracheingabe „Buche einen Flug nach Hamburg am 14.7.“ -> Bot zeigt zwei Reise-Alternativen in Abgleich mit Kalender und Präferenzen an -> ich wähle aus und muss nichts mehr eingeben, weil der Bot auf die nötigen Infos wie Zahlung, Sitzplatz-Präferenz etc. zugreift)
(2) Die „künstliche Intelligenz“ bzw. lernende Maschine wird dann wichtig, wenn es um das Erlernen von Kontext geht. Beispiele: „In welcher Situation befindet sich der Nutzer?“ „Wie verhält er (oder ein Nutzer mit ähnlichen Eigenschaften) sich in der Regel in dieser Situation?“ „Welches Verhaltensmuster kann ich daraus ableiten?“ Auch deshalb ist dieses Feld wichtig – aus der Gesamtheit der gewonnen Verhaltensdaten lässt sich die Software weiterentwickeln (auf der Makro-Ebene, die wiederum auf die Mikro-Ebene wirkt).
Interessant wird, welche Unterscheidungsmerkmale am Ende den Ausschlag für oder gegen ein System geben werden – und ob auch dieser Markt auf ein Monopol oder Duopol hinausläuft.
Weiterführende Lektüre:
Benedict Evans: Chat bots, conversation and AI as an interface
Ben Thompson: Snapchat Follow-up; WeChat, Facebook Messenger, and iMessage; Microsoft’s Bot Parade ($)
Matt Hartman: The Hidden Homescreen
*oder im Falle von MSFT: kein verbreitetes