All posts by Sascha Wolter

About Sascha Wolter

Developer, Trainer, and Speaker with Passion for Innovation, User Experience (i.e. Voice), and the Internet of Things in all flavors.

Buchtipp: Künstliche Intelligenz – Wie sie funktioniert und wann sie scheitert

Wer auf der Suche nach einem Buch ist, dass die Funktionsweise und Grenzen von heutiger künstlicher Intelligenz (KI) anschaulich darstellt, der sollte einen Blick in das unterhaltsame Buch von Janelle Shane werfen. Die zahlreichen Beispiele haben mir sofort dabei geholfen, die Möglichkeiten von KI und maschinellem Lernen im Gespräch mit Kunden und Kollegen anschaulich zu beschreiben. Zumal man kein Programmierer sein muss, um sie zu verstehen.

Das Lesen des Buches war teils unterhaltsam, teils aber auch zäh. Die Beispiele ähneln sich doch oft und zumindest ich hätte mir an der einen oder anderen Stelle dann ein wenig mehr Tiefgang gewünscht. Das eine eher technische Kapitel zu den unterschiedlichen KI-Arten bietet hier leider auch nur einen sehr groben Überblick.

Der Übersetzer hat hervorragende Arbeit geleistet, was das Eindeutschen der Beispiele angeht und dort sogar sprachliche und kulturelle Eigenheiten erklärt. Doch der Lesefluss gefiel mir persönlich im englischen Original besser.

Alles in allem haben mir die vielen Beispiele im Buch gut gefallen und mir noch einmal auf anschauliche Art und Weise die Chancen und Risiken von künstlicher Intelligenz ins Bewusstsein gerufen. Genau das verspricht das Buch und dieses Versprechen hält es auch ein. Dabei räumt die Autorin glücklicherweise mit den teils kruden Vorstellungen von KI auf und macht das Buch so zum Geschenktipp für Kunden und Kollegen mit unrealistischen Vorstellungen rund um KI. Wer jedoch mehr zur Funktionsweise von KI erfahren möchte, der wird vermutlich eher enttäuscht werden.

Wer sich vor dem Kauf einen Eindruck von den Inhalten machen möchte, der kann auch die hervorragende Website der Autorin Janelle Shane unter https://www.aiweirdness.com/ besuchen. Dort gibt es viele weitere anschauliche Praxisbeispiele rund um KI und maschinelles Lernen…

„Künstliche Intelligenz – Wie sie funktioniert und wann sie scheitert“
Autor: Janelle Shane
Preis: ca. Euro 23,-
ISBN: 3960091605
Erscheinungsdatum: O’Reilly, 1. Juli 2021
Link:  Amazon

When in Rome, the world’s first voice-augmented board game.

Last night, I played When in Rome, the world’s first voice-augmented board game for Amazon Alexa. Voice Originals did a great job. The box is of high quality and the companion Alexa Skill is well developed. So, if you would like to have an entertaining evening with an Alexa guided board game, it’s a great choice.

When in Rome, the world’s first voice-augmented board game.
When in Rome, the world’s first voice-augmented board game.

The game starts nicely, as there is no need to read a manual: Alexa explains everything and guides you thought the game. It feels like playing an interactive adventure, but with gaming features. The story itself is well produced with lots of variety, different voices and background music. The game questions are also interesting and fun, but unfortunately the storyboard was not terribly engaging, and therefore the narration sometimes felt a little tedious.

One of our conclusions from playing the game, is that Alexa is not a very good storyteller or gamemaster. Common voice-assistants simply lack the dynamics and struggle to improvise. No complaints here, as we understand that this is simply a technical limitation. For instance, you always have to say “Alexa, do this or that” to interact. After shouting “Alexa” dozens of times, it did start getting annoying. Because of that repetition, I even accidentally called my son “Alexa” which was quite embarrassing and disrupted the flow of the game.

If you just want to play the best Alexa Skill of its class, it’s definitely worth a try, but if you prefer unstructured chatting with friends while playing a game, it does fall short. Due the current technical limitations, we don’t consider this one a ground-breaking concept. But we look forward to seeing more releases from Voice Originals…

Heuristiken für Sprach-Assistenten und Chatbots neu aufgegriffen 2/10

Im ersten Teil der Serie über das Gelingen von Conversational AIs – also von Benutzungsschnittstellen auf Basis von Sprach-Assistenten und Chatbots – haben wir uns mit der ersten Heuristik „Sichtbarkeit des Systemstatus“ der Nielsen Heuristiken beschäftigt. Im zweiten Teil geht es nun um die Bedeutung der Heuristik „Übereinstimmung zwischen System und Wirklichkeit (Match between system and the real world)“ für Conversational AIs.

Übereinstimmung zwischen System und Wirklichkeit

Konversation in textbasierter Form oder als gesprochene Sprache suggeriert dem Nutzer Natürlichkeit. Gerade deshalb muss eine Conversational AI die Sprache des Benutzers sprechen, in einer Form, mit der der Benutzer vertraut ist und nicht mit ungewöhnlichen Begriffen und Satzkonstruktionen. Sprich: Verwenden Sie ein einfaches bzw. der Zielgruppe angepasstes Vokabular und vermeiden Sie systemorientierte und technische Begriffe. Auch erscheinen ein hoher Detailgrad und viele Feinheiten schnell formell und distanziert. Eine schlichte und einfache Sprache ist für Menschen mit unterschiedlichem Hintergrund zugänglicher.

Dies beschränkt sich jedoch nicht nur auf die Ausgabe, sondern umfasst auch die Eingabe. Benutzer sprechen mit einer Vielzahl von Dialekten und Akzenten. Deshalb sollte unbedingt mit verschiedenen Akzenten getestet werden. Dies umfasst bei textbasierten Systemen auch den Umgang mit gängigen Rechtschreib- und Tippfehlern. Die richtige Auswahl von Schlüsselwörtern und Synonymen stellt sicher, dass Befehle korrekt interpretiert werden (es gibt beispielsweise mehr als hundert Synonyme und Phrasen für Regen im Englischen). Nutzer formulieren ihre Absichten (Intents) in einer Konversation sehr unterschiedlich: Manche bevorzugen Befehlssätze („Bring mir ein Bier“), andere Fragesätze („Kannst du mir ein Bier bringen“) und wieder andere Appellsätze („Jetzt ein Bier wäre schön“). Und das sind nur einige Aussagen (Utterances) mit denen ein Bot trainiert werden muss. Nur so können die Benutzer bequem mit der Sprachschnittstelle interagieren.

Informationen sollten außerdem in natürlicher und logischer Reihenfolge erfragt bzw. dargestellt werden (z. B. Startzeit vor Endzeit). Dies kann aber im Einzelfall je nach Nutzer gerade auch bei der Eingabe variieren und muss dementsprechend flexibel gehandhabt werden: Gibt der Nutzer z. B. erst die Farbe oder zuerst die Größe an? Bei der Datenerfassung sollten auch bekannte Aspekte nicht erneut erfragt, sondern aus dem Kontext, dem Nutzerprofil und anderen verfügbaren Datenquelle erschlossen werden. Und so wie in der natürlichen Konversation die Sender sich in Wort und Schrift auf vielfältige Weise an den jeweiligen Empfänger anpassen, sollte dies auch ein Sprachassistent oder Chatbot machen. Zum Beispiel kann die Detailstufe durch Anpassung an den Wissensstand variiert werden. Außerdem sollte der Konversationsfluss nicht zwingend einen Pfad vorgeben, sondern sich am Benutzer orientieren.

Variiere Sie Inhalte so wie es eine Person tun würde. Bestätigungen sollten zum Beispiel nicht immer gleich, sondern mit einer Vielzahl an Alternativen wie „Ja“, „Okay“, „Klar“, „Roger“, „Oki Doki“, „Sicher“ usw. erfolgen. Denn anders als bei einem visuellen Design für die Augen wirken solche festen Muster für die Ohren schnell langweilig, ermüdend und unnatürlich.

Bedenken Sie außerdem, dass sich Sprachassistenten und textbasierte Chatbots durchaus unterscheiden. Ein Satz kann geschrieben gut wirken, für die gesprochene Unterhaltung möglicherweise aber ungeeignet sein.