Maschinelles Sehen und Sprach-Interfaces

„KI ist für mich eine Basistechnologie – vergleichbar mit Strom“

Mensch und Maschine arbeiten immer enger zusammen. Welche Vorteile maschinelles Sehen und Sprach-Interfaces bieten können, erklärt Roger Kehl von Cloudflight.

28.04.2022

Künstliche Intelligenz, natürliche Sprachverarbeitung, Computer Vision: In vielen Bereichen verschwimmen die Grenzen zwischen Mensch und Maschine. Was das konkret für uns bedeutet und warum Künstliche Intel­ligenz auf die Tagesordnung eines jeden Unternehmens gehört, erklärt Roger Kehl, CEO von Cloudflight, einem End-to-End-Service-Anbieter im Bereich der industriellen digitalen Transformation für Produkte, Prozesse und Geschäftsmodelle.

Dr. Roger Kehl

ist seit drei Jahrzehnten in der Technologiebranche tätig. Bevor er zu Cloudflight kam, war er Mitglied des Executive Management Board Central Europe bei Atos und Global CIO bei Festo

Die automatische Verarbeitung von Sprache ist schon jetzt allgegenwärtig. Welche Funktion wird sie in der Zukunft einnehmen?

Roger Kehl: Natural Language Processing nimmt in vielen Business- sowie Consumerbereichen schon jetzt eine wichtige Rolle ein und wird das in Zukunft noch viel stärker tun. Früher haben wir viel über die Tastatur eingegeben, grafische Benutzeroberflächen sind noch immer Alltag. Die Verarbeitung natürlicher Sprache, die jeder schon kennt – sei es im Smart Home oder im Büro, wo viele Informationen in E-Mails oder Dokumenten transportiert werden –, wird sich rasant weiterentwickeln. Denn viele Prozesse lassen sich darüber sehr viel schneller und direkter steuern.

Welche Herausforderungen sehen Sie bei der Ver­arbeitung von Sprache?

Kehl: Sprache ist immer subjektiv und kulturell geprägt. Es gibt viele Arten, sich auszudrücken. Wenn wir zum Beispiel dieses Interview zu Künstlicher Intelligenz führen, gibt es unterschiedlichste Möglichkeiten für mich, dieses Thema zu erklären. Dazu kommt, dass Sprache auch andere Bedeutungen und eine Tonalität, die es zu erfassen gilt, haben kann. Weiterhin steigt die Komplexität durch spezifische Kontextbedingungen und Kontextwissen. Das macht es herausfordernd. Aus diesem Grund legen wir Wert darauf, dass Sprach-Interfaces und -Applikationen dies differenziert erkennen, verarbeiten und dadurch auch einen echten Mehrwert für den Benutzer bieten.

Zum Beispiel?

Kehl: Wenn ich an der Maschine arbeite und dank einer Sprach-Schnittstelle oder einem Natural-Language-Processing-System die Hände frei habe, ist das ein Plus und verbessert gegebenenfalls den Produktionsprozess. Ähnliches gilt im Büro: Wenn etwa Informationen zu einer Bestellung aus einer E-Mail erkannt und automatisch in ein ERP-System überführt werden, spare ich mir die Tipparbeit. Egal wie groß oder klein das Anwendungsgebiet ist, immer muss der Benutzer einen wirklichen Vorteil davon haben. Das beinhaltet auch, dass wir die späteren Anwender in den Prozess miteinbeziehen.

Neben der Verarbeitung von Sprache ist auch das maschinelle Sehen von großer Bedeutung. Was steckt dahinter und wie kann es genutzt werden?

Kehl: Vereinfacht gesagt, wird bei Computer Vision Bildmaterial verarbeitet, um Informationen zu gewinnen. Zunächst einmal sind Bilder und Videos für einen Computer eine Ansammlung von zufälligen Farbpunkten. Beim Einsatz von Computer Vision orientieren wir uns oft an menschlichen Erfahrungen und Bedürfnissen. Den Vorteil von maschinellem Sehen kann man vielleicht an einem Beispiel erklären. Ein Mitarbeiter in der Fertigung kontrolliert eine Charge Kunststoff auf mögliche Fehler, wie zum Beispiel Lufteinschlüsse. Durch seine Erfahrung kann er im Nachhinein zwar fehlerhaftes Material erkennen und aussortieren. Maschinelles Sehen jedoch kann viel eher – gegebenenfalls auch mehrfach im Produktionsprozess – implementiert werden, sodass es gar nicht erst zu einer Fehlproduktion größerer Mengen oder einer gesamten Charge kommen muss. Der Automatisierungsgrad kann gesteigert und die visuelle Qualitätskontrolle verbessert werden. Dazu kommt, dass die Kamera ein Universal-Sensor ist und uns auf Hardware-Seite kaum vor Herausforderungen stellt.

Gibt es weitere Beispiele für Bereiche, in denen sich maschinelles Sehen durchsetzen wird?

Kehl: Ich denke an den Securitybereich oder an Parkraumüberwachung, aber auch an viele andere Dinge unseres täglichen Lebens. Wer wie ich ein Foto­album für seine Tochter erstellen will und dafür aus 30.000 Fotos auswählen muss, kennt das vielleicht. Man beginnt sehr motiviert und verzweifelt fast, weil der Prozess sehr zeitintensiv ist. Computer Vision kann diesen Prozess komplett neu aufrollen. Durch automatische Auswahl und das Layouten von Fotos aufgrund von Inhalt, Belichtung, Schärfe, Zuschnitt und Ästhetik kann ein ansprechendes, fast fertiges Fotobuch vorgeschlagen werden. Als Kunde mache ich nur noch den Feinschliff anhand meiner persön­lichen Präferenzen.

Natural Language Processing und maschinelles Sehen – wie eng fassen Sie Künstliche Intelligenz, und wie sollten sich Unternehmen darauf vorbereiten?

Kehl: KI ist für mich eine Basistechnologie – vergleichbar mit Strom. Zahlreiche Innovationen werden in Zukunft darauf aufbauen. Viele haben sich daher schon mit ihr beschäftigt oder nutzen sie. Jedes Unternehmen sollte in Zukunft zumindest über eine Einordnungskompetenz verfügen, inwieweit KI-basierte Lösungen für das eigene Geschäftsmodell eingesetzt werden können. Dazu gehören eine Potenzial- und Risikoanalyse. Die Resultate sollten der CIO und CEO bewerten können und auch als Bestandteil in die Unternehmensstrategie einfließen lassen.

Alle Themen, über die wir sprechen, haben eines gemeinsam: Sie erfordern einen Umgang mit sehr großen Datenmengen. Ist das die eigentliche Heraus­forderung?

Kehl: Es haben sich eigentlich in den vergangenen Jahren alle technischen Voraussetzungen dafür entwickelt. Auch das Speichern von sehr großen Datenmengen ist kaum mehr ein Thema. Wir arbeiten seit Jahren in der Verarbeitung von Satellitendaten und deren Analyse, und hier sind wir bereits lange in einer Größenordnung von Petabyte unterwegs. Die eigentlichen Herausforderungen sehe ich eher im organisatorischen und rechtlichen Bereich; Stichwort „Data Governance“. Welche Daten dürfen denn wie, wo und von wem verarbeitet werden? Wo müssen die Inte­ressen Einzelner geschützt werden? Das sind eher die Hürden in der weiteren Entwicklung. Diese gilt es zu meistern, um den technologischen Fortschritt zu ermöglichen.

Mensch und Maschine sollen künftig stärker zusammenarbeiten. Wie kann das gelingen, und sehen Sie da eine Verschmelzung?

Kehl: In der Produktion gibt es bereits die Idee der Cobots, also die kollaborative Robotik. In der Praxis sind das Roboter, die nahtlos mit Menschen zusammenarbeiten. Das funktioniert heute bereits. Und wenn wir jetzt einmal an das Metaverse denken, dann wird es sicher so sein, dass weitere Bereiche verschmelzen werden. Wir müssen aber immer anerkennen, dass beide Seiten ihre Stärken haben. Eine Maschine kann strukturierte, abgeschlossene Auf­gaben viel schneller und besser lösen – wenn nötig, rund um die Uhr. Künstliche Intelligenz ist das Werkzeug, um diesen Prozess auf ein neues Level zu heben. Auf der anderen Seite haben wir den Menschen, der Empathie besitzt und aufgrund seiner kognitiven Fähigkeiten flexibel agieren kann.