Gastbeitrag

Digitalisierung

Wie KI die Zukunft von Videokonferenzen gestaltet

Egal, ob es um die Automatisierung von Prozessen oder um die Optimierung der Kommunikation geht: Künstliche Intelligenz gewinnt in der Arbeitswelt immer mehr an Bedeutung. Auch für hybride Arbeitsmodelle eröffnet der Einsatz von KI neue Möglichkeiten, die Produktivität zu steigern, die Effizienz zu verbessern und die Zusammenarbeit über verschiedene Standorte hinweg zu erleichtern. Insbesondere Videokonferenzen können durch fortschrittliche KI-Kameratechnologien grundlegend verbessert werden, um bessere Wege der Interaktion und Kooperation zu schaffen.

Eine Frau sitzt am Schreibtisch vor einem Laptop und ist Teil von Videokonferenzen

20.08.2024

Moderne Arbeitsmodelle brauchen moderne Technologien

Mittlerweile ist es dank moderner Technologien und flexibler Arbeitsmodelle möglich, von fast überall aus produktiv zu arbeiten und nahtlos zu kommunizieren. Doch damit Remote- und Hybridarbeit auch wirklich problemlos funktionieren, brauchen Unternehmen eine effiziente und immersive Meetingtechnologie, die alle Mitarbeitenden gleich gut miteinander verbindet – unabhängig davon, wo sie sich gerade befinden.

Die Herausforderung: Oftmals beeinträchtigen eine schlechte Video- und Tonqualität, starre Kameras und die dadurch entstehende unzureichende Einbeziehung aller vor Ort Anwesenden die Kommunikation. Für Mitarbeitende, die nicht im Büro sind, ist es oft schwieriger, alle vom Büro aus am Meeting teilnehmenden Kolleg:innen zu sehen und der Unterhaltung komplett zu folgen. Genau an dieser Stelle kommt KI ins Spiel: So können beispielsweise 360-Grad-Videokameras, eine effektivere und integrativere Zusammenarbeit in einer hybriden Arbeitsumgebung fördern und wichtige nonverbale Signale auch in virtuellen Umgebungen sichtbar machen.

Silent Switching: KI als Schlüssel für ein immersives Meeting-Erlebnis

360-Grad-Videkameras gehören zu den effektivsten Möglichkeiten, remote Teilnehmende optimal in das Meeting-Gefüge zu integrieren. Über das sogenannte Silent Switching, also dem leisen Umschalten, fokussieren moderne Kameras dieser Art automatisch die Person, die gerade spricht. Zudem erkennt die Technologie, wohin die im Meeting anwesenden Personen schauen, auch wenn sie nicht sprechen, und schaltet dann nahtlos zur richtigen Kamera mit der besten Sicht um.

Um die richtigen Personen in Bezug auf Geräusche und Bewegungen zu priorisieren, nutzt die für das Silent Switching verantwortliche Gerätesoftware proprietäre Künstliche Intelligenz. Die dafür trainierten Algorithmen analysieren kontinuierlich Audio- und Videodaten, um Muster zu erkennen und basierend darauf Entscheidungen zu treffen. Wenn Menschen durcheinanderreden oder mehrere Bewegungen im Raum gleichzeitig stattfinden, priorisiert die KI die lauteste Stimme oder die Person, die am häufigsten angesprochen wird. Dabei hilft ihr die Fähigkeit, unterschiedliche Tonquellen und visuelle Signale zu differenzieren und effektiv zu gewichten, um ein möglichst optimales und kohärentes Meeting-Erlebnis zu gewährleisten.

Insbesondere in einem typischen Besprechungsszenario kann das System so sehr gut arbeiten. Aber Achtung: Wenn zwei Gruppen von Personen in einem Raum getrennte Gespräche führen, kann das die Technologie verwirren. Um die Erkennung und Fokussierung durch die KI zu erleichtern, sollten Besprechungsräume daher so gestaltet sein, dass getrennte Gespräche auch immer räumlich voneinander abgegrenzt sind.

Inklusion durch diskriminierungsfreie Technologie

Um eine gleichberechtigte und effektive Kommunikation zu gewährleisten, muss die Videokonferenztechnologie jedoch nicht nur für die remote Teilnehmenden reibungslos funktionieren. Auch die korrekte und diskriminierungsfreie Fokussierung der physisch anwesenden Menschen ist von entscheidender Bedeutung, damit sichergestellt wird, dass alle Teilnehmenden richtig erkannt und in das Meetinggeschehen einbezogen werden.

Damit dies gelingt werden die Systeme von 360-Grad-Videokameras mit maschinellen Lernmodellen angereichert, die mithilfe visueller Bilder diverser Gesichts- und Körperformen trainiert wurden. Diese Modelle sind darauf ausgelegt, Personen unabhängig von Hautfarbe oder Beleuchtung zu registrieren. Durch die Nutzung dieser Modelle und ständige Tests wird sichergestellt, dass Personen nur wahrgenommen und nicht persönlich identifizierbar erfasst werden, um Datenschutz und Nichtdiskriminierung zu gewährleisten. Bei schwierigen Lichtverhältnissen unterstützt zudem eine audiobasierte Erkennung die visuelle Identifikation.

Zusätzliche Geräte desselben Ökosystems – wie beispielsweise eine Frontkamera, ergänzende Mikrofone oder ein digitales Whiteboard – helfen dabei, weitere audiovisuelle Daten des Meetinggeschehens über ein privates Netzwerk zusammenzuführen. Das führt zu einer noch präziseren Erfassung und Darstellung der Meetingsituation, indem alle relevanten Audio- und Videoquellen harmonisch integriert und analysiert werden.

Mit intelligenter Meeting-Technologie in die Zukunft

Mit der zunehmenden Akzeptanz von Remote- und Hybridarbeit, gewinnt die Notwendigkeit gut funktionierender Meeting-Technologie immer mehr an Bedeutung. Die Integration von KI in eben jene Videokonferenztechnologie, ermöglicht es Unternehmen schon jetzt ihre Kommunikation und Zusammenarbeit hinsichtlich der sich wandelnden Arbeitsmodelle weiter zu optimieren. Wer seinen Mitarbeitenden ein optimales Meeting-Erlebnis bieten will, sollte also in Betracht ziehen, in Silent-Switching-fähige Geräte zu investieren.

Aber auch die Technologie selbst wird sich in den kommenden Jahren weiterentwickeln und dabei vor allem von Modellen für maschinelles Lernen abhängig sein. Denn die für das Training der KI verwendeten Modelle sind oft noch sehr teuer. Kostengünstigere Lösungen können zwar bis zu einem gewissen Grad funktionieren, bergen jedoch vor allem hinsichtlich eines kohärenten Meeting-Erlebnisses die Gefahr von Qualitätseinbußen. Daher sollten Unternehmen bei der Auswahl ihrer Meeting-Technologie sorgfältig abwägen und sich nicht ausschließlich von den Kosten leiten lassen. Eine Investition in hochwertige KI-gestützte Lösungen zahlt sich langfristig aus. Denn sie erhöhen nicht nur die Effizienz und Produktivität der Mitarbeitenden, sondern verbessern auch die Qualität der Kommunikation.

Jeff Wilen

ist Chief Product Officer bei Owl Labs, dem führenden Anbieter von 360-Videokonferenzen. Zuvor war Wilen in leitenden Positionen bei Catapult Sports, CarGurus, Wayfair und den Cleveland Guardians tätig. Er ist weiterhin als Investor, Mentor und Vorstandsberater bei TechStars, MassChallenge und Harvard Innovation Labs für Unternehmen in der Frühphase tätig