2020 – Das Jahr „1“ der KI

Im Jahr 2020 sind im Bereich der Künstlichen Intelligenz eine Serie von Game-Changern relativ leise auf die Bühne getreten und nun da.

In Summe werden diese Game-Changer zukünftig maßgeblich gestaltenden – manche auch disruptiven – Einfluss auf verschiedene Bereiche ausüben:

  • Unser Kommunikationsverhalten
  • Produktion und Einsatz von Fake-News
  • Modellierung und Verprobung von wissenschaftlichen Modellen
  • Robotics
  • Entertainment

Wissenschaftlich liegt die Wurzel im Jahr 1943 im Neuronenmodell von Warren McCulloch und Walter Pitts. Wir befinden uns also im Jahr 77 der KI.

Es ist für mich aber das Jahr 1, weil die notwendige Implementierungszeit zur Umsetzung einer Idee auf inzwischen unter 1 Jahr reduziert ist. Das liegt an den inzwischen von den Cloud-Providern angebotenen und einfach buchbaren Services.

Dann sind da die vielen Jobangebote für KI-Kompetenzen wie Data-Scientists. Damit wächst das Breitenknowhow und kommerziell wie gesellschaftlich relevante Anwendungen entstehen nun fortlaufend.

Aber, macht Euch selber ein Bild dazu.

Einen guten Rutsch ins Jahr 2021 wünschen wir Euch!
Michael + Mahmoud

Die KI-Game-Changer 2020

Kommunikation 1: Casablanca.ai von Carsten Kraus

Haben wir uns nicht schon oft gewünscht, dass uns bei den vielen Videokonferenzen die Gesprächspartner in die Augen blicken, wenn Sie etwas vom Bildschirm ablesen. Immer diese gesenkten oder seitwärtsgerichteten Blicke sind schon irritierend, oder? Carsten Kraus hat eine KI-basierte Lösung für die dynamische Videobildkorrektur patentiert, die die Augenposition des Gegenübers sehr gefällig korrigiert. Es ist irritierend gut.

Hier die Website: https://www.casablanca.ai/

Kommunikation 3: Audio Deepfakes

Was sind Audio Deepfakes? Das sind von einer, mit der Stimme einer individuellen Person trainierten, KI vorgelesene Texte. Wobei sich nicht unterscheiden lässt, ob die KI den Text spricht oder die für das Trainings eingesetzte Person. Der Trainingsaufwand beträgt dabei gerade mal ca. 30 Minuten. Das Training selber besteht lediglich darin, einen vorgegebenen Text laut vorzulesen. Aktuell gibt es bereits mehrere Anbieter solcher Lösungen; natürlich in unterschiedlicher Qualität und erstmal überwiegend nur in Englisch.

An Deepfakes im Bereich Foto und Video haben wir uns quasi schon gewöhnt, aber im Bereich Audio? Dazu muss man wissen, dass das Ohr – im Vergleich zum Auge bei Bildinformationen – eine viel höhere Sensibilität hat, um bei bekannten Stimmen Original von Fälschung zu unterscheiden.

Die vorstellbaren positiven und leider auch negativen Einsatzmöglichkeiten sind äußerst vielfältig.

Robotics 1: Solving Rubik’s Cube with a Robot

Ist das nicht eine Aufgabe, da der wir uns alle mehr oder minder erfolgreich versucht haben?

Wissenschaft: 3D-Modellierung von Proteinen von Dr. Simon Olsson and Dr. Frank Noé

Die 3D-Modellierung von Biomolekülen ist kritisch zur Vorhersage der Funktionsweise eines Proteins. Leider wächst der Modellierungsaufwand exponentiell mit der Größe des Biomoleküls. Mit Hilfe von KI-Verfahren ist es den Forschern gelungen dieses Skalierungsproblem zu umgehen.

Entertainment: Google’s Blob Opera

Und zum Abschluss: einfach ein Riesenspaß für Alle, die schon immer eine Oper schreiben und singen wollten, denen aber vielleicht nicht alle notwendigen Talente dafür gegeben sind;-) Ich habe es deshalb libretto mal mit der Blob Opera eingespielt: