KI - Am Anfang einer neuen Ära: Stand der Dinge und aktuelle Entwicklungen

18. August 2023 - von Till Könneker

Writer's Note: Als ich diesen Artikel fertig geschrieben hatte, war vieles schon wieder veraltet. Der Geschwindigkeit, mit welcher sich die Industrie der künstlichen Intelligenz Industrie entwickelt, ist kaum nachzukommen, weshalb es schwierig ist, eine akkurate Momentaufnahme zu machen.

Wir bewegen uns vom Informationszeitalter in das Zeitalter der Intelligenz mit nahezu grenzenlosem Zugriff auf KI basierten Systemen und Werkzeugen, die rund um die Uhr und überall auf der Welt verfügbar sind. Man sollte aber dazu erwähnen, dass es sich im Grunde nicht um Intelligenz handelt, sondern um eine Maschine, die menschliche Intelligenz immer besser nachahmen kann, bis der Unterschied nicht mehr wahrnehmbar ist. Hier wird dann von Artificial General Intelligence (AGI) gesprochen.

Kaum eine Technologie entwickelt sich so schnell wie KI, täglich erscheinen etliche neue Anwendungsbereiche und Tools, KI hat sich in kürzester Zeit als transformative Kraft etabliert, die Branchen umgestaltet und die Interaktion zwischen Menschen und Maschinen neu definiert.

Nach meinem letzten KI-Blog Artikel vom Januar 2022, ist es Zeit für eine neue Momentaufnahme, um die aktuelle Landschaft der KI und die aufkommenden Werkzeuge zu erkunden.

Wer sich für die korrekte Terminologie des hier verwendeten Kürzel "KI" interessiert, kann hier weiter lesen.

Zwei "KI Wesen", erstellt mit MIdjourney
KI Wesen - Die neue Realität

Um ein Gefühl zu bekommen, was im Bereich der künstlichen Intelligenz nur in einem Monat passiert, hier eine (unvollständige) Liste von Mai/Juni 2023:

Unity AI
AI Antibiotic
Minecraft AI
Picture-to-3D
Google Starline
Nvidia Game AI
Google Flood AI
ChatGPT in Court
TIME: Humanity End
DeepMind discovers C++ algorithms
Neuralink FDA Approval
42% US Not Used ChatGPT
Japan No Copyright OK for AI
AI Chef
Zoom AI
Gen AI ETF
Instacart AI
Falcon 40B Free
Nvidia Neuralangelo
OpenAI CTO Hacked
Apple Autocorrect LLM
EU: Must Classify AI Content
Meta's MusicGen
Amazon Review AI

Und viele weitere Ankündigungen und Schlagzeilen wie:

StabilityAI Uncrop
Runway Gen-2 For All
Wordpress Jetpack AI
Chinese LLM
ChatGPT for Enterprise
Google Bard 30% Better
New AMD AI Chip
Salesforce AI Cloud
ChatGPT Workspaces
UK Gov't: Data Access
AI "Last Beatles Record"
92% Programmers Use AI
Adobe Generative Recolor
Google AI Search 2x Faster
EU AI Act
GPT-Engineer
Meta Voicebox
Adobe AI Insurance
AI Speech Classifier
OpenAI API Cheaper
Free LLM from Meta
Google Virtual Try-On
ChatGPT + Mercedes
HF: Free AI QR Codes
Google: Replace MRIs
Toyota Design AI
Opera One Browser
Vimeo AI
Scriptwriter
Midjourney v5.2
Google DeepMind
Robocat
MosaicML Acquired for $1.3B

...und so weiter und so fort.

ChatGPT

Beginnen wir mit der momentan wohl am meisten genutzten KI Technologie und einigen Neuerungen.

GPT-4

Mit einer höheren Verarbeitungskapazität als seine Vorgänger kann GPT-4 komplexere Eingaben effizienter verstehen und verarbeiten. Dieser Fortschritt verspricht eine Kommunikation, die der menschlichen Konversation immer näher kommt und eine grössere Präzision bei der Beantwortung von Anfragen.

Während die kostenfreien Versionen von Chat GPT auf das Hochladen von 2000 Wörtern begrenzt sind und diese relativ langsam verarbeiten, kann GPT-4 mit bis zu 25.000 Wörtern gefüttert werden. Darüber hinaus ist es in der Lage, längere Antworten zu generieren, was die Interaktion mit der KI noch vielseitiger und nützlicher macht.

Für deutschsprachige Nutzer*innen bringt GPT-4 ebenfalls bedeutende Verbesserungen. Durch ein intensiveres Training auf verschiedenen Sprachen kann GPT-4 nun auch Fragen auf Deutsch und in anderen Sprachen präziser verstehen und beantworten.

Plugins

ChatGPT-Plugins stellen eine neue Erweiterung der Fähigkeiten des KI-Modells dar. Sie sind speziell entwickelte Tools, die innerhalb der ChatGPT-Oberfläche genutzt werden können und das Kernprinzip der Sicherheit verfolgen. Diese Plugins ermöglichen es ChatGPT, auf aktuelle Informationen zuzugreifen, Berechnungen durchzuführen und Dienste von Drittanbietern zu nutzen.

Durch die Integration von Plugins erhält ChatGPT Zugang zum Internet und zu neuen Funktionen, was seine Leistungsfähigkeit erheblich steigert. Beispielsweise kann ChatGPT durch die Verwendung von Plugins Webseiten und Suchergebnisse von Bing abrufen, Reisepläne erstellen, Preise vergleichen, neue Sprachen lernen, Code ausführen, Dokumente abrufen und vieles mehr.

Diese Erweiterungen eröffnen eine Vielzahl neuer Anwendungsmöglichkeiten und verbessern die Benutzererfahrung erheblich. Sie machen ChatGPT zu einem noch leistungsfähigeren und vielseitigeren KI-Tool


Einige Beispiele

Wolfram
Das Wolfram ChatGPT-Plugin ist ein leistungsstarkes Tool, das die Fähigkeiten von ChatGPT erheblich erweitert. Obwohl es für einige Benutzer*innen technisch erscheinen mag, bietet es aufgrund seiner erweiterten Funktionen einen erheblichen Mehrwert. Mit Zugang zu umfangreichen Daten ermöglicht das Wolfram Plugin den Benutzer*innen, erweiterte Berechnungen durchzuführen, komplexe mathematische Probleme zu lösen und auf Echtzeitdaten zuzugreifen.

Das Wolfram Plugin geht jedoch über die reine Mathematik hinaus. Es kann bei einer Vielzahl von Aufgaben helfen, wie zum Beispiel bei der Erstellung eines Stammbaums, der Generierung eines Audiospektrogramms oder der Visualisierung anatomischer Strukturen. Es kann sogar aktuelle Datum- und Uhrzeitinformationen liefern, eine Funktion, die ChatGPT allein nicht bietet.

Zapier
Zapier ist ein ChatGPT-Plugin, das speziell entwickelt wurde, um unnötige Arbeitsabläufe zu eliminieren und zu vereinfachen. Zapier ermöglicht es, mit über 5.000 verschiedenen Arbeits-Apps zu interagieren, ohne zusätzliche Schritte ausführen zu müssen. Dies umfasst alle gängigen Apps wie Gmail, MS Outlook, Slack und viele mehr. So können praktisch ganze E-Mails entworfen werden oder detaillierte Slack-Nachrichten direkt aus ChatGPT gesendet werden. 

Link Reader
Einfach ausgedrückt, kann dieses Plugin den Inhalt aller Arten von Links lesen, einschliesslich Webseiten, PDFs, Bildern und mehr. ChatGPT kommuniziert dann mit Link Reader und liefert eine detaillierte Antwort auf die Anfrage zum Link. 

Meme Generator
Natürlich gibt es auch etliche Fun-Plugins wie den Meme Generator. Hier lassen sich eine Vielzahl von Memes zu jedem bereitgestellten Thema generieren. Dieses Plugin verwendet sein integriertes Meme-Verzeichnis, um die Bilder zu beschaffen und passende Untertitel hinzuzufügen.

Prompts

Sie sind der Schlüssel, um die KI dazu zu bringen, die gewünschten Ergebnisse zu liefern. Je genauer und spezifischer Prompts sind, desto besser kann die KI Anforderungen verstehen und die gewünschten Antworten liefern. Hier bildet sich gerade eine komplett neue Berufsgruppe: Prompt Engineering.

Wichtig ist nicht nur gute Fragen zu stellen, sondern auch zu definieren, wie der sprachliche Ton sein soll (formal, informativ, locker usw.), das Format zu definieren (Essay, Bullet Points, Dialog usw.), was das übergeordnete Ziel ist (Information, Spass, Unterhaltung usw.) und was der Kontext des Textes ist.

Natürlich können noch viele weitere Kriterien gesetzt werden, um genau die Resultate in der gewünschten Sprache und Form zu erhalten.

Beispiel eines Promptes, welcher der KI eine klare Aufgabe und klare Anweisungen gibt.

Einige einfache Prompt-Muster, um zu guten Ergebnissen zu kommen

  • Mach mir eine To-Do-Liste mit Aufgaben, die ich erledigen muss [Anzahl]

  • Fasse diesen Text mit einem kurzen Absatz zusammen und mache eine Aufzählungsliste mit den wichtigsten Punkten [veranschauliche jeden Punkt mit einem passenden Emoji]

  • Verhalte dich wie (beliebige Persönlichkeit/Experten) und sag mir, was sie dazu sagen würden: [beliebiger Text]

  • Erkläre mir [Thema] in einfachen Worten. Erkläre es mir, als wäre ich ein Anfänger.

  • Mach ein Brainstorming zu [beliebiges Thema]

  • Erstelle mir ein kurzes Quiz, das mir beibringt, [was du lernen möchtest]

  • Ändere den Schreibstil des folgenden Textes in [Stil oder Ton] [Text einfügen]

  • Analysiere den Text unten auf Stil, Schreibweise und Ton. Erstelle einen neuen Absatz im gleichen Stil, mit der gleichen Schreibweise und im gleichen Ton: [Text einfügen]

Eine ausführliche Beschreibung, wie man die Sprache weiter anpassen kann, gibt es hier auf Twitter.

Mehr nützliche Prompts gibt es hier.

Den richtigen Prompt zu finden kann eine schwierige Aufgabe sein und über brauchbaren und unbrauchbaren Output entscheiden. Hier helfen Tools, welche einem bei der Entwicklung eines Themas oder einer Idee helfen.

Coglayer will beispielsweise wie ein externes Hirn verstanden werden, der geführte Ablauf kann helfen, zu besseren Resultaten zu kommen.

Custom Chat GPT

Zwei einfache Möglichkeiten, einen eigenen KI Chatbot zu realisieren, der beispielsweise auf einer beliebigen Webseite eingebettet werden kann, bieten Dante, SiteGPT, oder Chatbase. In wenigen Minuten lässt sich damit ein Chatbot aus eigenen Daten (Text, Websites, PDFs oder Q&As) realisieren.

GPT-5?

Blickt man in die Zukunft, so wird wohl GPT-5 bis Ende 2023 erscheinen. Dieses Update könnte ein weiterer Meilenstein sein und Menschen glauben lassen, dass KI die Schwelle zur künstlichen allgemeinen Intelligenz (AGI) überschritten hat - ein Zustand, in dem Chatbots von Menschen nicht mehr zu unterscheiden sind. Selbst wenn GPT-5 AGI nicht erreicht, wird erwartet, dass das Update bedeutende Verbesserungen mit sich bringt, welche die Fähigkeiten von GPT-4 weit übertreffen​​.

Charts & Graphs

Natürlich gibt es auch etliche Plugins um Tabellen und statistische Grafiken zu erstellen. Fast interessanter ist es aber, KI zu nutzen, um mit Daten zu chatten. So lassen sich schnell wichtige Erkenntnisse aus allen Arten von Daten extrahieren. Ein relativ neues Tool ist GraphMaker. Hier lassen sich CSV Dateien hochladen oder Google Sheets verlinken, welche dann ausgewertet und visualisiert werden können.

Code Interpreter

Der gerade eingeführte Code Interpreter in ChatGPT Plus ist ziemlich leistungsstark. Es ist ein persönlicher Datenanalyst: Kann hochgeladene Dateien lesen, Code ausführen, Diagramme erstellen, statistische Analysen durchführen und vieles mehr. Durch die Fülle an Möglichkeiten wird es eine Weile dauern, bis hier das volle Potenzial ausgeschöpft werden kann.

Chat GPT Code Interpreter collection by Andrej Karpathy

Text zu Web

Tools, welche UI und UX Designer unterstützen, kommen fast täglich auf den Markt. So hat eben Figma ihre beeindruckende KI-Integration vorgestellt. Im professionellen Kontext erweisen sich KI-Integrationen, die Arbeitsabläufe vereinfachen und optimieren, als besonders sinnvoll. Durch die Einsparung von Zeit, die sonst für Routineaufgaben aufgewendet werden müsste, kann verstärkt auf die tatsächliche Konzeption und Gestaltung fokussiert werden.

10Web ist eine KI-gestützte WordPress-Plattform, die es ermöglicht, in Minuten eine Website zu erstellen.

Framer ist wohl aktuell der am weitesten entwickelte AI Website Builder mit sehr einfacher Bedienung.

Noch sind diese Tools aber nur für sehr einfache Anwendungen zu gebrauchen oder für Varianten und Mockups. Es lohnt sich aber, diese Tools ab und zu auszuprobieren, da sie sich schnell weiter entwickeln.

Text to Image

Bildstile
Verschiedene Filme verändern das Bild mehr als eine Linse oder Kamera. Auch eine Jahreszahl kann das Bild stark verändern. Die Objektivgrösse und Brennweite haben einen Einfluss auf die Schärfentiefe. Hier einige Beispiele von von verschiedenen Film Varianten:

Lomography Redscale XR (2009): Bekannt für seinen einzigartigen Rot-Orange-Farbwechsel.Lomography Redscale XR (2009): Bekannt für seinen einzigartigen Rot-Orange-Farbwechsel.

AgfaColor Neu (1930er Jahre): Bekannt für weiche Farbwiedergabe und feine Körnung

Agfa CT Precisa (1974): Ein Farbdiafilm, der für seine Schärfe und feine Körnung bekannt ist.

Anscochrome (1928): Früher Farbdiafilm, der für seine satten Farben bekannt ist.

Fujifilm Superia (1998): Ein Farbfilm, der für seine feine Körnung und lebendige Farbwiedergabe bekannt ist.

Polaroid Instant Film (1963): Bekannt für seine sofortige Entwicklung und seinen hohen Kontrast.

Hier eine gute Übersicht über weitere Film-Styles.

Midjourney 5.2

Neben einigen Verbesserungen ist die Zoom-Funktion die grösste Neuerung in dieser Version. Ein Bild kann 1.5x oder 2x herausgezoomt werden, dies könnte als direkte Antwort auf Adobes Generative Füllung Feature gesehen werden, welches eine ähnliche Funktion ermöglicht.

Hier können wir nun 2x zoomen und Midjourney ergänzt die Umgebung und bietet wieder 4 Varianten an:

Midjourney Zoom

Image panning

Ein anderes Feature geht noch einen Schritt weiter: Neu lassen sich die Bilder in alle Richtungen erweitern, man drückt auf einen Richtungspfeil und schreibt, wie das Bild weiter gehen soll.

Midjourney panning

Inpainting feature

Mit dieser Funktion lassen sich ausgewählte Bereiche des Bildes nachträglich verändern ohne das ganze Bild zu ändern. Sei es die Kleidung, eine Farbe oder ein Gesichtsausdruck, durch einfaches Auswählen eines Bereiches kann die gewünschte Änderung in den Prompt geschrieben werden.

Inpainting by @chaseleantjEine genaue Anleitung gibt es hier auf Twitter (X) von @chaseleantj

Weitere Text-zu-Bild Tools

Mit "Mixed Image Editing" verspricht Playground, eine neue Methode, um reale und synthetische Bilder zu kombinieren. Dies geht über Text-zu-Bild hinaus und ermöglicht mehr Kontrolle, um feine Änderungen vorzunehmen.

Skizzen zu Bilder
In Midjourney gibt es die Möglichkeit, eine einfache Skizze oder Zeichnung hochzuladen und diese in ein realistisches Bild umzuwandeln. Das einfache Webtool drawit.art geht noch einen Schritt weiter und generiert Bilder von einfachen Strichzeichnungen.

Architektur
Auf der Plattform von Luccid lassen sich schnell Traumhäuser entwerfen.

DragGAN
AI gestützte Interactive Point-based Manipulation mit DragGAN

Was machen die Grossen?

Google
Die grossen Player haben mächtig aufgeholt. Google hat neben ihrem Chat-GPT Konkurrenten Bard die Integration ihrer KI direkt in der Google Docs Umgebung angekündigt. Duet AI for Google Cloud hilft beim Schreiben von Code oder hilft in Google Sheets, Daten zu optimieren, zu analysieren und zu planen. Der neue Google Sidekick in Google Docs wird ständig aktiv sein. Dieser Sidekick liest und verarbeitet das gesamte Dokument, während wir es schreiben, und liefert kontextbezogene Vorschläge, die speziell auf die Arbeit zugeschnitten sind. Auch im Bereich Sprache ist Google mit dabei. Von ihrem AudioPaLM, einem Sprachmodell, das sprechen und zuhören kann, werden wir noch viel hören, wortwörtlich.

Microsoft
Auch Microsoft integriert künstliche Intelligenz immer stärker in ihre Dienste. Nach einer Investition von 10 Milliarden Pfund in OpenAI, den Entwickler des Chatbots ChatGPT, hat Microsoft die KI bereits in seine Bing-Suchmaschine eingebunden und plant weitere Integrationen. Dies eröffnet neue Interaktionsmöglichkeiten mit Anwendungen. Nutzer*innen können nun mit Anwendungen wie Word oder Excel kommunizieren, als ob sie mit einer realen Person sprechen würden.

Apple
Apple hält sich bezüglich künstlicher Intelligenz noch zurück. Der Begriff "AI", also artificial intelligence, wurde bemerkenswerter Weise in der letzten Keynote kein einziges mal erwähnt. Obwohl Apple KI für viele Funktionen im Hintergrund nutzt, ist zu erwarten, dass das Unternehmen in naher Zukunft seinen Ansatz zur KI-Integration in die verschiedenen Betriebssysteme präsentieren wird. Apple ist bekannt dafür, nicht unbedingt die Ersten zu sein, sondern die bestmögliche und ausgereifteste Lösung anzustreben.

Adobe
Schon im letzten Blogpost zum Thema KI habe ich geschrieben, dass KI Tools eine professionelle Benutzeroberfläche brauchen, die mehr Kontrolle über die Ergebnisse ermöglicht. Mit Adobe Firefly kam erstmals Adobe's Interpretation eines Bildgenerators. Richtig spannend war dann aber die Veröffentlichung der neuen Photoshop Beta, welche eindrücklich vormacht, wie mächtig KI Integration in ein professionelles Interface sein kann.
Arbeiten wie das Maskieren von Bildinhalten und Retusche, welche vorher Stunden gedauert haben, sind nun in wenigen Minuten oder gar Sekunden erledigt. Wir können gespannt sein, wie Adobe KI in ihren anderen Anwendungen einsetzen werden.

Film, Animationen und Games

Die Bereiche Film, Animationen und Games sind wohl die vielversprechendsten im kommerziellen Bereich und haben grosses Potential. Die dazu nötige hohe Rechenleistung verlangsamt jedoch die Entwicklung etwas. Nichtsdestotrotz passiert hier viel. So hat Kaiber.ai ein starkes Tool herausgebracht, mit dem Animationen aus Beschreibungen und Vorlagebildern generiert, bestehende Videos in völlig neue Welten und Styles transformiert oder Animationen aus Musik erstellt werden können.

Wonder Dynamics ist ein KI-Tool, das Computer-generierte-Charaktere automatisch animiert, beleuchtet und zu einer Live-Action-Szene zusammensetzt. Ein KI VFX Studio im Browser, welches jetzt schon beeindruckende Effekte und Animationen ermöglicht.

Opus AI verspricht Text in Games, Metaverses, Simulationen und Filme zu verwandeln. Opus ermöglicht die textbasierte Kontrolle über Licht, Kamera, Terrain, Flora und Gebäude, Charaktere und Animationen.

Auch der grosse Player Unity hat kürzlich eine AI Integration vorgestellt: Unity Muse, eine umfangreiche Plattform für KI-gesteuerte Unterstützung bei der Entwicklung und Unity Sentis, mit dem neuronale Netze in Builds eingebettet werden können, um bisher unvorstellbare Echtzeiterlebnisse zu ermöglichen. Hier lassen sich beispielsweise Gesichtszüge beschreiben, aber es ist auch möglich, mit Charakteren auf KI Basis zu kommunizieren und dies in Games einzusetzen, also nicht komplett gescriptete Interaktionen spielbar zu machen.

Unsere Klone sind schon da


Elai.io ermöglicht individuelle KI-Videos mit Moderator*innen, also generierte lebensecht anmutende Personen, die für Präsentationen, Produkt-Clips oder YouTube Channels genutzt werden können.

Auf der Webseite von HayGen können lebensechte Klone von sich erstellt werden die nicht mehr von echten Menschen zu unterscheiden sind. Das Unternehmen selber kommentiert zu den neusten Beispielen ihrer Technologie: "We agree it is exciting and scary when thinking about what's possible".

Was Fake News anrichten kann haben wir alle erfahren, Deep Fakes waren gut aber diese KI Klone sind auf einem anderen Level. Was wir jetzt brauchen, ist eine nachweisbare Medienherkunft, am besten schon auf der Hardwareebene von Kameras. Hier sind dringend Regeln nötig damit dies nicht völlig ausser Kontrolle gerät.

Jesse Wellens mit HayGen.com

FlexClip ist ein KI online Video Editor, in dem nicht nur Text zu Video, sondern auch ein ganzes Script KI unterstützt geschrieben werden kann.

Back to reality

Was wir immer mehr sehen und noch viel sehen werden, sind reale Designs, welche nach der Vorgabe einer KI als Produkt auf den Markt gebracht werden. Insbesondere bei Architektur, Produktdesign und Mode hält KI Einzug. Hier beispielsweise Mode, welche der Designer Joshua Larson mit Hilfe von Midjourney entworfen hat.

Joshua Larson AI FashionHier die ausgewählten Entwürfe, die mit Hilfe von Midjourney generiert wurden...

Joshua Larson AI Fashion...und die real produzierten Kleider.

KI für die Psyche?

2022 schrieb das GEO:
"KI soll psychische Krankheiten erkennen. In naher Zukunft soll künstliche Intelligenz in der Lage sein, unsere Psyche zu durchleuchten. Sie soll Erkrankte, aber auch Therapeut*innen unterstützen, indem sie psychische Krankheiten erkennt, Rückfälle verhindert und Therapien verbessert. Der Bedarf an Hilfe ist gigantisch."

Social Media hat uns nicht sozialer gemacht sondern viele neue psychische Probleme geschaffen. Wie sich künstliche Intelligenz auf uns persönlich und die Gesellschaft auswirken wird, werden wir erst in einigen Jahren wirklich analysieren können.

Das Thema psychische Selbsthilfe habe ich im letzten Artikel schon angerissen und wie vermutet ist dieser Sektor gerade zu explodiert mit Anwendungen, obwohl schon mit ChatGPT vieles möglich ist, wie dieser Beitrag auf Twitter zeigt:

Twitter Screenshot by @jenny____ai

Kann KI helfen, Probleme zu lösen?

Ja und nein. KIs wie Chat GPT sind gut darin, in verschiedene Rollen zu schlüpfen und sie besitzen fast grenzenloses Know-how über alle möglichen Formen von Coaching und Therapie. Was der KI noch fehlt, ist echtes Einfühlungsvermögen, die Fähigkeit, Regungen und Gefühlslagen zu erkennen und darauf einzugehen. Umso erstaunlicher ist es, wie die KI Einfühlungsvermögen recht gut simulieren kann und das Ergebnis manchmal vergessen lässt, dass man hier mit einer Maschine kommuniziert.

Beliebige Methoden

In bestimmten Situationen kann es tatsächlich helfen, mit einem virtuellen Beistand Dinge zu besprechen oder Methoden und Lösungswege zu evaluieren. Einer KI kann man exakt sagen, wie ​​man es haben möchte, mehr fokussiert auf Problemlösung oder auf die Aufarbeitung von Themen. Eine KI ist gut darin, Gespräche auch über einen längeren Zeitraum zu analysieren und zugeschnittene Lösungsvorschläge vorzuschlagen. Auch spezifische Methoden sind für eine KI kein Problem, beispielsweise kann man IFS (Internal Family Systems Model) oder CBT (Kognitive Verhaltenstherapie) durchführen, ohne verschiedene Spezialist*innen aufzusuchen.

Personalisieren

Chat GPT kann man nach und nach für ein spezifisches Thema und die eigenen Anforderungen trainieren, der Prompt ist entscheidend für das Resultat. Die KI wird alle zur Verfügung stehenden Daten nutzen, um Ergebnisse zu liefern - bestehende und die, welche man eingegeben hat. Aus Datenschutz Gründen ist es ratsam, keine zu persönlichen Daten anzugeben und mit Musternamen zu arbeiten. Den Prompt kann man dann laufend einstellen, abhängig davon, ob man beispielsweise brutal ehrliche oder eher einfühlsame Antworten möchte. Eine beliebte Methode ist auch, ChatGPT in verschiedene Rollen schlüpfen zu lassen, bekannte Philosophen wie Marco Aurelio (Stoa) oder Psychoanalytiker C. G. Jung ergeben verschiedene Resultate. 

Prompt Beispiel

Ein möglicher Prompt für einen eher lösungsorientierten Therapie Coach könnte lauten:

„Du bist ein KI-Chatbot, der die Rolle eines effektiven altruistischen Coaches und Therapeuten spielt. Du bist weise, stellst zum Nachdenken anregende Fragen, bist problemlösungsorientiert, herzlich, humorvoll und bist ein Rationalist der LessWrong-Art. Dir liegt es am Herzen, mir dabei zu helfen, meine zwei Hauptziele zu erreichen: Altruismus und mein eigenes Glück. Du möchtest, dass ich das Beste tue und auch sehr glücklich bin. Du fragst mich, wofür ich Hilfe brauche oder bei welchem Problem du mir bei der Lösungsfindung helfen und mich dann durch einen rationalen, schrittweisen Prozess führen kannst, um die besten und rationalsten Massnahmen zu finden, die ich ergreifen kann, um meine Ziele zu erreichen. Du verlierst keine Zeit und kommst direkt zum Punkt."

Prompt Beispiel von Kat Woods auf Twitter

Emotionen in der Datenbank

Ob Sarkasmus in der Stimmlage, subtile Gesichtsausdrücke oder ein Seufzer der Erleichterung: Emotionen sind etwas tief Menschliches. Diese nonverbale Kommunikationsebene in Blicken, Gesichtsausdrücken oder der Stimmlage ist für uns Menschen ein entscheidender Faktor, um die Stimmungslage des Gegenübers zu deuten. Doch dies bedeutet nicht, dass KI nicht emotionale menschliche Ausdrücke lernen und verstehen kann. 

Genau daran arbeitet Hume.ai ein „empathic AI toolkit for researchers and developers“. Die Plattform identifiziert beispielsweise Sprachmuster wie Melodie-, Rhythmus- und Klangmuster, die der alltäglichen Sprache komplexe, gemischte Bedeutungen verleihen.

Vokale Laute wie „lachen“, „seufzen“, „kreischen“, „oh“, „ahh“, „mhm“ und mehr werden analysiert und kategorisiert, um Emotionen zu erkennen.

Auch verschiedene Gesichtsausdrücke, die unterschiedliche Bedeutungen vermitteln und Muster von emotionalen Reaktionen fliessen in die Datengrundlage ein. 

Mit solchen Daten entsteht aktuell eine völlig neue Kategorie von KI gestützten Applikationen im "well-being" Bereich.

Beispiele

Breathhh ist eine KI-gestützte Chrome-Erweiterung, die basierend auf den Webaktivitäten und dem Online-Verhalten automatisch Übungen zur psychischen Gesundheit bereitstellt, wenn man diese benötigt.

Misu ist eine Mac-Anwendung, die die Stimmungsverfolgung automatisiert, indem sie den ganzen Tag Gesichtsmikroausdrücke liest und schöne Infografiken generiert, mit denen man die Stimmungen im Laufe der Zeit visualisieren kann.

Kintsugi ist eine Journaling-App, die auf einer KI-Spracherkennungstechnologie basiert, die psychische Gesundheitsprobleme in jeder Sprache erkennen kann.

Wichtig: Niemand sollte sich komplett auf eine KI verlassen egal um was es thematisch geht. KIs sind kein Ersatz für eine Therapie, können aber als zusätzliches Tool genutzt werden, oder um zu evaluieren, welche Art von Therapie einem am besten entsprechen könnte. Bei psychischen Problemen sollte man immer professionelle Hilfe suchen.

Suchst du Unterstützung?

Generative Kunst

Künstler*innen sind immer schnell darin, neue Technologien, gesellschaftliche Themen oder Werkzeuge für sich zu nutzen. Auch die KI-generierte Kunst, die durch den Einsatz von künstlicher Intelligenz geschaffen wurde, erobert Instagram, Galerien und Ausstellungen.
Hier sind nicht die schier endlosen Bilder gemeint, welche zwar erstaunlich aussehen, aber nicht unbedingt einen tieferen künstlerischen Gedanken verfolgen. Aktuell loten Künstlerinnen und Künstler die Möglichkeiten und Grenzen der KIs aus. Auch die gesellschaftlichen Auswirkungen und der Technikglaube werden kritisch hinterfragt und ausgelotet. Diese teils auch kritische Auseinandersetzung mit KI ist spannend zu verfolgen und wichtig für einen reflektierten Blick und die gesellschaftliche Verarbeitung dieser neuen Flut an Bildern und Möglichkeiten.

Die Frage, ob durch künstliche Intelligenz generierte Bilder als Kunst gelten können, ist komplex und hat bereits lange Debatten ausgelöst. Ein zentrales Thema in diesen Diskussionen ist die Frage nach der Realität und dem Wert von KI-generierten Kunstwerken im Vergleich zu menschengemachten. Wenn eine KI ein Gemälde produzieren kann, das auf uns genauso wirkt wie beispielsweise ein Werk von da Vinci, stellt sich die Frage, ob es nicht genauso wertvoll ist. 

Generative Art experiments by Till Könneker aka @__ewert__ auf Instagram

Diese Diskussion erinnert an die Auseinandersetzungen in der Kunstwelt beim Aufkommen der Fotografie im 19. Jahrhundert. Die Fotografie stellte die traditionellen Vorstellungen von Kunst und den Fähigkeiten, die ein*e Künstler*in besitzen muss, in Frage. Es wurde argumentiert, dass die Fotografie weniger Talent oder Können erforderte als traditionelle Kunstformen wie Malerei oder Bildhauerei, da sie als mechanischer und technischer Prozess wahrgenommen wurde.

Man Ray - Noire et Blanche, 1926 (gelatin silver print)

Walter Benjamin sprach in seinem Aufsatz "Das Kunstwerk im Zeitalter seiner technischen Reproduzierbarkeit" die Frage der Reproduzierbarkeit und des "Verlusts der Aura" bei reproduzierten Kunstwerken an. Er argumentierte jedoch auch, dass diese Reproduzierbarkeit die Möglichkeit eröffnete, Kunst einem breiteren Publikum zugänglich zu machen.

Schliesslich wurde die Fotografie als Kunstform anerkannt und so wird es auch mit KI-generierten Kunstwerken sein.

Zukunftsmusik - wo geht die KI Reise hin?

Language Models könnten die neue Basistechnologie darstellen, auf der die meisten neuen Softwareanwendungen aufbauen werden. Dies könnte unsere grundlegende Vorstellung davon, was eine Anwendung ist, verändern. Es könnten Einmal-Anwendungen entstehen, die für einzigartige Problemlösungen konzipiert sind.

Diese Single-Use oder selbst-destruktiven Apps generieren sich komplett selbstständig und zerstören sich nach der Nutzung auch wieder. Angenommen ich möchte eine Reise nach Wien buchen mit einer Übernachtung, Citytour und einem Museumsbesuch würde die "App" speziell für diese Anwendung individuell erstellt werden und mir den Reiseplan, Stadtplan mit einer Audiotour, allen Tickets und die Hotelbuchung erstellen, alles mit einer einfachen Chat oder Audioeingabe.

Ein spannender Prototyp von Mckay Wrigley zeigt, wie sein GPT-4 Coding Assistant gelernt hat, solche Apps selbstständig zu entwickeln, alles per Voice-Input.
Die Anwendung kann eine Web-App erstellen und entwerfen, ein Backend mit funktionierender Datenbank dazu bauen, die Authentifizierung handhaben, den Code auf GitHub hochladen und über Vercel deployen.

Wer noch etwas tiefer in die Materie eintauchen möchte, dem empfehle ich dieses Paper von Yohei Nakajima über ein Chat Prototypen, dem man ein übergeordnetes Ziel setzt und der danach selbstständig seine nächste Aufgabe erstellt. Anschliessend generiert und priorisiert er weiterhin seine eigene Aufgabenliste, während er diese nacheinander ausführt.
Diesem “AI Founder” kann jedes beliebige Kernziel gestellt werden wie z.B. "die Welt zu einem besseren Ort machen“. Die KI arbeitet dann selbstständig an dieser Aufgabe.

Twitter-Thread über den Testlauf von Yohei Nakajima mit der KI welche sich selber Aufgaben stellt:

Die Demokratisierung der Möglichkeiten

Es wird immer deutlicher, dass künstliche Intelligenz den Prozess der Technologie-Demokratisierung erheblich beschleunigt. Spezialeffekte, die einst nur Hollywood-Produktionen vorbehalten waren, sind nun für alle zugänglich. Unternehmer*innen können mittlerweile Aufgaben bewältigen, für die früher ein ganzes Start-up-Team aus Spezialist*innen benötigt wurde. Designer*innen, Fotograf*innen und Künstler*innen stehen Möglichkeiten offen, die vor wenigen Jahren noch undenkbar waren.

KI verspricht kreativeres und effizientes Arbeiten. Aber diese neue Kraft bringt auch eine Reihe von Herausforderungen und Gefahren mit sich. So wurde beispielsweise eine Studie herausgegeben die beschreibt, wie KI 3D-Szenen basierend auf Reflexionen des menschlichen Auges erstellen kann, eine Technologie die aus Mission Impossible stammen könnte.

Jia-Bin Huang

Auf aircortex.com wurde kürzlich W.A.L.D.O. v2 vorgestellt, eine KI für Drohnenüberwachung. Sie ermöglicht es im Grunde jedem, Daten zu sammeln, was tiefgreifende Fragen nach Datenschutz und Ethik aufwirft.

Wir stehen an der Schwelle einer neuen Ära, in der KI die Art und Weise, wie wir arbeiten und kreieren, grundlegend verändert wird. Wie wir diese neue Macht nutzen werden, bleibt eine offene und dringende Frage. Es ist entscheidend, dass wir die Chancen, die uns die KI bietet, sinnvoll nutzen, gleichzeitig aber auch die potenziellen Risiken und Herausforderungen erkennen und adressieren. Es liegt an uns, eine Zukunft zu gestalten, die sowohl innovativ als auch verantwortungsbewusst ist.

Don't give up the real world

Ich schliesse mit der schönen Kampagne von Nikon, die daran appelliert, vor lauter KI nicht die echte Welt aus den Augen zu verlieren. Nichts ist so fantastisch wie die Welt vor unseren Füssen.

Kampagne: "Don't give up the real world"
Wir haben grad gemerkt, dass du mit Internet Explorer surfst. Unsere Webseite sieht damit leider nicht so schön aus.

Du willst erfahren warum das so ist?
Wir haben darüber geschrieben.

Zum Blog

Du brauchst Hilfe bei der Umstellung?
Melde dich. Wir helfen gern.

Kontakt

Einen neuen Browser installieren?
Hier gibt es Auswahl.

Browser