Profis mit Erfahrung
Was Sie über KI im Online-Marketing wissen sollten – 1 – Grundlagen
Teil 1/3 - Über die Basis von Künstlicher Intelligenz: so unterscheidet sich maschinelles Lernen von Neuronalen Netzen.
Teil 1/3 - Über die Basis von Künstlicher Intelligenz: so unterscheidet sich maschinelles Lernen von Neuronalen Netzen.
Teil 1/1 – Gleich vorab: ja, in diesem Blogbeitrag über KI im Online-Marketing werden auch Texte eingesetzt, die von KI-Software (Software für Künstliche Intelligenz) geschrieben wurden. Diese Texte sind aber als Zitate ausgewiesen, bzw. sehen Sie Screenshots der jeweiligen Ausgaben. Auch Bilder, die von KI-Software generiert wurden, sind als solche gekennzeichnet. Das am Desktop und Tablet sichtbare Beitragsbild (»Roboter fürchtet sich im Wald«) wurde mit Midjourney erstellt.
KI steht für Künstliche Intelligenz (Artificial Intelligence, AI). Gemeinhin würde man darunter verstehen, dass es sich dabei um Software oder eine Maschine handelt, die intelligent reagiert oder sich eben weitgehend wie ein Mensch verhält. Aber was ist die Definition von »Intelligenz«? Wer bestimmt, wie sich ein Mensch verhält? Im Vergleich womit? Einem Pferd? Einem Stein? Einer erdachten Kunstfigur?
Meist bezeichnet künstliche Intelligenz daher den Versuch, bestimmte Entscheidungsstrukturen des Menschen nachzubilden. Durch Algorithmen wird ein „intelligentes Verhalten“ simuliert, etwa bei Computergegnern in Computerspielen.
Selbst der aktuelle Superstar unter den KI-Startups, das Unternehmen OpenAI, weist daraufhin, dass dessen Software ChatGPT seine Antworten auf unsere Fragen nur erstellt auf Basis eintrainierter Sprachmodelle (Generative KI-Algorithmen). Aktuelles Wissen würde nicht genutzt, der Wissensstand endet mit 2021.
Man könnte also sagen, ChatGPT simuliert Antworten von Menschen auf Fragen, basierend auf bisherigen Antworten, mit denen die Software trainiert wurde.
Ein Beispiel:
Auf die Frage »Wie geht es Ihnen?« lautet die Antwort wohl häufig: »Danke, gut!« ungeachtet des tatsächlichen Zustands (nur in Wien hören Sie überwiegend »Jo, geht eh! Irgendwie geht’s imma.«). Artificial Intelligence wird dahingehend trainiert, dass die KI-Antwort später überwiegend ebenfalls »Danke, gut« lauten wird. Bei in Wien trainierter KI vielleicht auch anders.
Im Mittelpunkt steht die korrekte Anwendung von Sprache, aber derzeit noch weniger der Inhalt (zumindest bei ChatGPT von OpenAI). Aktuelle Antworten auf Fragen können daher sogar falsch sein.
ChatGPT ist ein maschinelles Lernmodell, das mithilfe von künstlicher Intelligenz und natürlicher Sprachverarbeitung entwickelt wurde. Es nutzt eine Technik namens »transformer-based neural network«, um menschliche Sprache zu verstehen und zu generieren. Es wurde mit einer großen Menge an Texten trainiert, um sein Verständnis und seine Fähigkeit, natürliche Sprachantworten zu generieren, zu verbessern. Wenn ein Benutzer eine Frage oder eine Anfrage eingibt, analysiert das Modell den Text und generiert eine entsprechende Antwort.
ChatGPT, 19.01.2023
GPT ist eine Abkürzung für Generative Pre-trained Transformer. Darunter versteht man ein auf Deep Learning (s.u.) basierendes, mit riesigen Mengen an Textdaten aus dem Internet vortrainiertes Sprachmodell. Das Transformer-Modell wurde 2017 im Rahmen der Neural-Information-Processing-Systems-Konferenz vorgestellt. GPT lernt den Kontext und damit die Bedeutung, indem es Beziehungen in sequentiellen Daten, wie den Wörtern in diesem Satz, verfolgt. Das kann beispielsweise für Übersetzungen von Text in andere Sprachen benutzt werden, da die Wortstellung in unterschiedlichen Sprachen unterschiedlich gehandhabt wird.
Machine Learning (maschinelles Lernen) bezeichnet die Fähigkeit von Software, basierend auf Daten, mit denen die Software »gefüttert« werden kann, zu lernen, und die Ergebnisse zu verbessern.
Bei maschinellen Lernverfahren erlernt ein Algorithmus durch Wiederholung selbstständig eine Aufgabe zu erfüllen. Die Maschine orientiert sich dabei an einem vorgegebenen Gütekriterium und dem Informationsgehalt der Daten. Anders als bei herkömmlichen Algorithmen wird kein Lösungsweg modelliert. Der Computer lernt selbstständig die Struktur der Daten zu erkennen. Beispielsweise können Roboter selbst erlernen, wie sie bestimmte Objekte greifen müssen, um sie von A nach zu B transportieren. Sie bekommen nur gesagt, von wo und nach wo sie die Objekte transportieren sollen. Wie genau der Roboter greift, erlernt er durch das wiederholte Ausprobieren und durch Feedback aus erfolgreichen Versuchen.
https://www.iks.fraunhofer.de/de/themen/kuenstliche-intelligenz.html
Klassisches Maschinelles Lernen ist aber nicht in der Lage, unstrukturierte Daten sinnvoll zu verarbeiten. Es können beispielsweise keine Texte als Eingabedaten genutzt werden, um einen Algorithmus zur Bildgenerierung zu trainieren. Klassisches Maschinelles Lernen funktioniert besser bei strukturierten Daten. Das können Datensätze aus einer Datenbank oder Excel-Tabelle sein. Das Zuordnen der Gattung »Katze« zu einem Katzenbild anhand spezifischer Merkmale von Katzenbildern (Gesicht, Ohren, Farbe etc.) gelingt zwar auch bei klassischem Maschinellem Lernen, allerdings müssen zuvor die Merkmale aufbereitet werden (»Merkmal-Extraktion«), damit die richtigen Algorithmen zur korrekten Klassifikation gelernt werden können.
Ein wesentlicher Bestandteil von AI sind Künstliche Neuronale Netze (KNN). Ein KNN basiert auf dem biologischen Konzept von Neuronen. Neuronen im Gehirn sammeln Signale von Zellen, mit denen sie verbunden sind, gewichten jedes Signal (“Wie wichtig ist dieses Signal?”) und entscheiden dann, ob sie selbst ein Signal an die Nachbarn senden. Diesem Schema nachempfunden sind Künstliche Neuronale Netzwerke.
Ein Neuronales Netzwerk besteht aus einer Eingabeschicht, einer »verborgenen Schicht« und einer Ausgabeschicht.
Die Eingabeschicht nimmt etwa das Bild einer Katze entgegen.
Die verborgene Schicht kann aus beliebig vielen Neuronen-Ebenen bestehen. Die Neuronen (Knoten) sind darin miteinander über sogenannte Kanten verbunden. Je stärker die Verbindung ist, desto größer die Einflussnahme auf das andere Neuron. In dieser Schicht werden die empfangenen Informationen gewichtet, weitergereicht und in jeder Ebene der Schicht neu gewichtet. Das Netz lernt erst einmal durch Prüfen einzelner Datensätze und generiert eine Vorhersage für jeden Datensatz. Es nimmt Änderungen der Gewichtungen vor, sobald eine falsche Vorhersage erfolgt. Dieser Vorgang wird viele Male wiederholt. Diese mittlere Schicht wird als verborgen bezeichnet (hidden layer), da ihre Neuronen weder beobachtbare Eingänge noch Ausgänge sind.
Wenn es besonders viele Ebenen gibt, wird das auch als Deep Learning bezeichnet. Deep Learning ist eine Untergruppe von maschinellem Lernen, denn es sucht sich selbst die Strukturen, die es benötigt. Voraussetzung dafür ist aber eine große Datenmenge, denn Deep Learning Verfahren brauchen viele Daten, um sinnvolle Ergebnisse zu erzielen.
Die Ausgabeschicht gibt die verarbeiteten Informationen als Ergebnis – Das ist eine Katze – aus. Ein Ergebnis kann auch eine Wahrscheinlichkeitsverteilung sein.
Deep Learning durch KNNs ist in der Lage, auch unstrukturierte Informationen wie Texte, Bilder, Töne und Videos in numerische Werte umzuwandeln. Das kann klassisches maschinelles Lernen nicht.
Ursprünglich sind die Gewichtungen der Verbindungen in der verborgenen Schicht natürlich rein zufällig und die Antworten, die vom Netz stammen, höchstwahrscheinlich unsinnig. Damit Deep Learning gut funktioniert, braucht es Training. Millionen von Eingaben erzeugen vielfältige Ausgaben. Diese Ausgaben werden hinsichtlich des Ergebnisses bewertet. Bei nicht-sinnvollen Ergebnissen ändert die Software die Gewichtung einzelner Verbindungen (Kanten) in der verborgenen Schicht solange, bis die Ergebnisse als sinnvoll oder korrekt akzeptiert werden.
Jegliche Form von Daten kann als Trainingsmaterial für Deep Learning in der AI genutzt werden kann, daher auch gesprochener Text.
Das Unternehmen Microsoft entwickelt derzeit ein Text-to-Speech-KI-Modell namens VALL-E, das die Stimme einer Person sehr genau simulieren soll, wenn es ein nur drei Sekunden langes Audiobeispiel erhält. Möchten Sie diesen Text mit der Stimme von Oskar Werner vorgelesen bekommen? Das wäre dann möglich.
Hören Sie beeindruckende Beispiele auf https://valle-demo.github.io/
Nach erfolgreichem Training kann die Eingabe bei Bild-AI-Software auch die schriftliche oder gesprochene Beschreibung eines gewünschten Bilds sein (text-to-image), die Ausgabeschicht liefert ein oder mehrere Bilder als Ergebnis.
Eingabe: »Katze fliegt hoch am Himmel«
Ausgabe:
Aktuell wird unterschieden zwischen schwacher und starker Künstlicher Intelligenz.
Schwache KI kann zwar manchmal bereits an menschliche Intelligenz heranreichen, bleibt dabei aber auf abgegrenzte Teilbereiche beschränkt. ChatGPT kann zwar perfekte Texte verfassen, darunter sogar Programmcode, aber das Lösen von Kreuzworträtseln wird eher nicht gelingen. Ein tieferes Verständnis für Problemlösungen kann von schwachen KI-Systemen nicht verlangt werden.
Beispiele für schwache KI-Systeme aus dem Alltag:
Starke KI-Systeme sollen aus eigenem Antrieb, intelligent und flexibel handeln. Sie sind nicht mehr nur auf die Lösung eines konkreten Problems beschränkt. Dazu wären wohl u.a. folgende Eigenschaften nötig:
Solche superintelligente Systeme sollen menschliche intellektuelle Fähigkeiten erreichen und diese sogar übertreffen. Gut, dass es sie noch nicht gibt. Oder?
Es stellt sich jedenfalls nicht die Frage, ob es so etwas einmal geben wird, sondern vielmehr, wann es das geben wird.
Gratulation zu diesem Beitrag übere AI im Online-Marketing. Ich beschäftige mich schon eine Weile mit diesem Thema – eine solche Zusammenstellung, in dieser Dichte und mit vielen unterhaltsamen Beispielen, konnte ich bisher noch nicht finden. Sehr, sehr interessant!
Vielen Dank, Beate!
Dein Feedback bedeutet mir sehr viel.
Liebe Grüße,
Heinz