[00:00:00] Music.
00:00:07: Künstliche Intelligenz oder kurz KI klingt im ersten Moment nach Science-Fiction
00:00:11: und einem Computer, der versucht, die Weltherrschaft an sich zu reißen. In der Realität überwiegen aber die positiven Aspekte
00:00:17: und KI begegnet uns schon jetzt in vielen Bereichen des Alltags, z.b. bei Smart Homes in Form von intelligenten Thermostaten oder Lampen,
00:00:25: bei der Regulierung des Verkehrsflusses oder dem Management von freien Parkplätzen,
00:00:28: und auch personalisierte Empfehlungen beim Online-Shopping oder Streaming und Übersetzungstools im Internet basierend darauf. Mein Name ist Thilo Haertel und in dieser Inside IONOS Episode beschäftigen wir uns mit den Themen künstliche Intelligenz und Machine Learning.
00:00:41: Wie lassen sie sich definieren, welche Vorteile bieten sie und wie setzen wir sie bei IONOS ein. Dazu begrüße ich Benjamin Scheer, er ist Data Scientist bei IONOS und Experte für Machine Learning.
00:00:51: Hallo Benjamin, was ist künstliche Intelligenz und was es auf der anderen Seite Machine Learning? Gibt es da überhaupt einen Unterschied? Hallo Thilo.
00:00:59: In der Berichterstattung ist meistens alles KI. Die Betrachtung aus der Perspektive der Wissenschaft ist, dass Machine Learning ein Teilbereich der KI,der künstlichen Intelligenz darstellt. KI, das ist generell Software, die selbstständig in der Lage ist, Probleme zu lösen,
00:01:13: und es gibt verschiedene Bereiche der KI, dazu zählen beispielsweise Computerlinguistik, Computer Vision oder die Robotik. KI ist also der Oberbegriff
00:01:21: und Machine Learning ist ein Teil des Forschungsgebiets künstlicher Intelligenz. Machine Learning unterscheiden wir noch mal in Supervised Learning und Unsupervised Learning.
00:01:30: Grundsätzlich in unserem Geschäftsalltag kann man aber sagen, Machine Learning und KI werden meistens als gleichbedeutende Begriffe verwendet.
00:01:36: Du hast jetzt gerade von supervised und unsupervised Machine Learning gesprochen, kannst du das kurz erläutern?
00:01:41: Supervised Learning und Unsupervised Learning sind eben die zwei Teilbereiche, und beim Supervised Learning ist beim Lernen bekannt was die korrekte Ausgabe des Modells des Wertentwicklung sein soll.
00:01:53: Z.b. haben wir einen Datensatz und ein Beispiel, eine Klassifikation. Beim Unsupervised Learning geht's darum ohne Label, z.B. mit Hilfe von Clustering, sinnvolle Gruppen in Daten zu finden.
00:02:04: Clustering, das ist jetzt auch schon wieder ein Fachbegriff. Kannst du das kurz erläutern, was du damit meinst?
00:02:08: Clustering bedeutet wir haben eine große Menge von Daten, eine große Punktwolke, und wir versuchen, Attribute zu finden, die bestimmte Gruppen innerhalb dieser Daten beschreiben. Dass wir z.B. einen Kundenstamm betrachten,
00:02:18: dass wir diese Kunden in verschiedene Kategorien unterteilen können, beispielsweise Privatkunden, Geschäftskunden, et cetera.
00:02:24: Wo werden die Grenzen gezogen zwischen künstlicher Intelligenz, Machine Learning und auf der anderen Seite Datenanalyse und Big Data. Kannst du vielleicht auch kurz Big Data definieren?
00:02:34: Big Data beschreibt erst einmal nur große Datenmengen eigentlich und meistens spricht man dann von Big Data, wenn man mit so großen Datenmengen zu tun hat, dass sie gar nicht mehr in den Arbeitsspeicher unseres Computers passen, also wenn wir andere Methoden brauchen, um die komplette Datenmenge zu analysieren.
00:02:48: Z.B., dass wir dann die Datenanalyse auf einem Cluster durchführen müssen und verteilt rechnen. Das heißt, dass auf jedem Knoten in unserem Cluster
00:02:55: ein Teil der Analyse durchgeführt wird und die Ergebnisse am Ende wieder zusammengefasst werden. Da verwenden wir Big Data-Technologien und das sind dann eben andere Technologien als bei klassischen Datenanalyse, wo alle unsere Daten in den Hauptspeicher des Rechners passen.
00:03:06: Datenanalyse generell, ja, das einfach die nähere Betrachtung der Daten mit Hilfe von Methoden aus der Statistik.
00:03:11: Das ist, z.B. die Aufbereitung und die Bereinigung der Daten, aber auch das Entwickeln eines Verständnisses für die Daten an sich. Diese Schritte sind Grundlage für weitere Schritte der Datenverarbeitung, wie am Ende z.B. unser Machine Learning. Vorher steht meistens an Datenanalyse.
00:03:25: Also das heißt es müssen auch erstmal Daten aufbereitet werden, um die Maschine am Ende zu füttern, die dann selbstständig weiterarbeiten kann mit diesen Datensätzen.
00:03:34: Genau, um ein gutes Maschine Learning zu betreiben und gute Modelle zu entwickeln, ist es immer wichtig, die Daten vorher verstanden zu haben, die Daten analysiert zu haben, bereinigt zu haben von Ausreißern eventuell befreit zu haben.
00:03:44: Das Trainieren an sich ist sehr einfach, weil es dafür Standardlösungen, Standard Software-Tools gibt. Eine künstliche Intelligenz wird trainiert, das heißt ich zeige ihr Beispiele
00:03:53: von meinem Daten aus der Vergangenheit, beispielsweise wenn ich jetzt zwischen Betrug und Nicht-Betrug unterscheiden möchte, was war ein Betrugsfall, was war kein Betrugsfall.
00:04:02: Und dadurch, dass ich der KI im Trainingsprozess diese Beispiele zeige, lernt sie diese verschieden Beispiel voneinander zu unterscheiden und lernt aber auch, was die Kriterien sind,
00:04:10: diese voneinander zu unterscheiden, welche Merkmale sind wichtig, welche sind eher unwichtig.
00:04:15: Wir können zum Machine Learning verschiedenste Datenquellen zusammenziehen. Letzten Endes, wenn das das Modell trainiert wird, müssten aber meistens alle Datenquellen oder alle Daten in Form einer Feature Matrix
00:04:25: vorliegen. Das bedeutet,
00:04:27: ich habe eine Matrix und jede Zeile ist eine Beobachtung, z.b. ein Kunde, und in den Spalten daneben habe ich alle Attribute zu diesem Kunden aufgeführt, beispielsweise welches Produkt hat er,
00:04:38: wann ist der Kunde geworden, wie viel Umsatz macht er. Und das Training bassiert dann
00:04:42: auf Basis der einen Feature Matrix, und wir als Data Scientist müssen uns natürlich vorher überlegen, welche Merkmale wollen wir denn in unsere Modelle einbringen, welche Merkmale sind denn dann, wenn wir das Modell anwenden, überhaupt verfügbar.
00:04:53: Z.B., wenn wir versuchen eine betrügerische Domain zu erkennen, wissen wir natürlich im Nachhinein, dass wir sie gekündigt haben.
00:04:59: Wenn wir das Modell anwenden wollen, wissen wir aber natürlich noch nicht, ob es ein Betrüger war oder nicht, ob wir es kündigen werden oder nicht, das heißt solche Daten können z.B. im Training nicht verwenden. Wir können nur Daten drin verwenden, die zum Zeitpunkt der Modellanwendung auch vorliegen werden.
00:05:12: Und manchmal ist es auch wichtig, die richtigen Merkmal erst zu generieren,
00:05:15: z.B. aus einem Datum kann ich ja ableiten, ob das Ganze ein Wochentag war oder ein Tag am Wochenende, ob das Ganze
00:05:22: ein Feiertag war, was ja vielleicht das viel interessantere
00:05:25: Merkmal ist als dass der 3. Oktober war. Also solche Faktoren könnt ihr auch mit in die Daten dann mit einbringen, oder wäre das die Interpretation der Daten, was am Ende dann wieder von Menschen übernommen wird?
00:05:37: Genau, das ist die Phase des sogenannten Feature Engineering, wo man sich eben mit Daten eben wieder hinsetzt, sich überlegt welche Merkmale man generieren kann, welche beschreibende Merkmale man am besten noch hinzufügt,
00:05:47: um dann das Modell drauf zu trainieren. Kannst du vielleicht den Unterschied erklären zwischen regelbasierten Werkzeugen und künstlicher Intelligenz?
00:05:55: Meine Antwort wäre in dem Fall - Regeln kann ich dann einsetzen, wenn die Komplexität sich im Rahmen hält und ich als Menschen an der Lage bin, diese Regeln eben auch aus den Daten zu erfassen, zu analysieren und dann abzubilden. Eine KI wird immer dann eingesetzt
00:06:07: oder kann dann eingesetzt werden, wenn die Regeln zu komplex werden, das heißt wenn ich zu viele Inputfaktoren habe oder
00:06:14: wenn die Inputfaktoren untereinander korreliert sind. Dann macht es Sinn, Machine Learning einzusetzen, um diese Regeln, die in den Daten vorhanden sind, herauszufinden.
00:06:23: Und dem Machine Learning gebe ich erstmal keine Regeln vor, sondern ich zeige nur Beispiele und ich habe das volle Vertrauen, dass meine KI die richtigen Regeln finden wird. Deswegen ist auch so wichtig am Ende zu verstehen, warum ein Modell eine Entscheidung getroffen hat, und nachvollziehen zu können,
00:06:35: was war denn das Entscheidungskriterium. Also es passiert ganz leicht, dass sich da ein sogenannter Bias einschleicht, dass wir Merkmale verwenden um z.B.
00:06:43: Menschen zu unterscheiden, die wir eigentlich nicht verwenden sollten um sie zu unterscheiden, wie Geschlecht, Herkunft, ethnische Zugehörigkeiten etc. Sowas wollen wir nicht im Machine Learning-Modell als Unterscheidungskriterium haben.
00:06:55: Wie hoch ist die Wahrscheinlichkeit, dass ich mit künstlicher Intelligenz in Berührung gekommen bin, auch wenn mir das nicht bewusst ist in so einer alltäglichen Situation vielleicht?
00:07:02: Machine Learning findest du in den meisten digitalen Bereichen des Lebens heutzutage, insofern ist die Wahrscheinlichkeit, dass du in Berührung gekommen bist schon sehr sehr hoch.
00:07:10: Z.b. in der Google-Suche wird Machine Learning eingesetzt. Wenn du einen Newsfeed auf dem Smartphone hast, sind diese Inhalte auf dich abgestimmt. Ein Modell hat gesagt, was würde denn dich
00:07:20: am ehesten interessieren. Wenn du Online Shopping betreibst, werden dir Produkte vorgeschlagen, und auch wenn du auf einer Website bist und ein Chatbot benutzt, dann steckt dahinter meistens eine KI, die in der Lage ist, deine Fragen
00:07:30: möglichst gut zu beantworten. Und auch ganz abseits vom Online-Leben, wenn du in ein Geschäft gehst und ein Produkt kaufen möchtest, steckt dahinter ein Warenwirtschaftssystem, und das ist mit hoher Wahrscheinlichkeit auch mit einer KI optimiert worden.
00:07:43: Du hast ja jetzt auch schon viele alltägliche Beispiele genannt, da schließt sich meine nächste Frage auch gut an. Welche generellen Vorteile bringt Maschine Learning mit sich?
00:07:51: Mit Hilfe von KI kann ich vorallem automatisch Software-Entscheidungen treffen lassen und zwar auch das ganze skalieren, das ganze vielfach machen, und ich setze vor einem KI dann überall ein, wo es sehr schwer ist sie Entscheidungsregeln, die ich dafür brauche,
00:08:03: im Code abzubilden oder selbst zu schreiben.
00:08:06: Dann trainieren wir meistens ein Maschinen Learning-Modell, eine kleine KI, und die baut innerhalb dieses Modells ein gewisses Domänenwissen auf, um gewisse Entscheidung treffen zu können. Natürlich gibt's dann auch Methoden,
00:08:15: um wieder nachvollziehen zu können, warum ein Modell eine bestimmte Entscheidung getroffen hat. Auch das ist ein ganz wichtiger Aspekt, dass man immer in der Lage, zu erklären, warum ein Modell eine bestimmte Entscheidung getroffen hat.
00:08:25: Treffen denn KI Modelle immer die richtige Entscheidung? Eine KI wird vor allem draufhin optimiert, möglichst gute Entscheidungen zu treffen, aber natürlich passieren auch
00:08:34: Fehler. Es kann entweder sein, dass schon in den Trainingsdaten Fehler vorhanden sind, weil sie jemand falsch gelabelt hat. Aber auch in unsicheren Situationen kann eine KI vielleicht mal eine falsche Entscheidung treffen.
00:08:44: Wichtig ist dann das man als Anwender weiß, wann ist sich eine KI sehr sicher in ihre Entscheidung, und wann ist sie vielleicht eher unsicher und eine Entscheidung sollte noch mal geprüft werden,
00:08:52: z.B. manuell überdacht werden. Die Entscheidungsfindung hängt auch immer von der Vorbereitung dann ab?
00:08:59: Genau also die meiste Arbeit beim Maschinen Learning steckt eigentlich darin, die richtigen Trainingsdaten bereitzustellen, die Trainingsdaten sauber aufbereitet zu haben, möglichst fehlerfrei zu haben. Das eigentliche Training des Modells stellt höchstens 10 bis 20% der eigentlichen Arbeit letzten Endes da.
00:09:14: Und wie wird jetzt Machine Learning in Unternehmen eingesetzt? In Unternehmen wird da sehr große Bandbreite von Machine Learning
00:09:22: únd KI eingesetzt. Das reicht von kleinen Modellen, die beispielsweise Maschinen überwachen, die in der Produktion stehen, die überwachen, ob die Parameter alle im Rahmen sind, ob die Maschine sich in einem
00:09:31: schlechten oder guten Zustand befindet, bis hin zu großen Sprachmodellen, die angewendet werden, wie z.b. in Chatbots, die in der Lage sind, Fragen von Kunden automatisiert zu beantworten und Hilfestellung zu geben.
00:09:43: Wie und in welchem Bereich setzen wir bei IONOS Machine Learning ein?
00:09:46: Bei IONOS setzen ganz viele Fachbereiche inzwischen KI ein und wir betreiben eine große Anzahl von kleinen und großen KI-System dafür. Z.b. haben wir Systeme, die unsere Mitarbeiter im Support unterstützen. Z.B. unterstützen sie sie dabei
00:09:59: die richtigen Lösungen fürs Kundenproblem möglichst schnell aufzufinden, wenn der Kunde am Telefon ist
00:10:04: und dringend Hilfe benötigt. Wir haben ein großes System zur Branchen-Erkennung von Websites. Damit können wir erkennen, z.B.,
00:10:11: dass eine Website ein Friseur ist und ihm helfen, seine lokale Sichtbarkeit zu erhöhen.
00:10:15: Wir machen Bedarfs-Forecasting, das heißt, wir versuchen vorherzusagen, welchen Ressourcenbedarf wir z.b. im Support an einem bestimmten Tag haben werden. Wir
00:10:23: haben Systeme, die Angriffe auf Login-Seiten erkennen. Das heißt, die Systeme erkennen mit der Hilfe von KI unnormale Aktivitäten und schützen somit die Accounts unserer Kunden.
00:10:33: Wir benutze KI außerdem auch zur Empfehlung von Domainnamen, das heißt, wir machen dem Kunden KI-basiert Vorschläge, welche Domänen zu seinem Geschäft passen könnte. Das ist nur eine kleine Auswahl an KI-System die es bei IONOS gibt, aber man kann grob sagen,
00:10:46: in den unterschiedlichsten Fachbereichen finden wir heutezutage bei IONOS schon KI-Systeme. Und wie profitieren die IONOS-Kunden konkret davon?
00:10:52: Überall da wo wir uns in Support-Mitarbeiter helfen, helfen wir letztens auch dem Kunden, das heißt, z.B., dass der Kunde schnell einen Mitarbeiter am Telefon hat, oder dass der Support-Mitarbeiter ihm wirklich auch schnell helfen kann und die richtige Lösung für das Problem auf Lager hat.
00:11:05: Wie sieht die Strategie von IONOS im Bereich Machine Learning? Also zum einen verfolgen wir intern zahlreiche KI Projekte, eben z.b. auch zur Betrugserkennung
00:11:14: bei Domainnamen. Das heißt, wir versuchen rechtzeitig zu erkennen, welche Domains für Missbrauch benutzt werden und versuchen so zu verhindern, dass darüber z.B. Spam verschickt wird oder Phishing-Angriffe passieren.
00:11:25: Im Bereich Produkte bieten wir aktuell schon fast alles an was der Kunde benötigt, um Machine Learning auf der IONOS-Cloud zu betreiben, und wir haben auch einige Kunden, die bereits die IONOS-cloud dafür einsetzen, Machine Learning zu machen und ihr Daten dazu analysieren.
00:11:36: Des Weiteren beteiligt sich IONOS an der Initiative Gaia X des Bundesministeriums für Wirtschaft und Energie und IONOS Cloud stellt dort im Rahmen von sechs Projekten
00:11:44: Infrastructure-as-a-Service zur Verfügung, das heißt, wir sind der große Infrastrukturanbieter für sechs dieser Projekte. Ein Beispiel dafür ist Marispace-X, ich glaube da
00:11:54: gabs schon eine Podcast Folge dazu.
00:11:56: Da versucht man mit der Hilfe von Vermessungsdaten der Meere Munition aus dem Zweiten Weltkrieg aufzuspüren, Unterseekabel aufzuspüren und auch sowas wie Seegrasfelder zu finden.
00:12:06: Das Konzept künstlicher Intelligenz ist ja schon über 50 Jahre alt, aber den Entwicklungssprung hat es ja vor allem in den letzten zehn Jahren ungefähr gemacht.
00:12:13: Wenn wir einen Blick in die Zukunft wagen, wie wird sich KI bei IONOS weiterentwickeln, wie wird sie sich allgemein weiterentwickeln und was sind so die nächsten Schritte?
00:12:21: Ich glaube, das ist sehr wichtig. Viele der heute als state-of-the-art-geltenden Algorithmen
00:12:24: sind bald über 20 Jahre alt und insofern keine neue Erfindung mehr. In letzten zehn Jahren haben sich vor allem drei Dinge geändert. Die Rechenleistung hat sich sehr stark erhöht,
00:12:34: wir haben jetzt GPUs zur Verfügung fürs Training und wir können dadurch komplexere, z.B. neuronale Netze trainieren.
00:12:39: Neuronale Netze sind sehr komplexe Maschinen Learning-Modelle, die häufig mehrere Millionen oder Hunderte von Millionen Parametern haben und dementsprechend auch große Datenmengen und
00:12:49: viel Rechenleistung zum Trainieren benötigen.
00:12:52: Es hat sich auch viel im Bereich Software getan. Es gibt inzwischen viele gute Open-Source-Software-Pakete für die Entwicklung von Machine Learning-Modellen und das erleichtert
00:13:00: vielen den Zugang zu Machine Learning, und vor allem sehen wir in letzten Jahren jetzt einen Trend, der nennt sich MLOps.
00:13:06: Das heißt, es entwickeln sich viele Tools, die den kompletten Lebenszyklus der KI abbilden, sprich von der Datenerfassung über die Aufbereitung der Daten, das Training,
00:13:15: bis hin zum Deployment der Modelle, wo die Modelle am Ende der in der Produktion laufen und stabil laufen müssen. Und das schließt im Moment so die Lücke zwischen den Modellen und den Live-Systemen
00:13:24: bzw. dem Data-Scientist so wie mir, der Softwareentwicklung
00:13:28: und den Betriebsteams. Und für IONOS kann man sagen, wir sehen, dass viele Fachbereiche inzwischen Kompetenz im Bereich Datenanalyse und Machine Learning aufgebaut haben und das im Alltag einsetzen, und wir entwickeln inzwischen auch Produkte, die die Kunden bei der KI Entwicklung unterstützen.
00:13:42: Vielen Dank für das Gespräch! Vielen Dank, Thilo! Ich hoffe, wir konnten Ihnen das abstrakte Thema Künstliche Intelligenz, Machine Learning etwas näher bringen.
00:13:50: Wenn Sie sich etwas mehr mit dem Thema beschäftigen wollen, finden Sie im IONOS Digital Guide lesenswerte Artikel dazu, die wir in den Shownotes verlinkt haben. Wenn Ihnen diese Episode gefallen hat und Sie sichergehen wollen, keine weitere Episode zu verpassen,
00:14:02: abonnieren Sie Inside IONOS doch direkt unter inside.ionos.de, auf Spotify, Apple Podcast oder Deezer.
00:14:08: Ich freue mich über Bewertungen, Anregungen und Kommentare, entweder direkt unter dieser Podcastfolge oder per Mail an podcast.ionos.com.
00:14:17: Vielen Dank fürs Zuhören und bis zum nächsten Mal.
00:14:19: Music.