Folge 41: Model Collapse – „Das haben wir immer schon so gemacht!“

Shownotes

Was hat der Rammstein-Song „Mein Teil“ mit aktuellen Problemen der KI zu tun? Die Mehrzahl der digitalen Inhalte ist nicht mehr in Menschenhand. Die KI lernt aus Trainingsdaten. Was passiert dann, wenn die KI die KI füttert? Prof. Matthias Spörrle und Matthäus Hose zeigen, warum es gefährlich ist, wenn Trottel ihr „Wissen“ weitergeben wollen. Und was es für KI-Nutzer bedeutet, wenn schlechte, KI-generierte Inhalte die KI trainieren. Und warum unabhängige Websites wie faz.net oder elektroniknet.de auch in Zukunft unverzichtbar sind.

YouTube: HOSE&SPÖRRLE: Mensch. Maschine. Morgen.

Rammstein – Mein Teil (via YouTube)

Erscheinungsweise: Wöchentlich | Dienstag

Weiterführende Infos und Links zur Folge hier!

Diese und weitere Folgen von „HOSE&SPÖRRLE: Mensch. Maschine. Morgen.“ gibt es in allen gängigen Podcast-Apps, und hier: Markt&Technik-Podcasts!

Wenn Ihnen „HOSE&SPÖRRLE: Mensch. Maschine. Morgen.“ gefällt, dann freuen wir uns sehr, wenn Sie den Podcast abonnieren, liken, bewerten und weiterempfehlen.

Wir freuen uns über Feedback: podcast@markt-technik.de

Wenn Sie Werbung in diesem Podcast schalten möchten: podcast@markt-technik.de

Impressum

Datenschutz

Transkript anzeigen

00:00:00: Matthäus.

00:00:01: Immer dieselben Inhalte.

00:00:03: in der Arbeits- und Organisationspsychologie gibt es doch den Begriff, der kommt so ein bisschen aus der Praxis auch wissenschaftlich gar nicht zu gut erschlossen Betriebsblindheit.

00:00:14: Ich werde immer mit denselben Informationen gefüttert ich lerne nichts Neues.

00:00:18: das Ergebnis ist ich schmore in meinem Saft Und kann keine neuen Erkenntnisse gewinnen.

00:00:25: möglicherweise geht alles leichter weil ich routiniert bin Weil ich alles schon kenne, kann ich alles leichter erschließen.

00:00:32: Aber weil ich immer dasselbe wiederkeue... ...die Qualität meines Outputs schlechter!

00:00:39: Ich frag mal dich als Mensch mit organisationaler und management- bezogener Verantwortung.

00:00:44: Gibt es sowas wie Betriebsblindheit?

00:00:46: Es gibt einen ganz einfachen Satz in jeder Organisation.

00:00:49: Und zwar sage ich's mal auf Bayerisch.

00:00:51: Auf Hochdeutsch heißt das dann anders aber ist derselbe Gedanke dahinter.

00:00:54: Das haben wir immer so gemacht.

00:00:56: Das hat mich immer schon so gemacht.

00:00:58: Sobald dieser Satz fällt, blingeln die Alarmglocken.

00:01:02: Weil das heißt, oh, die Organisation ist an einem Punkt angelangt wo es entweder böse nach unten geht oder sie werden wach und denken sich so kann's nicht weitergehen.

00:01:11: wenn ich das mache was ich immer schon gemacht habe was ich gut kann werde ich mich niemals weiterentwickeln.

00:01:17: Also ist die Frage Was passiert mit einem System?

00:01:21: Zum Beispiel mit KI Wenn es immer nur im eigenen Saftsmord immer nur die Inhalte bekommt, die es vielleicht sogar selber generiert hat.

00:01:30: Die Vielfalt geht zurück und die Kreativität leidet darunter und auch das ganze Spektrum wird einfach enger.

00:01:38: Das ist natürlich schlecht!

00:01:39: Denn Menschen sind deswegen so erfolgreich als Spezies weil sie sich immer weiterentwickelt haben.

00:01:45: Sonst werden wir heute noch in der Höhle sitzen und muss ja aufpassen...

00:01:50: Kann ja auch sehr gemütlich sein.

00:01:51: Es gibt doch sehr gemühtliche Höhlen.

00:01:52: Ja, dauernd nicht.

00:01:54: Da stimmt schon.

00:01:54: Okay, gucken wir uns das an.

00:01:56: Ein schlechtes

00:01:57: schlechter Kabelempfang?

00:01:58: Ja

00:01:58: absolut und das wollen wir nicht.

00:01:59: Gucken wir uns dass an inwiefern dieses Phänomen was du da gerade beschrieben hast vielleicht auch bei KI auftreten kann.

00:02:06: Mortal Collapse.

00:02:07: Here we go!

00:02:22: Herzlich willkommen zu einer weiteren Folge unseres Jahrhundert Podcasts Hose & Spörle Menschmaschine.

00:02:29: morgen meiner Seite oder beziehungsweise mir gegenüber, wie immer unser guter alter Freund und bekannter Professor Dr.

00:02:38: Matthias Stölle und herzlich unter Kontrolle.

00:02:42: ein privat Universitätsschloss Seeburg.

00:02:44: Hallo Mathias schön dass du da bist

00:02:46: der gute alte Freund freut sich dazu sein hallo Matthäus

00:02:48: ich bin Matthäus Hose.

00:02:49: sie Ode Componies GmbH einem Event und Medienveranstalter Ne, andersrum.

00:02:55: Ein Eventveranstaltter Medienambienter so rum in der professionellen Elektronik machen die Maknontechnik elektronisch und elektroniknet und viele Events im Bereich Embedded Defense und Automotive.

00:03:07: Heute unser Thema Model Collapse.

00:03:11: wenn die KI sich selbst aufrisst warum Modelle an ihrem eigenen Output zerbrechen können?

00:03:18: das Thema Selbstverzehrung.

00:03:20: Matthias weißt du was die Seescheide ist, das ist keine maritime Schweinerei.

00:03:27: Du weißt was die Seesscheide

00:03:29: ist?

00:03:29: Ich glaube es ist eine Tierart.

00:03:30: Richtig!

00:03:31: Wie wir alle wissen ein zersiles Manteltier und wahrscheinlich eines der so eine... Die Leinen würden sagen so eine Art Schnecke aber es ist es nicht.

00:03:40: Ein zersales Mantletier wie wir wissen.

00:03:42: Und davor gibt's dreitausend Arten.

00:03:44: Das sind sehr verbreitete, manikfaltige Spezies Und wohl das berühmteste Beispiel für Self-Eating.

00:03:53: Also wer Ramstein Fan ist, so wie ich und mein Teil kennt du bist was du isst und ihr wisst was es ist.

00:04:00: Es ist mein Teil.

00:04:02: Ja egal.

00:04:03: Ich schweife auf.

00:04:05: also die Sehscheide beginnt ihr Leben als Larve mit einfachem Gehirn und irgendwann wenn sie einen festen Platz am Felsen gefunden hat dann Und wo sie dann da bleiben möchte, sagt sie okay.

00:04:16: Jetzt habe ich einen Platz gefunden und mein Häuschen gefunden oder mein Blätzchen.

00:04:19: Soweit erstmal so normal?

00:04:20: Ich warte auf das... Ich

00:04:21: benötige meinen Gehirn nicht mehr und dann ist es ja einfach ein eigenes Gehirnoch, so wie manche Wähler auch.

00:04:29: Da hat der eigene Gehirne um Energie zu sparen.

00:04:31: Sie frisst quasi ihren Verstand auf, sobald sie sesshaft geworden ist.

00:04:37: Was hat das mit unserem heutigen Thema zu tun?

00:04:40: Möchtest du empfehlen, dass Leute in Abhängigkeit von ihren Lebensphasen, MTNEST, Pflegebedürftigkeit, junge Leute.

00:04:46: Dass die häufiger den Wohnort wechseln sollen.

00:04:48: Richtig?

00:04:50: Läuft das darauf hinaus?

00:04:51: Im Motto bleibt nicht im selben Haus wohnen oder?

00:04:54: Das ist die Camp-Wirtschaft.

00:04:56: Heute reden wir oft über KI und so.

00:04:57: Wir kennen Wirtschaftsbehandlung.

00:04:59: Und heute ist ja nicht die entscheidende Frage ob die KI schon massenhaft Inhalte produziert.

00:05:05: Es macht sie ja schon sondern die wichtigere... Frage und das ist was uns alle betreffen wird, ob wir es merken oder nicht.

00:05:11: Ist was passiert wenn genau diese Inhalte nun also die Inhalter die die KI produziert hat?

00:05:17: Nun zum Rohstoff für die nächste Generation werden.

00:05:20: Also je mehr synthetisches Material das Netz füllt desto wertvoller werden vielleicht Daten die Nichtdurchmodelle vorgefiltert werden.

00:05:28: aber was passiert Wenn sich Autophagie quasi wenn sich die KI selbst ernährt?

00:05:33: ja also das natürlich ein super Punkt Und auch zeitgemäß zum Zeitpunkt der Aufnahme, von diesem zeitlos gültigen Podcast.

00:05:46: Ich denke da auch an die Hörer der kommenden Jahre.

00:05:51: Zum Zeitpunkt dieser Aufnahme ist das in etwa so... ...die entsprechenden Institutionen, die das wüssten, die es genau wüsten verraten uns das nicht aus gutem Grund?

00:06:01: Warum nicht was der gute Grund

00:06:03: gilt?

00:06:03: Die Mehrzahl der Inhalte und der Accounts ist ja wohl nicht mehr in Menschenhand.

00:06:10: Achso!

00:06:11: Jetzt schon nicht mehr.

00:06:11: Genau, also ich denke das durch die Algorithmen man sieht ja auch die Zugriffe und so weiter, wann die Inhalte hochgeladen werden, welchem Tempo die hoch geladen werden?

00:06:21: Also ich denke dass all diese Anbieter von diesen verschiedenen Internet-Plattformen... Dass sie natürlich sehr gut sehen.

00:06:30: was ist AI based, also KI generiert?

00:06:35: und was sind reale Inhalten wo noch Menschen mit ... real vom Menschen generierten Inhalten dahinterstehen.

00:06:42: Und so etwa um das Jahr... ...vom Jahr im Jahr zum Jahr zum Jahre zum Jahr, zum Jahr ... ...kann man davon ausgehen?

00:06:48: Mehr als die Hälfte ist künstlich!

00:06:51: Das heißt wenn du jetzt einfach eine Zufallsstichprobe ziehst von beispielsweise User-Accounts oder von Postings.

00:07:02: Eine Zufallstich Probe breit gestreut nicht in deinem Netzwerk weil ich glaube du hast noch so ein Interesse an diesem Menschen.

00:07:07: Ich glaube in deinen Netzwerken sind auch überwiegend denke ich Echte Menschen unterwegs.

00:07:11: Klickt

00:07:12: in meinem beruflichen Kontext, sonst wäre es nicht so, aber das ist dass wir eben Medien machen für Menschen und nicht für Maschinen.

00:07:18: habe ich noch Interesse an Menschen.

00:07:19: Genau genau genau so ist das ja.

00:07:21: Es ist auch plausibel, dass du da so oldschool

00:07:24: bist.

00:07:24: Ja

00:07:24: old school ein bisschen archaisch unterwegs bist.

00:07:28: Mir ist es tatsächlich auch Meinungen von Menschen noch wichtig.

00:07:30: also es klingt komisch, aber es ist wichtig.

00:07:32: An der Haltung solltest Du arbeiten weil Du wirst von Algorithmen gefunden Nicht mehr von Menschen.

00:07:36: Das ist die These diesmal.

00:07:37: Gut, gehen wir raus aus der Ironie und bleiben ein bisschen handlungsfähig verankert.

00:07:42: also Sie hören das jetzt hier im Rückblick.

00:07:45: im Rückblick zwanzig dreißig zwanzivunddreißig.

00:07:47: gucken sie jetzt zurück auf diese Podcast-Folge etwa um das Jahr vormunzwanzig sechsundzwanziger können wir sagen.

00:07:52: noch mal die Medieninhalter in den Medienverwandler verantwortlichen sagen uns das nicht aus gutem Grund.

00:08:00: keiner kann Klickzahlen gut verkaufen wenn man sagt die sind nur von Bots generiert.

00:08:04: Deswegen wird uns das nicht gesagt.

00:08:06: Aber von den Hochrechnungen ist die Sache eigentlich klar, mehr als die Hälfte der Inhalte ist künstlich generiert.

00:08:16: Und jetzt ist natürlich die interessante Frage – Wird dadurch die Qualität der Modelle besser?

00:08:23: Weil man hat ja mehr Daten und KI im Unterschied zur klassischen Programmierung verlangt ja Trainingsdaten.

00:08:31: Es gibt verschiedene Algorithmen.

00:08:33: wie sie funktionieren brauchen nicht alle gleich viel, ist auch die Frage ob die KI generell sein soll oder spezifisch.

00:08:40: Wenn sie spezifik ist braucht es weniger und die Qualität ist entscheidender bla bla bla.

00:08:44: Aber im Vergleich zur klassischen Programmierung lernt die KI aus Trainingsdaten.

00:08:50: Jetzt ist die Frage was passiert wenn der überwiegende Anteil... Und das ist jetzt der Fall!

00:08:55: ...wenn der überwegende Anteil der Trainings-Daten nicht mehr vom Menschen kommt sondern von anderen KI Modellen.

00:09:03: Da gab es die ersten Paper dazu, die haben mit Bilddaten gearbeitet.

00:09:07: Und gibt's also Webseiten?

00:09:10: Also da hast du eine AI vor dat, hat das aber auch mal aufgelistet und da gabs eine Adresse, die hieß... Gibt's auch glaube ich immer noch this person that not exist.

00:09:20: Das ist so ne Webseite, gehst du auf die Webseit drauf und dann erscheint ein Bild von einem Menschen.

00:09:25: Und was passiert jetzt wenn Du eine KI zur Gesichtsgenerierung mit solchen künstlichen Gesichtern vertast?

00:09:33: Der Ergebnis ist, die Gesichter sehen nach einer Weile verstörend aus.

00:09:38: Das heißt, die Output-Qualität wird schlechter und das ist dieser Prozess.

00:09:45: Das ist Model-Autophagy.

00:09:47: Das Ergebnis kann dann manchmal sein, muss nicht sein weil das Ergebnis kann sein, Model-Collapse.

00:09:54: Das heisst unser

00:09:55: Thema ...

00:09:56: Das Ergebnis wird dann immer schlechter.

00:09:58: genau so es

00:10:00: ist.

00:10:02: Da wird brutal wachsen, der ist schon brutal gewachsen.

00:10:04: Ich habe gelesen letztes Jahr, immer letztes Jahre war,

00:10:08: sagen

00:10:09: wir mal im Jahr zwanzig, fünfundzwanzig zum Beispiel, wohnt drei Komma zwei Milliarden Dollar der Markt für KI Trainingsdaten.

00:10:15: Man denkt davon aus dass er in zwanziger und dreißig vorletztes Jahr quasi auf etwa sechzehn Komma drei Milliarden Dollar wachsen wird.

00:10:23: sprich das deutlich aus, sechzehn oder sichtzig?

00:10:25: Sechszehn.

00:10:25: Deutlich aussprechen, dann musst du dir anderen Podcast-Partner suchen.

00:10:39: Das ist schon ein Riesenmarkt, da geht es um sehr viel Geld.

00:10:41: Es ist aber die Frage, ich möchte mal ein Beispiel bringen aus dem Kampfsport zum Beispiel wenn du im TechVando Trainer hast Also im traditionellen Kampfsport wird er das Wissen, der Kampfkunst vom Meister an die Schüler weitergegeben.

00:10:54: Wenn es dein Meister zum Beispiel in Trottel ist und das kommt vor ... Und da kann die Chancs im lasso schon traditionellen Techwondo nicht gut laufen.

00:11:02: Er kennt sie nun ein bisschen.

00:11:03: so aber...

00:11:03: Das sind bestimmte Bewegungsabläufe.

00:11:05: Das

00:11:05: ist eine Bewegungsmuster genau wo er läuft ebenso wie er sich halt aus Bequemlichkeit herläuft.

00:11:10: Ist aber falsch!

00:11:11: Aber es ist nicht allumfassend, er kennt halt nur siebzig Prozent des Wissens.

00:11:15: Jetzt gibt er das seinem Schüler weiter dann kann der dich chancen.

00:11:18: Wenn er einen schlechten Meister hat, wird der Dichon niemals perfekt lernen oder so lernen wie sie eigentlich gehört.

00:11:24: Weil der Meister sich schon nicht konnte und der Schüler wird definitiv auch entlang des Weges Verluste haben also Lernverluste.

00:11:30: Das heißt wenn der Meisters schon nicht hundert Prozent performt oder hundert prozent vermitteln kann dann kommen am Schüler auch nicht Hundert zehn Prozent an sondern nur achtzig Prozent.

00:11:38: das brauche ich dir als Professor ja nicht sagen.

00:11:40: Wenn jetzt die KI die KI füttert und die KI ja schon nicht perfektes und die wird dann für die nächste Stufe der KI ... dann wird das Ergebnis ja immer, immer schlechter werden.

00:11:52: Zwangsläufig oder?

00:11:53: Und was kann man da dagegen machen?

00:11:55: Also im Tech-Vando würde ich mir empfehlen keine Meister zu nehmen die nicht gut sind... ... sondern einfach nur die nehmen, die wirklich gut sind und die wirklich wissen von sich reden weil sie... Die Schüler werden nur so gut sein wie der Meister ist.

00:12:05: Maximal!

00:12:06: Maximalsogut ne?

00:12:08: Ja

00:12:08: oder an eine Wege gehen dann aber auch nicht in den klassischen Systemen vom Wissen her logischerweise nicht.

00:12:15: Ich habe ein paar Studierende ehemalige Studierende, die bei mir Praktikum gemacht haben und Abschlussarbeit geschrieben haben.

00:12:23: Und sie sind jetzt Professorinnen und Professoren – also nicht alle aber einige, die von mir Ausbildungsanteile genossen haben!

00:12:32: Da würde ich sagen, die haben mich übertroffen bezogen auf den wissenschaftlichen Outputs.

00:12:39: Sind die mir ganz klar überlegen?

00:12:41: Kann man so ein bisschen vergleichen?

00:12:42: Impact, wer hat am meisten wissenschaftliche Impulse

00:12:45: gesetzt?!

00:12:47: Ich konnte die sozusagen ein Stück Wegs begleiten.

00:12:51: Konnte aber dann darüber hinausgehen und habe auch immer gesagt okay, inspiriere dich auch ein bisschen dort und inspirere dich auch etwas dort.

00:13:01: Und so kann das dann funktionieren.

00:13:03: Bei einer KI ist es aber natürlich schwieriger wenn du dann innerhalb dieser KI-Welt bleibst.

00:13:10: Wie kann denn überhaupt... Das ist jetzt fast philosophisch.

00:13:12: wollen wir da drüber mal reden?

00:13:13: wie kann denn über was Neues in die Welt kommen?

00:13:16: Weißt du?

00:13:16: Also, gibt's denn... Wie heißt noch mal diese Bewegungsablauf?

00:13:20: JONG.

00:13:20: JONG!

00:13:21: Gibt es neue JONGs?

00:13:22: Werden neue JUNGs

00:13:24: erfunden?!

00:13:25: Es wird... Es gibt zwanzig JONGS im traditionellen Techfondo.

00:13:28: Es gibt immer Abwandlungen.

00:13:31: Also jemand bringt JONG zusammen und macht nicht JONG im Kampfmodus oder interpretiert die JONG anders.

00:13:38: Das gibt es immer aber zwanzige JONG'S gibts so.

00:13:40: Und das bleibt bei den zwanzigeren?

00:13:41: Das ist

00:13:42: ein traditionelles Techfondue.

00:13:43: Man würde aber, ich will es nicht zu kritisch sein.

00:13:45: Aber man würde ja erwarten... Die Leute haben auch viel bessere Trainingspläne als früher und fangen auch oft viel früher an.

00:13:53: Denk an die Pianisten, Genies usw.

00:13:56: Man kann Kinder nicht früh genug in die Leistungsgesellschaft reinquelen und zu einer Profilierung zwingen, die ihre Eltern nie erreicht haben.

00:14:04: Also je früher desto besser!

00:14:07: Das ist doch total plausibel dass man jetzt eigentlich andere Jungs eigentlich bräuchte weil die leute doch weiterkommen.

00:14:15: wie kann denn da was neues entstehen wenn das immer nur kopiert ist und immer nur koppiert ist also.

00:14:21: Das ist ja ein

00:14:22: Model Collapse, wir reden hier quasi davon.

00:14:24: kannst du mal im weltverband mal einreichen wenn es in den gäbe sehr diffundiert mit den verbänden.

00:14:30: aber das ist tatsächlich der punkt.

00:14:32: wenn sich die menschliche Kreativität nicht durchsetzt oder Menschen was machen, was out of the boxes wird es immer nur selbe geben.

00:14:39: Es gab ja immer menschliche Tendenzen dass manche sagen ich mach das nicht mehr so macht jetzt anders und dann ist etwas großartiges daraus entstanden.

00:14:49: wenn aber die KI durch die KI gefüttert wird, durch die Ki gefüttern wird,

00:15:00: auf jeden Fall als es gibt bestimmte Studien, die sind auch relativ radikal.

00:15:05: Also beispielsweise gibt es eine Studie, die hat einen LLM gefüttert mit irgendwelchen Fragen und dann gab's Output und nur mit diesem Output wurde dann die nächste KI trainiert.

00:15:19: das heißt da gab es gar keine Menschendaten mehr sondern nur noch voll krass.

00:15:23: Hundertprozent AI Generated Training Data Und dann die Nächste Generation.

00:15:28: du kannst dir schon denken nur mit dem Output von dar Und nach ein paar Generationen, ich weiß nicht mehr fünf oder acht aber wirklich nur ein paar generation war der Output im LLM.

00:15:39: Also es war dann total zusammengebrochen.

00:15:41: Kollaps das war dann da.

00:15:43: Das muss ja nicht immer so passieren.

00:15:46: Aber lass uns das gleich noch ein bisschen problematisieren weil ich hab doch schon auch ein paar Sorgen.

00:15:52: Okay?

00:15:53: Der Kollaps muss hier nicht immer passieren.

00:15:54: was es aber offensichtlich gibt ist dass die Vielfalt abnimmt.

00:15:58: Weißt du, der Mensch ist bunt und Manikfach.

00:16:00: Und dann gibt es eben auch Kuriositäten.

00:16:03: Ja?

00:16:03: Es gibt auch mal was Besonderes!

00:16:04: Mal ein bisschen was Exotisches... Ich meine jetzt im positiven Sinne mal quer gedacht.

00:16:09: Im positiven Sinn.

00:16:12: Wenn Sie das Gefühl haben zu sagen, ja wusst ich's doch, sie meinig grad nicht.

00:16:17: Aber weißt Du dieses ganz andere Perspektive?

00:16:21: Ganz andere Perspective.

00:16:23: Das geht natürlich wenn Du die Norm kopierst Dann geht das weg.

00:16:29: Das heißt, die Streuung der Antworten nimmt ab.

00:16:33: Bist du in dem Faschismus?

00:16:35: Wo alles was nicht passt passend gemacht wird?

00:16:39: und dann gibt es eine Ausstellung wie entartete Kunst.

00:16:42: weil die Kunst muss genau so aussehen.

00:16:44: Die Menschen müssen genauso aussehen, wie sie regeln sich vorstellt.

00:16:47: Wir machen mit den Wangenknochen, mit den Ohren, mit der Stirn usw.

00:16:50: Und was nicht reinpasst ist entartet und gehört nicht dazu.

00:16:53: Es erhöht aber nicht gerade des Spektrums Und auch nicht die Vielfaltigkeit unserer Angebote oder unsere Gedanken.

00:17:02: Wenn standardisiert und immer mehr eingeengt wird, oder?

00:17:05: Und bildet auch gar nicht unsere menschliche Vielfaltung ab!

00:17:08: Das ist

00:17:09: ja gerade die Schöne daran.

00:17:11: Am Menschen, dass wir uns auch überraschen können.

00:17:13: Exakt!

00:17:13: Ja, wir können noch... Es

00:17:14: gibt den Menschen, die können dann überraschend und die KI wird sich irgendwann nicht mehr überrascht.

00:17:18: Deswegen sind diese Model-Collapsen eigentlich ein ganz ernstes Thema und wir sehen welche Bedeutung Trainingsdaten haben.

00:17:24: Du weigest dich ja manchmal als Social Media Plattformen zu konsultieren oder dich da ... Da dazustellen, was du von Eventualist bist.

00:17:33: Was du für ein Held bist.

00:17:34: Das überlässt du anderen weil du deine Trainingsdaten nicht zur Verfügung stellen willst.

00:17:38: Genau

00:17:38: ich habe kein Account genau so wie es

00:17:39: ist dass du das machst.

00:17:40: wenn andere machen es dann für dich mit glaube mir's.

00:17:42: Ja ich verstehe.

00:17:43: Dann schlüpseln falls im Fake-Account.

00:17:44: Absolut!

00:17:46: Der Punkt ist dass die Trainings Daten und die Daten für die KI immer wertvoller werden.

00:17:50: wir haben ja den Marktwert gerade mal ungefähr grob umrissen geht ja um Milliarden.

00:17:54: jetzt sind wir Medienunternehmen.

00:17:56: Die KI greift auf unsere Inhalte zu.

00:17:58: Also wir haben Redakteure, Journalisten die viele Jahre im Markt arbeiten, die entweder ein Ingenieurstudium haben oder wirklich in dem Markt verwurzelt sind.

00:18:06: Wir sprechen mit den wichtigsten Leuten der Elektronikindustrie und dann kommt es in der Elektronics- oder in der Markt- und Technik.

00:18:11: Das heißt wie wir schreiben das?

00:18:12: Wir haben auch Kosten dafür, wir haben redakteure die wir bezahlen und den Output stellen wir zur Verfügung.

00:18:18: ja.

00:18:19: Wir arbeiten daran und die KI kommt nimmt unseren Inhalt und stellt ihn dann kostenfrei zur Verfügung Verwendet ihn einfach.

00:18:26: Das ist ein Problem und deswegen werden echte Daten, wie sie unsere Fachredakteure und Journalisten liefern zum wirklich knappen und teuren Rohstoff.

00:18:37: Nichtsdestotrotz kümmert es die KI am Bieter gar nicht, sie nehmen's einfach her.

00:18:41: Ja?

00:18:42: Es ist nicht fair!

00:18:43: Die einen haben die Arbeit und zahlen's, die anderen nehmen die Daten her.

00:18:48: Für uns jetzt für unsere Zielgruppe, für unsere Kunden, unsere Nutzer... Wenn Sie sagen, ja ist er dann egal ob meine Pressemeldung oder mein Artikel und mein Fachartikel auf Elektroniknet erscheint oder irgendeiner KI sage ich Ihnen.

00:19:00: Nein das ist nicht egal.

00:19:02: es gibt Studien und da waren riesen Artikel.

00:19:04: werden wir auch ein Podcast dazu machen oder haben vielleicht schon gemacht zum

00:19:09: Thema... Oder werden ihn gemacht habe?

00:19:11: Was erhöht die Sichtbarkeit in der KI?

00:19:14: einfach gesagt?

00:19:15: ... primitiv formuliert, was erhöht die Sichtbarkeit ihres Unternehmens und ihre Produkte in der künstlichen Intelligenz?

00:19:21: Und da gab es einen riesen Artikel in der FHZ.

00:19:24: FH Z kann ich da eben nur ins Herz legen.

00:19:26: Die haben wirklich tolle Beiträge zum Thema KI wie auch die Markt- und Technik.

00:19:30: Und da geht das Ende vom Lied.

00:19:31: ist eigentlich das Third Party... Beiträge, also auf unabhängigen Seiten wie Elektroniknetz zum Beispiel eine viel höhere Sichtbarkeit haben und einen viel besseren Algorithmus erzeugen als auf der eigenen Seite.

00:19:45: Also wenn Sie ein Anbieter sind nutzen sie Third Party sites und schauen Sie das Ihre Meldungen da veröffentlicht werden dann findet die KI sie besser.

00:19:51: und wenn Kaufentscheidungsrelevante Fragen gestellt werden, die werden ja über die KI gestellt.

00:19:57: Liebes Chairman, welches Auto soll ich mir kaufen wenn ich das das das getehr überfüllt haben will.

00:20:02: Dann sagt mir die KI relativ präzise welches auto mir besten stehen würde.

00:20:07: und um diese Daten zu generieren sind third party sites und unentbehrlich wie elektronik net zum Beispiel.

00:20:14: Erinnert mich an den damals revolutionären Algorithmus von Google also brilliant page Die ja auch in die Gewichtung.

00:20:21: also ob ein Treffer gut ist Haben sie immer reingetan.

00:20:24: Damals war es noch so welche Links da drauf verweisen.

00:20:29: Und da waren externe Links mit einer höheren Gewichtung versehen als interne Links durch einen ganz, ganz wichtiger Punkt.

00:20:38: Absolut plausibel!

00:20:39: Da

00:20:40: wurde es ein bisschen konterkariert.

00:20:41: halt doch die Möglichkeit das einfach sich nach vorne kaufen zu können.

00:20:44: aber der Google, also SEO ist ja eine Wissenschaft für sich war's vor zehn Jahren schon und vor fünfzehn Jahren und ist das heute immer noch.

00:20:52: nur es wurde ein bisschen manipuliert.

00:20:55: Ich will noch kurz eine Lanze brechen.

00:20:59: Du hast natürlich jetzt diese Medienperspektive drauf und das ist hochkritisch, und es ist natürlich auch absurd.

00:21:04: also...

00:21:05: Das nervt verstehst du?

00:21:06: Ja total!

00:21:06: Also ich sag zu denen bei euch als wenn ihr redaktionell arbeitet danke dass ihr Trainingsdaten generiert.

00:21:14: Gerne.

00:21:15: Vielen vielen Dank und dass ihr dadurch dann ein Objekt trainiert das euch dann scheinbar entbehrlich macht ja das ist natürlich Wahnsinn.

00:21:23: ne Ich will eine kurze positive Lanze brechen.

00:21:28: Noch mal in die andere Richtung gehen, bei autonomen Fahrzeugen.

00:21:32: Da ist das so.

00:21:33: wir haben im Vergleich zum normalen Fahrverhalten also auf der Straße immer geradeaus nichts passiert.

00:21:39: alles in Ordnung oder mal leichtes abbiegen oder links abbiege rechtsabbiegen da haben wir sehr viele Trainingsdaten.

00:21:44: Wir haben aber sehr wenig Trainings Daten zu Unfällen und deswegen gibt es in der Tat Anbieter die erzeugen synthetische Unfallzahlen Und das war das falsche.

00:21:58: synthetische Unfallabläufe und Daten, also Zahlen ja in gewisser Weise.

00:22:04: Aber synthetisch Unfalldaten um damit das Modell zu trainieren.

00:22:09: Also Motto du hast einmal irgendeinen Elch der dann vor dem Auto läuft oder ist halt super selten.

00:22:14: diese Elche laufen kaum vor die Autos?

00:22:16: Wir wünschen nicht so viel.

00:22:17: Super

00:22:18: seltsam!

00:22:18: Rindviecher ja Elche wie ich.

00:22:20: Genau.

00:22:22: wird dann eben rumpermotiert.

00:22:23: Die erfassen dann Bewegungsabläufe von Elchen und lassen virtuell simuliert Tausende von Elchens in unterschiedlichen Konstellationen vor modellierte Autos laufen, und dann unterschiedliche Ausweichmanöver probieren.

00:22:40: Und das finde ich sinnvoll!

00:22:42: Weil die Trainingsdaten liefern dann Inputs für echt seltene Ereignisse, die aber sehr wichtig sind.

00:22:52: Ja, rare but irrelevant.

00:22:56: Und da finde ich diese synthetischen Daten sind eine sehr gute Idee.

00:22:59: Klar.

00:23:00: Trotzdem echte Daten sind nicht nur nützlich sondern es ist auch eine zentrale Voraussetzung dafür dass Modelle nicht in ihren eigenen Spuren stecken bleiben.

00:23:08: Total!

00:23:09: Meinst du das dieser Model Collapse?

00:23:11: Diese Autophagie der künstlichen Intelligenz um Selbstverzehrung und künstliche Intelligenzen überhaupt noch verhindert werden kann.

00:23:19: jetzt

00:23:20: also ein Das wird passieren.

00:23:23: Jetzt, also jetzt zum Zeitpunkt der Aufnahme.

00:23:26: Wir sind jeweils ein bisschen historisch doch verankert.

00:23:29: Zum Zeitpunkt die Aufnahme sind etwa... ...großen und ganzen.

00:23:33: Fünfzig Prozent der Daten sind noch Menschen gemacht.

00:23:37: Wie viel Prozent?

00:23:37: Fünfzig

00:23:38: Prozent!

00:23:38: Etwa so.

00:23:39: Also vielleicht ein bisschen weniger inzwischen aber das ist auch okay.

00:23:44: wenn wir jetzt in einer Lehrveranstaltung, wenn ich jetzt sage im Großen und Ganzen, Fifty-Fifty.

00:23:49: Ja, das ist noch eine Art.

00:23:50: Um zwanzig dreißig Stichwort Exponentialität wird das ja ein ganz geringer Teil noch sein.

00:23:58: Nur zwanziger Prozent wahrscheinlich, vielleicht sogar nur zehn Prozent wegen der Exponenzialität und in fünfzehn Jahren wenn sie den Podcast anhören da werden Sie natürlich jetzt ganz einen lieben.

00:24:10: Gruß jetzt an unseren Nachkommen die uns dann jetzt hören tut mir leid dass wir das mit dem Klimawandel nicht richtig hinbekommen haben und es mit den Kriegen tut uns auch total leid.

00:24:20: Kurze Entschuldigung an der Richtung, einer Stelle.

00:24:22: Aber es ist schön, dass ihr noch da seid und die KI ist ja auch noch da.

00:24:25: Genau!

00:24:25: Und ihr lacht natürlich jetzt ne?

00:24:27: Also sie niegen das jetzt anhören... ...twanzigvierzig.

00:24:30: Die lachen natürlich jetzt weil dann zu dem Zeitpunkt sind natürlich ne ninety Prozent der Daten KI generiert.

00:24:36: Verstehst du?

00:24:37: Wahrscheinlich Ja, weil der Input halt so hoch ist.

00:24:40: Das geht ja genauso in die Exponentialität rein.

00:24:44: Das heißt für die ist da natürlich die Frage des Modell-Kollaps ist natürlich eine immens wichtige.

00:24:52: Aber wir kriegen es ja trotzdem auch immer wieder hin, vielleicht wenn du dir die Evolution anguckst Ja?

00:24:57: Wir haben ja immer wieder auch Mutationen.

00:25:00: Das ist ja auch nicht so dass unsere Spezies komplett degeneriert.

00:25:04: Weißt Du das jetzt nicht der Haken Obwohl der Genpool ja auch nur innerhalb gewisser Grenzen mutieren kann Verstehst Du?

00:25:12: Das heißt insgesamt geht das ja auch ohne dass dauernd neues reinkommt.

00:25:18: Wer weiß, wie das damit der Gentechnik wird?

00:25:20: Das war ein anderes Thema.

00:25:21: Wir machen die Gentechnikausgründen der weiteren Optimierung und der Kommerzialisierung aber nicht deswegen weil unsere Spezies genetisch degeneriert ist.

00:25:29: Das ist nicht der Grund!

00:25:31: Auch wenn es oft so rüberkommt...

00:25:33: auch wenn es so oft mal wieder so wirkt in den aktuellen

00:25:35: Niedern.

00:25:36: Muss man eine Lanze für die Jugend brechen?

00:25:38: Klar schimpfen die Alten immer über die Jungen oder was?

00:25:40: Absolut,

00:25:41: aber das tun sie seit der Antike.

00:25:42: So genau da vor schon wahrscheinlich schon in der Höhle.

00:25:46: wird sich ein Zweiundzwanzigjähriger aufgeregt haben.

00:25:49: Der Senior in der Gruppe, worum die Elb-Jährige das Reh so schlecht auslegt und dass die Elfjährigen nicht mehr diese Jungen ...

00:25:57: So ist es ja?

00:25:58: Also das ist glaube ich so alt wie die Menschheit.

00:26:01: Nichtsdestotrotz glaube ich auch, da ist die Jugend immer... tolle Leute hervorbringen und dass sie auch z.B.

00:26:06: höflich sind, ja?

00:26:07: Und sind nicht alle total gestört durch die Nutzung von mobilen Endgeräten?

00:26:12: also es gibt wirklich eine Jugend, die ihr Mut machen kann.

00:26:16: Ist das so trotz wenn Sie eben sich nicht mehr informieren können aus echten Quellen oder nur noch aus KI generierten wird die Gefahr, dass die Fehlinformation aufliegen immer größer.

00:26:27: Meine Frage ist was soll ich machen wenn ich sagen möchte mich ... umfassend informieren.

00:26:33: Man möchte nicht komplett verarscht werden von irgendwelchen Anbietern, die mir vorschreiben was ich zu kaufen... ...zu wissen und zu lesen und zu denken habe.

00:26:40: Was soll ich dann da machen?

00:26:42: Praxis-Tipp wenn du weißt worauf ich hinaus bin!

00:26:49: Also es gibt so ein paar digitale Anbiter beispielsweise,... ...die lesen verschiedene Medienangebote... ...und fassen die für dich zusammen und präsentieren eine balancierte Sicht.

00:27:00: Das heißt also das sind so Meternachrichtenanbieter.... Die lesen dann entweder alles was sie zur verfügung haben oder deine abos.

00:27:09: Und machen dann eine balans daraus.

00:27:11: ja so dass man dann sehen kann das in den usa ist sehr beliebt nach dem motto, was übersieht das konservative spektrum?

00:27:18: Was sieht das also republikanische spektron und was über sieht das demokratische spektor beispielsweise?

00:27:24: das kann man so machen dass du denn das versuchst da zu legen einem eine möglichkeit.

00:27:28: also erster tipp wäre digitale tools.

00:27:31: Das wäre eine Möglichkeit, mit der man arbeiten kann.

00:27:33: Motto such mir gezielt verschiedene Quellen für eine Möglichkeit mit dem man arbeiten können.

00:27:39: Was anderes hast du vielleicht auch mehrere Identitäten, mit denen du arbeiten kannst.

00:27:43: Digitale Identitäten.

00:27:46: Ich habe für verschiedene Fragestellungen und für verschiedene Projekte hab ich unterschiedliche Identitäten mit den ich mich beschäftige.

00:27:55: das hängt auch teilweise mit Organisationen zusammen mit denen ich zusammen arbeite bin in jedem.

00:28:00: Ich habe für verschiedene Länder, habe ich auch verschiedene Accounts beispielsweise und das sozusagen so ein bisschen abzutrennen.

00:28:06: Damit ich so ein wenig wegkomme von der Einfalt die sich eben durch den Kollaps ergibt.

00:28:13: Wenn du Anbieter bist ist es eine sehr gute Idee alte Daten zu anotieren.

00:28:18: Es wäre sinnvoll solche Sachen wie die Wayback Machine im Internet, also diese bei den alten Seiten abgespeichert werden.

00:28:26: Die mal zu ziehen und abzusichern weil es gibt ja bestimmte Zeitpunkte zudem noch aller Inhalt ist heute absurd.

00:28:34: Wie gesagt Fifty-Fifty.

00:28:36: aber es gab eine Zeit da waren alle Inhalte die man... Alle Zahlen!

00:28:44: Alle Informationen seines olfaktorische Informationen, visuelle akustische was auch immer.

00:28:51: War alles Menschen gemacht.

00:28:52: It's crazy!

00:28:53: Aber das gab es mal zu einer Zeit... Es ist sinnvoll, dass auch mal zu archivieren.

00:28:59: Das ist gar nicht so lang her.

00:29:00: Ja ich weiß.

00:29:02: Da waren wir schon auf der Welt?

00:29:03: Ich war sogar schon volljährig.

00:29:06: Ich glaube schon kurz zum Renten eintritt.

00:29:08: Schon aber unsere Hörer aus der Zukunft die weißt du für diese ist total lustig.

00:29:16: Kann ich dir noch zwei ganz absurde Praxistipps mitgeben?

00:29:19: Aus persönlicher Interesse.

00:29:20: Erzähl

00:29:20: mal, ja!

00:29:21: Das

00:29:21: erste ist hol die immer echte Quellen zurück in den Prozess.

00:29:25: Wow!

00:29:25: Ja

00:29:26: am stabilsten bleiben diese Systeme nämlich dann wenn regelmäßig Frischissen und zwar nicht synthetisches und KI generiertes Material eingebracht wird.

00:29:34: Guter Punkt.

00:29:34: Den Nutzer oder deine Studenten... Also wie sagst du Studierende sagst Du?

00:29:38: Wir haben früher Studentinnen und Studenten gesagt.

00:29:40: Der Studierenden heißt das Ganze praktisch arbeitet mit Originaltexten.

00:29:46: Hört

00:29:47: ihr das?

00:29:48: Das sagt jemand, der nicht in der Wissenschaft ist und er hat exakt Recht.

00:29:51: Ich habe studiert aber ich bin so wie ich nicht wissenschaftlich bin, ich wollte halt Geld verdienen.

00:29:56: Echten Mitschrift, Entschuldigung!

00:29:58: Alles okay.

00:29:59: Ich wollte ihn nicht verletzen.

00:30:01: Danke

00:30:01: für die Einladung heute beim Essen.

00:30:03: Und Primärquellen arbeiten statt nur bereits gekletterten glattgezogenen Zusammenfassungen aus KI, die immer eine Manipulation unterlegt.

00:30:12: Und der letzte Tipp, das wäre glaube ich der vierte oder so für uns ist erschätzt die redaktionelle Arbeit.

00:30:19: Denn sie liefert nicht nur reale Trainingsdaten sondern sie liefert auch einen relativ direkten Weg zu wissen und zwar maximal – nicht maximal aber in der Regel nur durch ein zwei Katalysatoren durchgegangene Informationen und nicht durch eine KI durchgegangen ist.

00:30:37: Deswegen redaktionelle Arbeit, wie sie die Markt- und Technik, die Elektronik, Elektronegnet und vergleichbare Mitbewerber bietet nutzt das und schätzt die Arbeit denn die machen echt einen tollen Job.

00:30:51: Lass mich da ergänzen zu beiden Punkten.

00:30:52: Das eine ist mit dieser Originalquellenarbeit in der Wissenschaft unterscheiden wir zwischen diese Quelle und Sekundärquelle.

00:30:59: zitiert nach Du hast ein kleines Pierrotier gesprochen für, guck dir mal die Originalquelle an.

00:31:05: Denn vielleicht wurde die zitiert Nachquelle.

00:31:08: hat die das falsch verstanden?

00:31:10: Versuch das Original zu finden!

00:31:11: In der Wissenschaft ist das ein ganz, ganz wichtiger Aspekt...

00:31:14: Ist ja krass, z.B.

00:31:15: Machiavelli, der Prinzschippel.

00:31:18: Lies fast keiner im Original.

00:31:19: Jeder kennt Machiaveli seine Ideen und seine Frustration die er hatte weil er eben verstoßen worden ist und echt Probleme hat mit seinem Fürsten einer guten alten Medici.

00:31:29: und war Medici oder?

00:31:32: Da war er links außen von in der Mainland damals.

00:31:34: Und hatte echt Probleme und gibt seinen Frust wieder in seinem Buch, aber fast keiner hat es original gelesen, was auch echt schwer zu lesen ist, sondern die meisten zitieren nur.

00:31:43: Immer wenn jemand böse ist als Politiker, ist das makiavalistisch.

00:31:48: Ja genau, da muss automatisch schlecht sein.

00:31:50: Aber immer Originalquellen liest, kommt man teilweise auf ganz andere Gedanken

00:31:53: oder zumindest auf eine differenziertere Sicht.

00:31:55: Kann jedem nur empfehlen!

00:31:56: Ich würde

00:31:57: auch diesen Podcast im Original anhören, übrigens.

00:32:00: Und nicht die KI generierte Version, die es ja auch schon gibt?

00:32:03: Genau richtig!

00:32:03: Die ganzen AI-Bots, die sozusagen einfach seine Texte runtergeladen haben und meine Texte... Genau, genau.

00:32:09: Kann man auch miteinander reden lassen.

00:32:11: Zu deinem letzten Punkt will ich auch nochmal unterstreichen.

00:32:13: Ein super Punkt von dir.

00:32:16: Gibt eure redaktionelle Arbeit und es gibt auch unsere wissenschaftliche Arbeit.

00:32:20: Unser Artikel.

00:32:21: Ja,

00:32:23: also wir erheben auch Daten.

00:32:26: Wir erheben auch Daten, wir machen damit Analysen und wir schreiben dann die Artikel dazu.

00:32:31: Die auch dann wieder Trainingsdatenbasis werden.

00:32:36: Und auch diesen selbst gemacht.

00:32:37: Teilweise hilft da auch KI beispielsweise wenn man Mitautoren hat... ...die der Weltsprache der Wissenschaft das ist inzwischen Englisch... ...nünzundhundertdreißig rum war es noch Deutsch Sprache Nummer eins der Wissenschaft war.

00:32:52: deutsch hat sich dann erledigt.

00:32:56: Die haben Schwierigkeiten mit Deutsch und da hilft dann eine KI beispielsweise bei der Übersetzung.

00:33:02: Also aus meiner Sicht gewinnbringend, aber auch hier wird Wissen geschaffen im Sinne der Wissenschaft und das ist wichtig für die Trainingsdaten.

00:33:14: War ein sehr spannender Podcast Matthias.

00:33:17: Model Collapse Thema Autophagie Thema Selbstverzerrung Was?

00:33:22: Der Sehscheide gebracht.

00:33:26: Ja,

00:33:27: ganz hemsämliges Beispiel.

00:33:29: Und ihn zu Hause empfehle ich das Lied Mein Teil von Rammstein zu hören.

00:33:34: Das könnte mich auch verlinken Michael hört sich das mal ruhig an ist ein tolles Lied tolle Band.

00:33:40: Heute treffe ich einen Herrn.

00:33:41: der hat mich zum Fressen gern um halt über Nacht zu denken was passiert wenn man selbst verzehrt.

00:33:45: wird es nicht so toll.

00:33:47: Ist oft nicht so gut ja absolut.

00:33:48: Deswegen

00:33:49: verfolgen Sie weiterhin journalistische Inhalte wie wir sie anbieten und andere und bleiben Sie uns gewogen.

00:33:55: Wir hören uns nächste Woche spätestens wieder zu unserem Podcast, wo sie uns spürle Menschmaschine morgen.

00:34:02: Danke Matthias!

Shownotes

Transkript anzeigen

Neuer Kommentar