KI-generierte Informationen markieren!

Nun ist es also so weit… in einem neuen Paper (https://lnkd.in/eADdp5r6) belegen einige Kollegen der Standord und der Rice University das, was mich schon länger beschäftigt:

𝘁𝗿𝗮𝗶𝗻𝗶𝗲𝗿𝘁 𝗺𝗮𝗻 𝗞𝗜 𝗺𝗶𝘁 𝗞𝗜-𝗴𝗲𝗻𝗲𝗿𝗶𝗲𝗿𝘁𝗲𝗻 𝗧𝗿𝗮𝗶𝗻𝗶𝗻𝗴𝘀𝗱𝗮𝘁𝗲𝗻, 𝘄𝗲𝗿𝗱𝗲𝗻 𝗱𝗶𝗲 𝗘𝗿𝗴𝗲𝗯𝗻𝗶𝘀𝘀𝗲 𝘀𝗰𝗵𝗹𝗲𝗰𝗵𝘁𝗲𝗿 (d.h. sie werden falscher und gleichen sich immer mehr).

Am Beispiel der Bildgenerierung wird dieser Effekt in dem Paper eindrucksvoll gezeigt, generell betrifft dies aber jede Art von generativer KI! Also auch, wenn man bspw. Chat-GPT mit von Chat-GPT generierten Daten trainiert… KI kannibalisiert sich dann irgendwann selbst.

Aktuell leben wir in einem Zeitalter, in dem das Verhältnis von generierten zu echten Daten noch sehr günstig ist (KI beginnt ja gerade erst). Allerdings ändert sich das rapide. Und das bedeutet, dass wir bald nichts mehr haben, womit wir die KI’s sinnvoll trainieren können (ohnehin sind in den großen Sprachmodellen bereits nahezu alle verfügbaren Daten eintrainiert).

Denn auch wenn permanent neue Informationen produziert werden – wenn wir nicht unterscheiden können, was menschen-generiert und was KI-generiert ist, dann können wir nichts mehr qualifiziert zum Training verwenden, d.h. unsere KI’s werden irgendwann nicht mehr besser.

𝗚𝗲𝗿𝗮𝗱𝗲 𝗳𝘂̈𝗿 𝗨𝗻𝘁𝗲𝗿𝗻𝗲𝗵𝗺𝗲𝗻 𝗶𝘀𝘁 𝗱𝗮𝘀 𝗱𝗲𝗿 𝗯𝗹𝗮𝗻𝗸𝗲 𝗛𝗼𝗿𝗿𝗼𝗿!

Sobald die Mitarbeiter Ihres Unternehmens beginnen, unkontrolliert / ungeführt Generative KI einzusetzen, schaufeln Sie sich damit selbst Ihr potenzielles Daten-Grab, weil Sie sich irgendwann nicht mehr auf Ihre Daten verlassen können. Und Ihre Daten sind Ihr Kapital…

𝗗𝗮𝗵𝗲𝗿 𝗺𝘂𝘀𝘀 𝗮𝗸𝘁𝘂𝗲𝗹𝗹 𝗱𝗶𝗲 𝗼𝗯𝗲𝗿𝘀𝘁𝗲 𝗣𝗿𝗶𝗼𝗿𝗶𝘁𝗮̈𝘁 𝘀𝗲𝗶𝗻, 𝗞𝗜-𝗗𝗮𝘁𝗲𝗻 𝘇𝘂 𝗸𝗲𝗻𝗻𝘇𝗲𝗶𝗰𝗵𝗻𝗲𝗻!

In der Öffentlichkeit schwierig bis unmöglich, im Unternehmen aber zum Glück umsetzbar.

Wenn Sie nicht wissen, wie Sie das bewerkstelligen sollen, sprechen Sie mich an!



P.S.: natürlich gibt es auch Anwendungsfälle, wo synthetische Daten sehr hilfreich sind. Dies sind aber punktuelle Ausnahmen und nicht die allgemeine Regel.

P.P.S.: hier einige meiner vorherigen Posts zu diesem Thema:
https://lnkd.in/eY8rC8C7
https://lnkd.in/e3bcJ_92
https://lnkd.in/efAex_M2
https://lnkd.in/eHZMm6KZ

P.P.P.S.: das Titelbild habe ich mit Midjourney generiert. Denn noch funktioniert unsere Generative KI 🙂