Nun ist es also so weit… in einem neuen Paper (https://lnkd.in/eADdp5r6) belegen einige Kollegen der Standord und der Rice University das, was mich schon lรคnger beschรคftigt:
๐๐ฟ๐ฎ๐ถ๐ป๐ถ๐ฒ๐ฟ๐ ๐บ๐ฎ๐ป ๐๐ ๐บ๐ถ๐ ๐๐-๐ด๐ฒ๐ป๐ฒ๐ฟ๐ถ๐ฒ๐ฟ๐๐ฒ๐ป ๐ง๐ฟ๐ฎ๐ถ๐ป๐ถ๐ป๐ด๐๐ฑ๐ฎ๐๐ฒ๐ป, ๐๐ฒ๐ฟ๐ฑ๐ฒ๐ป ๐ฑ๐ถ๐ฒ ๐๐ฟ๐ด๐ฒ๐ฏ๐ป๐ถ๐๐๐ฒ ๐๐ฐ๐ต๐น๐ฒ๐ฐ๐ต๐๐ฒ๐ฟ (d.h. sie werden falscher und gleichen sich immer mehr).
Am Beispiel der Bildgenerierung wird dieser Effekt in dem Paper eindrucksvoll gezeigt, generell betrifft dies aber jede Art von generativer KI! Also auch, wenn man bspw. Chat-GPT mit von Chat-GPT generierten Daten trainiert… KI kannibalisiert sich dann irgendwann selbst.
Aktuell leben wir in einem Zeitalter, in dem das Verhรคltnis von generierten zu echten Daten noch sehr gรผnstig ist (KI beginnt ja gerade erst). Allerdings รคndert sich das rapide. Und das bedeutet, dass wir bald nichts mehr haben, womit wir die KI’s sinnvoll trainieren kรถnnen (ohnehin sind in den groรen Sprachmodellen bereits nahezu alle verfรผgbaren Daten eintrainiert).
Denn auch wenn permanent neue Informationen produziert werden – wenn wir nicht unterscheiden kรถnnen, was menschen-generiert und was KI-generiert ist, dann kรถnnen wir nichts mehr qualifiziert zum Training verwenden, d.h. unsere KI’s werden irgendwann nicht mehr besser.
๐๐ฒ๐ฟ๐ฎ๐ฑ๐ฒ ๐ณ๐ฬ๐ฟ ๐จ๐ป๐๐ฒ๐ฟ๐ป๐ฒ๐ต๐บ๐ฒ๐ป ๐ถ๐๐ ๐ฑ๐ฎ๐ ๐ฑ๐ฒ๐ฟ ๐ฏ๐น๐ฎ๐ป๐ธ๐ฒ ๐๐ผ๐ฟ๐ฟ๐ผ๐ฟ!
Sobald die Mitarbeiter Ihres Unternehmens beginnen, unkontrolliert / ungefรผhrt Generative KI einzusetzen, schaufeln Sie sich damit selbst Ihr potenzielles Daten-Grab, weil Sie sich irgendwann nicht mehr auf Ihre Daten verlassen kรถnnen. Und Ihre Daten sind Ihr Kapital…
๐๐ฎ๐ต๐ฒ๐ฟ ๐บ๐๐๐ ๐ฎ๐ธ๐๐๐ฒ๐น๐น ๐ฑ๐ถ๐ฒ ๐ผ๐ฏ๐ฒ๐ฟ๐๐๐ฒ ๐ฃ๐ฟ๐ถ๐ผ๐ฟ๐ถ๐๐ฎฬ๐ ๐๐ฒ๐ถ๐ป, ๐๐-๐๐ฎ๐๐ฒ๐ป ๐๐ ๐ธ๐ฒ๐ป๐ป๐๐ฒ๐ถ๐ฐ๐ต๐ป๐ฒ๐ป!
In der รffentlichkeit schwierig bis unmรถglich, im Unternehmen aber zum Glรผck umsetzbar.
Wenn Sie nicht wissen, wie Sie das bewerkstelligen sollen, sprechen Sie mich an!
—
P.S.: natรผrlich gibt es auch Anwendungsfรคlle, wo synthetische Daten sehr hilfreich sind. Dies sind aber punktuelle Ausnahmen und nicht die allgemeine Regel.
P.P.S.: hier einige meiner vorherigen Posts zu diesem Thema:
https://lnkd.in/eY8rC8C7
https://lnkd.in/e3bcJ_92
https://lnkd.in/efAex_M2
https://lnkd.in/eHZMm6KZ
P.P.P.S.: das Titelbild habe ich mit Midjourney generiert. Denn noch funktioniert unsere Generative KI ๐
