270 Terabyte Bรผcher fรผr’s KI Training geklaut

๐—ก๐˜‚๐—ป ๐—ถ๐˜€๐˜ ๐—ผ๐—ณ๐—ณ๐—ฒ๐—ป๐—ฏ๐—ฎ๐—ฟ ๐—ฑ๐—ถ๐—ฒ ๐—ž๐—ฎ๐˜๐˜‡๐—ฒ ๐—ฎ๐˜‚๐˜€ ๐—ฑ๐—ฒ๐—บ ๐—ฆ๐—ฎ๐—ฐ๐—ธ!

Wie mehrere Medien berichten (z.B. https://lnkd.in/e-bvsSX8) hat Meta jetzt bestรคtigt, fรผr das Training ihrer KI auf die illegale Raubkopie-Bรผcherei LibGen zurรผckgegriffen zu haben.

In der Begrรผndung heiรŸt es, dass Bรผcher natรผrlich die beste Quelle fรผr’s KI-Training sind, da sie sprachlich, inhaltlich und thematisch hรคufig besser sind als irgendwelche kurzen Schnipsel aus Social Media (logisch). Es handle sich dabei um „gut geschriebene Darstellungen der menschlichen Sprache“.

๐——๐—ฒ๐˜€๐—ต๐—ฎ๐—น๐—ฏ ๐˜„๐˜‚๐—ฟ๐—ฑ๐—ฒ๐—ป ๐˜€๐—ฎ๐—ด๐—ฒ ๐˜‚๐—ป๐—ฑ ๐˜€๐—ฐ๐—ต๐—ฟ๐—ฒ๐—ถ๐—ฏ๐—ฒ ๐Ÿฎ๐Ÿณ๐Ÿฌ ๐—ง๐—ฒ๐—ฟ๐—ฎ๐—ฏ๐˜†๐˜๐—ฒ ๐—•๐˜‚ฬˆ๐—ฐ๐—ต๐—ฒ๐—ฟ (๐—ฐ๐—ฎ. ๐Ÿณ.๐Ÿฑ ๐— ๐—ถ๐—น๐—น๐—ถ๐—ผ๐—ป๐—ฒ๐—ป ๐—•๐˜‚ฬˆ๐—ฐ๐—ต๐—ฒ๐—ฟ ๐˜‚๐—ป๐—ฑ ๐Ÿด๐Ÿฌ ๐— ๐—ถ๐—น๐—น๐—ถ๐—ผ๐—ป๐—ฒ๐—ป ๐˜„๐—ถ๐˜€๐˜€๐—ฒ๐—ป๐˜€๐—ฐ๐—ต๐—ฎ๐—ณ๐˜๐—น๐—ถ๐—ฐ๐—ต๐—ฒ ๐—ฆ๐˜๐˜‚๐—ฑ๐—ถ๐—ฒ๐—ป) ๐—ด๐—ฒ๐—ธ๐—น๐—ฎ๐˜‚๐˜ – ๐—ฎ๐—ป๐—ฑ๐—ฒ๐—ฟ๐˜€ ๐—ธ๐—ฎ๐—ป๐—ป ๐—บ๐—ฎ๐—ป ๐—ฑ๐—ฎ๐˜€ ๐—ป๐—ถ๐—ฐ๐—ต๐˜ ๐˜€๐—ฎ๐—ด๐—ฒ๐—ป. ๐—จ๐—ฟ๐—ต๐—ฒ๐—ฏ๐—ฒ๐—ฟ๐—ฟ๐—ฒ๐—ฐ๐—ต๐˜๐—น๐—ถ๐—ฐ๐—ต ๐—ถ๐˜€๐˜ ๐—ฑ๐—ฎ๐˜€ ๐—ป๐—ฎ๐˜๐˜‚ฬˆ๐—ฟ๐—น๐—ถ๐—ฐ๐—ต ๐—ฒ๐—ถ๐—ป ๐—ฎ๐—ฏ๐˜€๐—ผ๐—น๐˜‚๐˜๐—ฒ๐˜€ ๐—ก๐—ผ-๐—š๐—ผ.

Nun kann man argumentieren, dass Meta die Daten ja schlieรŸlich nicht selbst geklaut hat, sondern „lediglich“ einen illegal kuratierten Bestand fรผr’s Training genutzt hat. Und man kann argumentieren, dass das Training von KI ja noch keine Urheberrechtsverletztung darstellt. รœber all das werden Gerichte entscheiden.

๐— ๐—ฎ๐—ป ๐—ธ๐—ฎ๐—ป๐—ป ๐—ฎ๐—ฏ๐—ฒ๐—ฟ ๐—ฒ๐—ฏ๐—ฒ๐—ป๐—ณ๐—ฎ๐—น๐—น๐˜€ ๐—ฒ๐—ถ๐—ป๐—บ๐—ฎ๐—น ๐—บ๐—ฒ๐—ต๐—ฟ ๐˜€๐—ฒ๐—ต๐—ฒ๐—ป: ๐˜„๐—ฎ๐˜€ ๐—ด๐—ฒ๐—บ๐—ฎ๐—ฐ๐—ต๐˜ ๐˜„๐—ฒ๐—ฟ๐—ฑ๐—ฒ๐—ป ๐—ธ๐—ฎ๐—ป๐—ป ๐˜„๐—ถ๐—ฟ๐—ฑ ๐—ด๐—ฒ๐—บ๐—ฎ๐—ฐ๐—ต๐˜ – ๐—ผ๐—ต๐—ป๐—ฒ ๐—ฅ๐˜‚ฬˆ๐—ฐ๐—ธ๐˜€๐—ถ๐—ฐ๐—ต๐˜ ๐—ฎ๐˜‚๐—ณ ๐—ฅ๐—ฒ๐—ฐ๐—ต๐˜, ๐—š๐—ฒ๐˜€๐—ฒ๐˜๐˜‡๐˜, ๐—จ๐—ฟ๐—ต๐—ฒ๐—ฏ๐—ฒ๐—ฟ. ๐—จ๐—ป๐—ฑ ๐—บ๐—ฎ๐—ป ๐—ธ๐—ฎ๐—ป๐—ป ๐˜€๐—ถ๐—ฐ๐—ต ๐˜€๐—ถ๐—ฐ๐—ต๐—ฒ๐—ฟ ๐˜€๐—ฒ๐—ถ๐—ป, ๐—ฑ๐—ฎ๐˜€๐˜€ ๐— ๐—ฒ๐˜๐—ฎ ๐—ป๐—ถ๐—ฐ๐—ต๐˜ ๐—ฑ๐—ถ๐—ฒ ๐—ฒ๐—ถ๐—ป๐˜‡๐—ถ๐—ด๐—ฒ๐—ป ๐˜€๐—ถ๐—ป๐—ฑ, ๐—ฑ๐—ถ๐—ฒ ๐˜€๐—ผ ๐—ฎ๐—ฟ๐—ฏ๐—ฒ๐—ถ๐˜๐—ฒ๐—ป. ๐——๐—ถ๐—ฒ ๐—ต๐—ฎ๐˜’๐˜€ ๐—ต๐—ฎ๐—น๐˜ ๐—ท๐—ฒ๐˜๐˜‡๐˜ ๐—ฒ๐—ฟ๐˜„๐—ถ๐˜€๐—ฐ๐—ต๐˜ ๐˜‚๐—ป๐—ฑ ๐˜€๐—ถ๐—ป๐—ฑ ๐—ฎ๐˜‚๐—ณ๐—ด๐—ฒ๐—ณ๐—น๐—ผ๐—ด๐—ฒ๐—ป.

๐—ฆ๐—ฐ๐—ต๐—ผฬˆ๐—ป๐—ฒ ๐—ป๐—ฒ๐˜‚๐—ฒ ๐—ช๐—ฒ๐—น๐˜!

P.S.: aktuell sind die Nutzer von LLM’s fรผr deren Ergebnisse verantwortlich, d.h. wenn Sie jetzt das Llama-Modell von Meta verwenden und der damit generierte Text Inhalte aus den illegal verwendeten Trainingsdaten nutzt, sind Sie in der Verantwortung dafรผr – nicht Meta!

Hashtag#informatikersindcool Hashtag#kiistdaundbleibt