@harcesz
Nie mam pretensji do Ciebie, tylko informuję o klikbajtowym tytule artykułu. Spiracić coś, to znaczy udostępniać nieautoryowane treści i kopie, a zarzuty są o to, że w czasie uczenia SI boty wykorzystay treść z nielegalnych źródeł. "Gildia Autorów jest jednak przekonana, że zbiory danych używane do treningu modelu językowego ChatGPT mogły być pobierane także z nielegalnych źródeł."
Szczerze myślałem, że GPT coś odpalil w związku z książkami, jakieś przeredagowane treści (książka innymi słowami napisana) wypuścił, czy coś, a tu zwykly spór o źródło danych. W USA jest z tym wieki probem, bo na studiach zrobisz kopię książki na własny użytek i jesteś piratem.
Spiracić coś, to znaczy udostępniać nieautoryowane treści i kopie
Jak dla mnie raczej stworzyć nieautoryzowaną kopię. Niestety SJP PWN milczy w tej kwestii, więc jest to chyba kwestia uznaniowa. Żeby model AI mógł operować na danych z danej książki zapewne ma jej treść, więc przy definicji, która wydaje mi się bardziej naturalna miałoby to sens, zresztą sam się odnosisz do takiej formy “piractwa” odnośnie stanów, których tekst dotyczy.
Pisarze jako argument powołują się też na inne działanie ChatGPT. Chatbot, zapytany o źródło swoich informacji na temat treści książek, zapewnia, że znajdują się one w jego bazie danych.
jeżu drogi, kiedy ludzie się nauczą że ChatGPT randomowo mówi sobie na co ma ochotę, i nie ma to żadnego przełożenia na stan faktyczny
benchmark.pl
Aktywne