Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

damtux@feddit.it · 2 years ago

Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

fran@feddit.it · 2 years ago

Dovrebbero essere gli utenti a essere pagati

damtux@feddit.it · 2 years ago

sì, ma abbiamo già visto come funziona…é la stessa dinamica di Duolingo! Le persone dedicano gratuitamente per anni il proprio tempo e le proprie conoscenze alla crescita di una “community” (molto virgolettato) proprietaria che ad un certo punto prende quel valore e decide di rivenderselo senza remunerare chi lo ha creato.

Alessandro@mastodon.uno · edit-2 2 years ago

deleted by creator

damtux@feddit.it · 2 years ago

hai ragione…e pensare che nella fase iniziale di Reddit c’era un certo Aaron Schwartz! Penso che si rivolterebbe nella tomba se conoscesse l’attuale evoluzione degli eventi

Moonrise2473@feddit.it · 2 years ago

Sempre più contento di aver azzerato un decennio di contenuti

kingmongoose7877@lemmy.ml · 2 years ago

Ho visto questo articolo su un’altro sito, che mi ha fatto riflettere…

Né Lemmy né il fediverso né Activity Pub fa qualsiasi garanzia contro il raccogliere dati dai terzi, AI o no. Qualcuno mi correga se erro, grazie.

Cuche@cuche.cc · 2 years ago

@kingmongoose7877 Non erri, anzi: ogni post che scrivi viene recapitato e salvato nei database di tutte le istanze che sono a conoscenza del tuo utente per porterne permettere l’interazione.
Di conseguenza, a farla paranoica, un amministratore malevolo che vuole minare dati lo può fare “in casa” tanto i contenuti arrivano da sé.
Se uno tiene veramente tanto alla privacy, il fediverso non è un buon posto.

@damtux @lealternative

damtux@feddit.it · 2 years ago

essendo siti pubblici ed indicizzabili dai motori di ricerca mi sembra abbastanza ovvio che non possano dare garanzie…perché sostanzialmente non dipende solo da loro! Sono i colossi dietro alle AI che spesso hanno scelto di addestrarle su contenuti pubblicamente disponibili online (questo però non significa che la licenza di quei dati glielo permettesse, come è emerso in diverse occasioni).

La differenza qui è che si parla di monetizzazione volontaria da parte di Reddit di quei dati che essa stessa ospita (e che ha ricevuto gratuitamente dagli utenti). Quindi se i social del Fediverso potrebbero opporsi, Reddit invece gli ha aperto la porta.

kingmongoose7877@lemmy.ml · 2 years ago

SE (scritto con i caratteri 2m alti dipinti arancione) gli instance del fediverso POTREBBERO opporsi, finora non vedo nessuna mossa in quella direzione, neanche un robots.txt. Reddit, monetizzando i dati contenuti, ha messo un cartello alla porta, “Il negozio è aperto!” Il Fediverso semplicemente lascia la porta spalancata, non c’è nessuno a casa e il cane di guardia ~~dorme~~ è morto. Effettivamente non c’è differenza di “quei dati che ospita” Reddit o Lemmy. Correzioni sono sempre gradite.

damtux@feddit.it · 2 years ago

su Mastodon c’è l’opzione per non permettere l’indicizzazione del profilo da parte dei motori di ricerca (concordo sul fatto che non sia molto però almeno siamo al livello del robots.txt). La difficoltà maggiore è data dal meccanismo di funzionamento delle istanze…ad es. un’istanza può essere più rigorosa, un’altra più morbida ma i contenuti di un utente (specie se pubblica contenuti pubblici) saranno presenti su entrambe le istanze (perché vengono “ricopiati” per chi segue quell’utente dalla seconda istanza). In questo caso è difficile opporsi integralmente, visto che entrambe presentano il contenuto e una lo protegge mentre l’altra meno

Novman@feddit.it · edit-2 2 years ago

In realtà un modo per peggiorare il lavoro dell’ai c’é. Se l’ia viene trainata con i suoi stessi dati ( o di un’altra ai ) il risultato peggiora. In poche parole l’ia ha bisogno di contenuti realmente umani per funzionare. Se si postano risposte create con chatgpt si riesce a far peggiorare l’ai.

https://futurism.com/ai-trained-ai-generated-data-interview

La qualità dell’ai dipende in modo sostanziale dalla qualità dei dati, ed è sempre stato così. È fondamentalmente un modello statistico. Oltretutto queste ai non vivono in un mondo simulato come quelle dei giochi, ma in un mondo reale e non possono migliorare “giocando contro se stesse” , devono confrontarsi con dati reali, non prevedibili in maniera deterministica.

IzNoGud78@feddit.it · 2 years ago

Almeno per quel che mi riguarda è stata la goccia che ha fatto traboccare il vaso. Avrei già voluto cancellare il mio account quando hanno modificato le API, rendendo di fatto impossibile (o quasi) l’accesso da client di terze parti… stavolta sono riusciti a convincermi ad abbandonare definitivamente il social.

damtux@feddit.it · 2 years ago

Benvenut* su Lemmy e in generale nel Fediverso (visto che qui si può interagire anche con persone dagli altri server e software del Fediverso, come Kbin, Mastodon, Misskey, Friendica, siti web Wordpress, ecc)! 😊

IzNoGud78@feddit.it · 2 years ago

non sono nuovo nel fediverso, sono iscritto da qualche anno anche su mastodon… in realtà avevo provato anche friendica, ma non mi aveva convinto molto

Alex 🐭@feddit.it · 2 years ago

Meno male che mi sono disiscritto (non che l’abbia ma i usato più di tanto).

RVGamer06@sh.itjust.works · 2 years ago

Pessima idea, ora avremmo le IA che chiedono la RAL e suggeriscono il disco di piscio come soluzione a ogni disputa :)

AutoTL;DR · 2 years ago

This is the best summary I could come up with:

Reddit will let “an unnamed large AI company” have access to its user-generated content platform in a new licensing deal, according to Bloomberg yesterday.

The deal, “worth about $60 million on an annualized basis,” the outlet writes, could still change as the company’s plans to go public are still in the works.

The news also follows an October story that Reddit had threatened to cut off Google and Bing’s search crawlers if it couldn’t make a training data deal with AI companies.

Last year, it successfully stonewalled its way out of the biggest protest in its history after changes to its third-party API access pricing caused developers of the most popular Reddit apps to shut down.

As Bloomberg writes, Reddit’s year-over-year revenue was up by 20 percent by the end of 2023, but it was still $200 million shy of a $1 billion target it had set two years prior.

The company was reportedly advised to seek a $5 billion valuation when it opens up for public investment, which is expected to happen in March.

The original article contains 346 words, the summary contains 175 words. Saved 49%. I’m a bot and I’m open source!

kingmongoose7877@lemmy.ml · 2 years ago

Smamma, uomo di latta.

Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

Reddit ha un nuovo accordo per addestrare l'intelligenza artificiale di una "grande azienda", vendendo i contenuti degli utenti

Reddit has a new AI training deal to sell user content