Je viens d'apprendre que Stack Overflow rejoint le train des "payez-nous pour nos données", suivant l'exemple de Reddit. Ils exigent maintenant de l'argent des géants de la technologie qui ont utilisé librement leur vaste répertoire de connaissances en programmation pour entraîner leurs modèles d'IA sophistiqués.
En tant que développeur ayant passé d'innombrables heures à poser et répondre à des questions sur cette plateforme, je me sens quelque peu trahi. Où était cette préoccupation pour la "valeur communautaire" lorsque ces plateformes technologiques scrapaient discrètement notre contenu pendant des années ?
Le PDG Prashanth Chandrasekar affirme que les développeurs de LLM violent leurs conditions de service car les utilisateurs possèdent le contenu sous des licences Creative Commons nécessitant une attribution. Mais soyons honnêtes - cette soudaine préoccupation semble plus liée à l'obtention d'une part du gâteau financier de l'IA qu'à la protection des droits des utilisateurs.
« Les plateformes communautaires qui alimentent les LLM devraient absolument être rémunérées », déclare Chandrasekar. Ouais, bien sûr. Et combien de cette rémunération reviendra aux véritables contributeurs ? Je ne retiens pas mon souffle.
Ce qui est particulièrement riche, c'est que Stack Overflow travaille sur ses propres applications d'IA générative tout en facturant simultanément les autres. Parlez de vouloir le beurre et l'argent du beurre !
Le PDG de Reddit, Steve Huffman, a fait un argument similaire : "Explorer Reddit, générer de la valeur, et ne pas retourner cette valeur à nos utilisateurs est quelque chose avec lequel nous avons un problème." Pourtant, les deux plateformes sont commodément vagues sur la manière dont elles vont tarifer leurs API de données ou partager les revenus avec les utilisateurs qui ont créé le contenu réel.
Les éditeurs rejoignent également cette ruée vers l'or. L'Alliance des nouvelles et des médias exige une compensation, déclarant que l'utilisation non autorisée de leur contenu par l'IA constitue une violation de la propriété intellectuelle.
Meta a déjà commencé à entraîner son modèle LLaMA sur les données de Stack Exchange. Maintenant, tout le monde veut en profiter avant que le train de la richesse ne parte.
L'hypocrisie est stupéfiante - ces plateformes ont construit leurs empires sur du contenu généré par les utilisateurs gratuitement, et maintenant elles essaient de monétiser notre travail collectif. Je me demande combien d'entre nous qui avons réellement écrit ces 50 millions de questions et réponses verront un centime de ces accords ?
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
L'attrape de l'argent de Stack Overflow : Maintenant, ils veulent que les entreprises d'IA paient.
Je viens d'apprendre que Stack Overflow rejoint le train des "payez-nous pour nos données", suivant l'exemple de Reddit. Ils exigent maintenant de l'argent des géants de la technologie qui ont utilisé librement leur vaste répertoire de connaissances en programmation pour entraîner leurs modèles d'IA sophistiqués.
En tant que développeur ayant passé d'innombrables heures à poser et répondre à des questions sur cette plateforme, je me sens quelque peu trahi. Où était cette préoccupation pour la "valeur communautaire" lorsque ces plateformes technologiques scrapaient discrètement notre contenu pendant des années ?
Le PDG Prashanth Chandrasekar affirme que les développeurs de LLM violent leurs conditions de service car les utilisateurs possèdent le contenu sous des licences Creative Commons nécessitant une attribution. Mais soyons honnêtes - cette soudaine préoccupation semble plus liée à l'obtention d'une part du gâteau financier de l'IA qu'à la protection des droits des utilisateurs.
« Les plateformes communautaires qui alimentent les LLM devraient absolument être rémunérées », déclare Chandrasekar. Ouais, bien sûr. Et combien de cette rémunération reviendra aux véritables contributeurs ? Je ne retiens pas mon souffle.
Ce qui est particulièrement riche, c'est que Stack Overflow travaille sur ses propres applications d'IA générative tout en facturant simultanément les autres. Parlez de vouloir le beurre et l'argent du beurre !
Le PDG de Reddit, Steve Huffman, a fait un argument similaire : "Explorer Reddit, générer de la valeur, et ne pas retourner cette valeur à nos utilisateurs est quelque chose avec lequel nous avons un problème." Pourtant, les deux plateformes sont commodément vagues sur la manière dont elles vont tarifer leurs API de données ou partager les revenus avec les utilisateurs qui ont créé le contenu réel.
Les éditeurs rejoignent également cette ruée vers l'or. L'Alliance des nouvelles et des médias exige une compensation, déclarant que l'utilisation non autorisée de leur contenu par l'IA constitue une violation de la propriété intellectuelle.
Meta a déjà commencé à entraîner son modèle LLaMA sur les données de Stack Exchange. Maintenant, tout le monde veut en profiter avant que le train de la richesse ne parte.
L'hypocrisie est stupéfiante - ces plateformes ont construit leurs empires sur du contenu généré par les utilisateurs gratuitement, et maintenant elles essaient de monétiser notre travail collectif. Je me demande combien d'entre nous qui avons réellement écrit ces 50 millions de questions et réponses verront un centime de ces accords ?