this post was submitted on 06 May 2024
56 points (93.8% liked)

Forum Libre

722 readers
50 users here now

Communautés principales de l'instance

Nous rejoindre sur Matrix: https://matrix.to/#/#jlai.lu:matrix.org

Une communauté pour discuter de tout et de rien:

Les mots d'ordre sont : respect et bienveillance.

Les discussions politiques sont déconseillées, et ont davantage leur place sur

Les règles de l'instance sont bien entendu d'application.

Fils hebdomadaires"

"Demandez-moi n'importe quoi"

Communautés détendues

Communautés liées:

Loisirs:

Vie Pratique:

Communautés d'actualité

Société:

Pays:

Communauté de secours:

founded 1 year ago
MODERATORS
 

Hello!

bon slrpnk.net a l'air d'être dans les choux alors je lance ce post avec mon compte de secours jlai.lu

Alors je lance cet AMA car ça fait un moment que je bouffe du machine learning à temps plein et pour suivre les news technique, je passe le plus clair de mon temps à lire de l'anglais. Et je trouve qu'en français, ben y a pas grand chose. C'est presque uniquement du discours dystopique mal informé.

Rien sur la recherche sur l'alignement, rien sur les modèles open source (condition sine qua non pour que ça se passe bien), rien sur les évolutions sociales positives que ça peut amener.

On parle juste de OpenAI, Google et Musk qui ne sont que quelques arbres malades d'une forêt bien plus grande.

Perso ça va faire 5 ans que je fais du deep learning professionnellement. J'ai travaillé pour Skymind, qui développait deeplearning4j. Ça vous dira rien, c'est un projet plus ou moins mort, mais c'était une tentative de faire un framework alternatif avant que tout le monde passe à pytorch. Puis je suis devenu principalement utilisateur des gros modèles entraînés par d'autres.

J'ai travaillé sur les modèles de vision au départ et maintenant presque exclusivement sur des modèles de langage. J'ai réussi à passer au 4/5e l'année dernière pour me consacrer aussi avec le fablab local à de la robotique open hardware (où bien sur j'utilise des modèles de deep learning pour la vision).

Ça fait plus de 20 ans que j'ai réalisé que l'IA a le potentiel de changer le monde pour le mieux, c'est pas par hasard que j'ai essayé de m'orienter le plus possible là dedans et ça me fait mal au cœur de voir tant de gens croire que notre seul but est d'aider Sam Altman à se faire quelques milliards de plus, qui ne voient pas les capacités de transformation de cette tech.

J'ai déjà donné quelques avis en anglais pour éviter le "doomism" dans des romans de SF (https://slrpnk.net/post/6100538) mais le faire dans ma langue natale ferait du bien!

Et, si, le titre est correct, ça me fait 6/5 de boulot, mais quand on aime on ne compte pas!

Voila, je préférerais qu'on reste sur ces thèmes mais AMA anyway!

you are viewing a single comment's thread
view the rest of the comments
[–] [email protected] 1 points 5 months ago* (last edited 5 months ago) (15 children)

...en France. Juridiction qui est hors sujet pour 99% des boites d'IA, y compris françaises. Je veux dire, en droit français, pendant longtemps (jusqu'aux années 2010 je crois), il n'était même pas sur que du code compilé soit copyrightable, un algo ne l'était pas et son implémentation en code ne l'était que via des hacks légaux qu'un refactoring de base pouvait faire sauter. Le droit moral d'auteur a moyen de rendre tout l'open source bancal en France. Et pourtant...

La théorie légale, surtout sur un truc aussi mal branlé que la « propriété intellectuelle » dans le cade de collaboration internationale, avec des usages qui changent du tout au tout d'une année sur l'autre, c'est plus de la philosophie que des règles qui ont un impact réel.

Ce qui va compter comme ailleurs c'est les jugements de tribunaux US. Et entre le fair use et les compilations de faits, et surtout les millions que peuvent mettre les boties d'IA en frais d'avocats, je pense qu'ils ont une bonne chance de n'avoir aucun problème. La loi devrait pas être un jeu de hasard sur 15 ans, mais c'est ce que c'est. Quand Google a scanné pour Google Books des millions de bouquins sans autorisation et mis des extraits en ligne ils ont gagné leur procès. Alors que bon, c'est clairement une violation, en théorie.

C’est con ces gens qui veulent pas qu’on fasse n’imp avec leur travaux hein ?

Ce qui est surtout con c'est que les lois actuelles l'autorisent justement. Par exemple un site comme deviantart a été utilisé pour du training et les auteurs ont découvert que l'EULA qu'ils avaient "signé" l'autorisait. Les auteurs croient que ces lois les protègent mais je pense qu'on les trompe avec ça. Le contrat social autour du copyright et du droit d'auteur doit franchement être remis à plat.

Je n'aime pas la sauce qui monte d'opposer les ingés et les artistes. C'est contre-productif. Les artistes ne comprennent pas comment leurs oeuvres sont utilisées et ont des raisons légitimes de s'inquiéter et de critiquer ces technos, mais la propriété intellectuelle c'est un angle particulièrement mauvais et perdant pour eux.

Il faut une législation globale sur les dataset pour entraîné les IA, pas uniquement pour permettre de respecter les volontés des auteurs, mais aussi pour pas que la techno devienne nimp’.

Ce sera possible quand on saura définir "nimp". Et c'est pas avec les législateurs actuels qu'on peut s'attendre à des règles intelligentes et mesurées. J'aimerais aussi qu'on parle vraiment de la volonté des auteurs, plutôt que des lobbys d'ayant-droits. Ces derniers, on sait bien ce qu'ils veulent: que chaque visionnage d'une oeuvre soit payante et sans droits associés et que toute oeuvre produire par une personne ayant vu leur oeuvre leur rapporte quelque chose. C'est pas des créateurs, c'est des rentier. La culture c'est pas ça, ça se fait en tenant compte aussi de la volonté du public. Et les modèles de génération de média y ont un rôle à jouer, mais c'est pas dans ce débat légal empli de faux-semblants et d'intérêts privés qu'on va inventer la culture de demain.

[–] [email protected] 2 points 5 months ago (14 children)

En France et ailleurs, notamment au USA un droit moral se développe, par la reconnaissance par la jurisprudence de la publication en ligne comme preuve d'antériorité.

Le truc c'est que non la loi ne l'autorise pas. Les oeuvres d'un auteur français sont soumisent au droit d'auteur français quel que soit l'endroit du net où elles sont utilisées. Chaque oeuvres est soumise a la législation de son auteur. Donc on s'en fout d'où viennent les gens qui créer et utilisent des dataset et pas l'inverse.

Mon poste était un peu lapidaire et je suis d'accord sur le fait de ne pas opposer les auteurs et les ingés. Mais du coup les auteurs rentiers, c'est quand même des auteurs. Faut faire gaffe avec la posture du "les vraies auteurs blablabla" contre les méchants ayant-droit rentiers. Car ça fait des lustres que les premiers soutiennent (activement ou passivement) les second majoritairement. Et je pense que quand on voit les dérives de l'Open source, notamment le fait que ce système permet aux gafam de s'enrichir grassement, on peut se demander qui du droit d'auteur français ou de l'Open source a le plus de problèmes vis-à-vis d'internet et du numérique.

Je suis d'accord sur le fait que les lois sur la propriété intellectuelle doivent changer, pour pleins de raisons. Mais ce qui est la réalité c'est que l'évolution social ne suit pas l'évolution tech. Les techs forcent la mains depuis 30ans, mais il y a 30ans on nous promettait un web bien différents de celui qu'on a. A qui la faute? Principalement a des boites tech pas assez bâillonné et contrôler par les États. Qui poussent dés qu'elles peuvent et se justifient avec l'approbation populaire, bah ça serait pas mal que ça cesse. Tu veux entendre les vraies auteurs ? Il faut déjà casser le système qui fait que les plus riches sont les seuls a être entendu. Et pour le coup forcer a respecter les lois en vigueur ça serait un bon début. Et oui même quand c'est chiant.

L'exemple de deviant art est parlant dans le sens où quoi ? On se rend compte que les auteurs ne lisent pas les contrats qu'ils signent ? Mais personne ne lit les cgu de tout les services en ligne qu'on utilise. Et sur les auteurs ça montre juste qu'ils ne connaissent pas leurs droits du tout. Car si c'était le cas, ils liraient plus attentivement les contrats qu'ils signent. Après je ne connais pas plus le cas, mais je doute fort que les contrats de deviant art aient pu n'être contesté par aucune législation dans le monde, vu la compléxité que ça suppose en terme de mise en conformité.

Enfin le droit moral français rend l'Open source bancal, car l'Open source est bancal (mais ceci est un autre débat). Mais le fait de dire que jusqu'en 2010 c'était comme ci et pas comme ça, ça souligne juste la lenteur du législateur, mais ça n'invalide pas sont action pour autant.

Désoler pour la réponse peut-être un peu décousue, je suis sur mobile. Content d'avoir la chance de parler de ça avec quelqu'un qui maitrise le sujet :)

[–] [email protected] 1 points 5 months ago (13 children)

Content que tu le prennes bien, j'ai trouvé ma réponse d'hier un peu agressive, désolé!

Le truc c’est que non la loi ne l’autorise pas.

Depuis que j'ai lu le jugement de Google contre la guilde des auteurs, où un juge donne à Google un blanc seing à clairement violer la loi (reproduire des pages de bouquins sans autorisation des auteurs) j'ai compris que la loi, elle est davantage dite par les juges que par le législateur. Si Facebook fait des trucs illégaux en France derrière des portes fermées aux US, l'interdire ne va handicaper que les efforts ouverts.

Et je pense que quand on voit les dérives de l’Open source, notamment le fait que ce système permet aux gafam de s’enrichir grassement, on peut se demander qui du droit d’auteur français ou de l’Open source a le plus de problèmes vis-à-vis d’internet et du numérique.

Quelles dérives? L'open source est la seule raison qui a permis d'éviter les futurs les plus dystopiques en ligne, qui a permis à internet de continuer à être relativement libre (si si, les GAFAM sont tous optionnels, c'était pas gagné) et c'est encore en majorité sur des projets open source qu'internet se base. Les combats sont toujours en cours sur plein de champs de bataille. C'est un peu perdu sur les téléphone, sur l'IA on est en train de gagner mais faut pas vendre la peau de l'ours prématurément.

Je ne vois pas de quelle dérive tu parles? L'open source fait économiser de l'argent à tout le monde, c'est une tellement bonne idée que plein de boites privées s'y sont mises. C'est pas une dérive, c'est une volonté de base. C'est un projet qui est encore, dans son essence, anarcho-communiste (lien vers un post+commentaire qui explique ça plus en détails) Que des turbo-capitalistes y participent sans aucune concession de notre part et "donnent" des contributions est une victoire totale, pas une compromission ou une dérive.

Le droit d'auteur (en général, pas spécifiquement le français) est ce qui a permis à notamment Google et Youtube de vendre un système centralisé comme essentiel à tout. Pendant longtemps on a eu un système très supérieur à Youtube pour voir des vidéos en ligne: P2P+VLC et j'arguerais que c'est encore une combo supérieure en terme de contenus. Ce sont les ayant droits qui ont rendu ce système illégal alors que non commercial, volontaire, non-capitaliste.

Le web différent, il a été rendu illégal. La tech est là et toutes les libs derrière elle sont open source.

Et pour le coup forcer a respecter les lois en vigueur ça serait un bon début. Et oui même quand c’est chiant.

Les lois en vigueur sont si floues et mal définies qu'on ne sait toujours pas si les poids d'un modèle sont copyrightable ou si c'est un produit dérivé des oeuvres vues à l'entrainement. Y a des arguments dans les deux sens, la loi ne le dit pas, et le premier jugement rendu dépendra de la rhétorique des avocats et de ce que je juge aura mangé à midi. Et des usages en vigueur, qui sont un argument fort: c'est un noeud gordien: l'usage deviendra légal s'il est répandu. J'exagère pas, on en est là. On a des exhortations à respecter une loi dont la lettre est floue et dont l'esprit est bafoué par ceux qui nous demandent de faire la chose soit-disant morale.

Faut faire gaffe avec la posture du “les vraies auteurs blablabla” contre les méchants ayant-droit rentiers.

Tu admettras qu'il y a quand même une différence fondamentale entre des auteurs qui ont produit leurs œuvres et les gens qui en ont hérité parfois sans avoir même connu l'auteur. Dune, Tintin, Lord of the Ring, Ambre, et j'en passe sont des franchises mutilées par des héritiers alors qu'elles se porteraient mieux dans les mains de leurs fans. Il suffit de voir l'explosion de créativité autour des univers de Lovecraft ou de Conan Doyle quand ils sont tombés dans le domaine public pour voir que le droit d'auteur ampute la culture.

Je veux bien entendre les intérêts des créateurs de leur vivant (et encore, le copyright original c'était 21 ans après la première publication), mais je dois t'avouer que pirater du Tintin ou du Brel, j'ai du mal à voir ça comme immoral.

"Publier" veut dire "Mettre entre les mains du public", c'est donner à l'oeuvre une liberté de participer à la construction de l'imaginaire collectif et de la culture. J'ai l'impression que cette composante du contrat social est un peu trop souvent oubliée.

Mais ce qui est la réalité c’est que l’évolution social ne suit pas l’évolution tech. Les techs forcent la mains depuis 30ans, mais il y a 30ans on nous promettait un web bien différents de celui qu’on a. A qui la faute? Principalement a des boites tech

Alors je lutte beaucoup contre cette tendance à faire de "la tech" et des "boites techs" des synonymes. Ça invisibilise toute la partie non-capitaliste de la tech, tout l'open source, et tous les activistes numériques qui crient dans le vide depuis des décennies mais qu'on est bien content de trouver quand une partie pratique du web se merdifie.

L'évolution sociale, oui, elle suit et boit les paroles des grosses boites et ignore la voix de la "tech", la vraie, celle des devs, ingés et des chercheurs qui la font. Je ne sais pas qui accuser en priorité, je trouve que les journalistes ont un grand rôle, mais j'ai aussi décidé que c'était aussi à moi de parler sur un mode un peu plus politique, un peu plus culturel, des sujets ouverts qui me tiennent à coeur quand j'entends trop de mensonges ou d'idées fausses à leur encontre.

[–] [email protected] 2 points 5 months ago* (last edited 5 months ago) (3 children)

J'ai un peu lu en diagonal, désolé.

En fait, je me dis que ce n'est pas tant la question du droit d'auteur mais la rénumération des artistes vivants (Mort ça sert à rien d'avoir de l'argent). Plus globalement l'économie.

Par exemple le soustitrage automatique a été pour moi une révolution pour l'accès à l'information. En parallèle ça met au banc les soustitreurs et soustitreuses.

Cependant, personne ne seraient capable de soustitrer toutes les vidéos du web, et on ne serait pas capable de tous et toutes les rénumerer.

De la même manière que les maraichers ne sont pas rénumérés en cas de perte de leur production malgré leur travail. (sauf AMAP)...ou encore les actifs qui cotisent pour les retraités...ya plein de choses comme ça.

En dehors de l'IA, c'est la notion de travail = salaire qu'il faut détruire.

[–] [email protected] 2 points 5 months ago
[–] [email protected] 2 points 5 months ago (1 children)

Il y a un vrai sujet sur le fait de décorréler la rémunération de la production, mais ça ne concerne pas que les auteurs.

[–] [email protected] 1 points 5 months ago (1 children)

Yep autant donner un revenu à tous et toute sans condition. Pour ma part j'experimente des alternatives comme la monnaie libre qui apporte une partie de la solution. Cependant j'arrive pas à résoudre la question de la taxe et service publique et ce n'est pas un revenu de base car ça ne garantie pas le logement, alimentation. C'est une dividende universelle. Neanmoins sa production est équitable et décentralisée.

[–] [email protected] 2 points 5 months ago (1 children)

La monnaie libre c'est super! Et c'est l'exemple même d'un truc qui permettrait de faciliter la sortie du capitalisme, c'est d'ailleurs pour cette raison qu'aucun tenant du solutionnisme technique ou des boites techs ne s'en saisie, car leur but c'est pas de réfléchir a une nouvelle société, mais de continuer comme avant en faisant tourner les rapports de force a leur avantage. La monnaie libre, ça rapporte pas de blé tu comprend, alors que l'open source ça oui!

[–] [email protected] 2 points 5 months ago* (last edited 5 months ago)

exactement, elle est faite pour circuler, et non s'accumuler. Et perd de la valeur si elle reste sur ton compte membre. :)

[–] [email protected] 1 points 5 months ago (1 children)

Par exemple le soustitrage automatique a été pour moi une révolution pour l’accès à l’information. En parallèle ça met au banc les soustitreurs et soustitreuses.

Je suis d'avis que ce qui mets au ban les soutitraires, c'est moins l'outil automatique que l'étroitesse d'esprit de certain. Puisqu'on dispose d'une technologie qui peut fournir en grande quantité un travail de qualité moyenne à faible coût, on exclus définitivement de s'offrir parfois les services de qui peut fournir un travail de haute qualité, en petite quantité, pour un prix élevé. Sachant portant que le prix des soutitraires étaient déjà élevé auparavant.

[–] [email protected] 2 points 5 months ago (1 children)

Heu les soustitraires sont payés au lance-pierre d'après une de mes connaissances.

Effectivement les soustitres en IA sont moins comfortables à lire. Ya pas de ponctuation, ya des pavés gros comme ça...alors qu'il faudrait changé les mots pour que ce soit plus rapide, et facile à lire, ça c'est vrai.

Mais bon, moins je suis passé d'une période desertique avec 99,9 % de vidéo, radio/podcast non-soustitrées à celle de l'abondance 80% avec soustitrage dont 10% Soustitré.

À l'époque, on avait des groupes FB pour demander du soustitrage. Maintenant, ya plus trop besoin, si tu as un bon micro, l'IA fait le reste.

C'est comme ça qu'iels ont fait la transcription de leur émission Soluce posté dans [email protected] (avec relecture)

Pour moi, c'est une révolution.

[–] [email protected] 2 points 5 months ago (1 children)

Quand tu compares la quantité de soustitres produit automatiquement par rapport à celle que te produit un soutitraire sur le même temps, oui les soutitraires coûtent cher. Ça ne veut pas dire pour autant qu'ils peuvent bien vivre.
Je suis d'accord avec toi sur le fait que ça été une révolution. Même les entendants ont vu la différence ! Il n'empèche que avoir un dispositif pour faire du soutitrage en quantité n'obligait pas les entreprise à abandonner celui qui faisait du soutitrage de qualité : C'est un choix qu'elles ont fait. La technologie n'est qu'un prétexte pour ne pas l'assumer.

[–] [email protected] 2 points 5 months ago* (last edited 5 months ago)

Oui, on est d'accord. Ya quelque chaines qui font ce soustitrage : jamy epicurieux, science etonnante et soluce.

Et ya aussi le doublage qui est menacé : https://www.cnetfrance.fr/news/cinema-comment-les-ia-sont-en-train-de-doubler-les-doubleurs-39956928.htm

Après, j'aime pas le doublage car souvent ça se traduit par la disparition des soustitres dans les animés et salle de cinéma.

load more comments (9 replies)
load more comments (9 replies)
load more comments (9 replies)