lundi 27 mars 2017

Netflix et les 1300 clusters


"De gustibus non est disputandum", apprend-t-on à l'école : ne pas discuter des goûts. Maxime que pourrait adopter Netflix. Inutile de discuter ou critiquer les goûts, mieux vaut les admettre, les respecter, les suivre.
Finalament, Netflix considère que ce qui distingue les téléspectateurs, c'est moins leur appartenance socio-démographico-économique que leurs consommations télévisuelles. La sociologie relie en corrélations les consommations et les appartenances socio-démographiques, les unes et les autres déclarées, les unes expliquant les autres. Netflix n'explique pas mais se contente de prédire des consommations futures à partir de l'analyse des consommations passées, observées, récentes, d'où se déduisent des recommandations. Markovien.

Au-delà du jugement de goût : les mythèmes médiatiques
Prédire ou expliquer, ce n'est pas la même chose, soulignait le mathmaticien René Thom. Prédire a une visée opérationelle dont la validité est vérifiable à terme, expliquer a une visée spéculative, rarement vérifiable.
Pour effectuer ses anticipations, Netflix dispose des données provenant des choix et préférences de programmes effectués par ses millions d'abonnés, dans quelques dizaines de pays, pendant des années (dataset).
Netflix regroupe ces comportements en clusters de goûts ("taste communities"), plus de 1300, construits, découverts par des opérations de machine learning. Ces clusters sont rebelles à l'intuition première, spontanée (donc à la déclaration). Bien sûr, chaque abonné peut appartenir à plusieurs clusters : avoir regardé des westerns classiques et des soaps coréens (K-pop), des films avec Depardieu, d'autres avec Meryl Streep ou Jane Fonda, des séries où l'on cuisine...
Le machine learning déconstruit les productions télévisuelles et cinématographiques un peu à la manière dont Claude Lévi-Strauss déstructurait les mythes pour en découvrir les "grosses unités constitutives ou mythèmes" et la combinatoire. Chaque unité constitutive, dit Lévi-Strauss, "a la nature d'une relation", de "paquets de relations"...

La langue de Netflix, c'est la traduction
La personnalisation et la recommandation sont au bout de ces clusters, avec la langue des sous-titres et la localisation technique, dont la gestion du cache qui varie selon les ISP, les téléviseurs... Les combinaisons de langues peuvent demander jusqu'à 200 traducteurs pour traiter 45 langues d'une émission (le catalogue lui-même est publié en 25 langues). Pour paraphaser Umberto Eco, on dira que la langue de Netflix est la traduction, et ce sera de moins en moins l'anglais des native speakers.

Pour répondre aux besoins de sa programmation internationale, Netflix a été amené à développer une plateforme de traduction ("translator testing platform"). Netflix a donc son propre test de recrutement de traducteurs (Hermes) avec des questions à choix multiples pour calculer un score aisément. Les tests concernent la compétence langagière (notamment les tournures idiomatiques) mais aussi la maîtrise des aspects techniques du sous-titrage (timing, ponctuation, césure, etc.). Ainsi, Netflix, sans que l‘on n'y ait pris garde, est-il devenu l'une des plus importantes entreprises de l'industrie de la traduction dans le monde. Sans doute pourrait-elle un jour commercialiser ses services de traduction (à des MVPD, des éditeurs, des réseaux sociaux, des studios, etc.). Elle fait se rencontrer, sur sa place de marché, des traducteurs / sous-titreurs, d'une part, et des documents à sous-titrer (émissions, films), d'autre part. Alors que les vidéo regardées sur le web le sont souvent sans le son, le sous-titrage a un bel avenir, sous-titrage enrichi de notations culturelles adaptées à langue / culture cible et à la langue /cible /origine. Car ce que l'on ne comprend pas dans une émission étrangère, ce n'est pas seulement la langue mais aussi les allusions, les sous-entendus, les comportements et gestes symboliques...

Cette plateformisation donne à Netflix des airs d'Amazon qui commercialise sa plateforme logistique, son cloud computing ou Mechanical Turk, d'abord développés pour son propre usage... Netflix commercialiserait également sa technologie de streaming aux compagnies aériennes. Ainsi fait aussi The Washington Post (racheté par Amazon) qui vend les plateformes d'édition et de publicité qu'il a développées pour répondre à ses propres besoins.
Sommes-nous en train d'assister à une uberisation de la traduction ? Reste à Netflix à produire pour ses traducteurs des outils d'aide ou d'automatisation partielle à la traduction et au sous-titrage, tout comme les chauffeurs d'Uber utilisent son logiciel de facturation, sa cartographie...
Notons que YouTube a choisi une autre voie pour la traduction, celle du crowd-sourcing avec "Contribute translated content". On peut évoquer aussi une plateforme de recrutement (ressources humaines) comme celle de EasyRecrue...


Références

Pierre Bourdieu, Monique de Saint-Martin, "l'anatomie du goût" in Actes de la recherche en sciences sociales. Vol. 2, n°5, octobre 1976. Anatomie du goût, cf. Persée
Pierre Bourdieu, La distinction. Critique sociale du jugement, Paris, Editions de Minuit, 1979, 
Claude Lévi-Strauss, Librairie Plon, 1958, (Chapitre XI, "La structure des mythes")
René Thom, Prédire n'est pas expliquer, Paris, 1991

Cf. Variety, September 25, 2017


2 commentaires:

Unknown a dit…

Article au regard de la socio très intéressant, permettant de comprendre réellement les enjeux des 1300 clusters affinant les recos.

Netflix fait du A/B testing même pour choisir l'imagette de chaque programme.

Les abonnés mentent quand ils notent. C'est pourquoi Netflix réfléchit aussi à un nouveau système de notation révélant réellement les goûts des utilisateurs.

Tous les tests ne sont pas concluants. Les équipes ont aussi travaillé sur la personnalisation des recos en fonction du jour et de l¹heure, mais sans gain significatif : cela multipliait la charge processeur de l'algorithme par 50 ... sans augmenter la consommation des cobayes, trop ancrés dans leurs habitudes.

Unknown a dit…

Partant du constat que le sous-titrage de ses films et séries n'est pas d'assez bonne facture et peut parfois manquer de nuances, le géant Netflix a souhaité lancer un appel aux traducteurs du monde entier. Pour valoriser ses contenus, Netflix a mis en place la plateforme de recrutement Hermès, chargée de détecter ses futurs talents.

Seul bémol : à aucune étape du recrutement il est nécessaire de présenter un quelconque diplôme de traduction. Cela ouvre certes la voie à des gens talentueux de traduire des fictions intéressantes mais cela met aussi fortement en danger le secteur de la traduction. Il risque d'y avoir une concurrence entre des jeunes peu ou pas qualifiés/expérimentés et des professionnels de longue date qui tirerait les prix vers le bas et entraînerait un véritable risque de précarisation de la profession. 

Néanmoins, il n'a pas fallu attendre Netflix pour que le secteur de la traduction entre en mutation. Des plateformes comme Upwork ou Stepes se sont déjà positionnées sur ce créneau il y a quelques années et le problème qui émane est plus de l’ordre de l’économie en général. L'ubérisation de la société est un phénomène encore nouveau et il faut apprendre à gérer cette double économie, qui se passe d'intermédiaires et qui impose ses prix et ses règles tout en misant sur l'hyper concurrence.

Réjouissons-nous que Netflix prenne en compte l'importance du travail des traducteurs mais restons tout de même vigilants. Comme le soulignait justement l'association des traducteurs et adaptateurs de l'audiovisuel dans un communiqué officiel : "Parler couramment une ou plusieurs langue(s) étrangère(s), ou même être réellement bilingue, ne suffit pas à faire un bon traducteur-adaptateur."
Et quand on sait que c'est un algorithme qui sera en charge de choisir les prochains auteurs, on ne peut que s'interroger sur la vision qu'a Netflix de ce travail qui n'est pas une tâche purement quantifiable mais un véritable travail de création.