Affichage des articles dont le libellé est clustering. Afficher tous les articles
Affichage des articles dont le libellé est clustering. Afficher tous les articles

lundi 27 mars 2017

Netflix et les 1300 clusters


"De gustibus non est disputandum", apprend-t-on à l'école : ne pas discuter des goûts. Maxime que pourrait adopter Netflix. Inutile de discuter ou critiquer les goûts, mieux vaut les admettre, les respecter, les suivre.
Finalament, Netflix considère que ce qui distingue les téléspectateurs, c'est moins leur appartenance socio-démographico-économique que leurs consommations télévisuelles. La sociologie relie en corrélations les consommations et les appartenances socio-démographiques, les unes et les autres déclarées, les unes expliquant les autres. Netflix n'explique pas mais se contente de prédire des consommations futures à partir de l'analyse des consommations passées, observées, récentes, d'où se déduisent des recommandations. Markovien.

Au-delà du jugement de goût : les mythèmes médiatiques
Prédire ou expliquer, ce n'est pas la même chose, soulignait le mathmaticien René Thom. Prédire a une visée opérationelle dont la validité est vérifiable à terme, expliquer a une visée spéculative, rarement vérifiable.
Pour effectuer ses anticipations, Netflix dispose des données provenant des choix et préférences de programmes effectués par ses millions d'abonnés, dans quelques dizaines de pays, pendant des années (dataset).
Netflix regroupe ces comportements en clusters de goûts ("taste communities"), plus de 1300, construits, découverts par des opérations de machine learning. Ces clusters sont rebelles à l'intuition première, spontanée (donc à la déclaration). Bien sûr, chaque abonné peut appartenir à plusieurs clusters : avoir regardé des westerns classiques et des soaps coréens (K-pop), des films avec Depardieu, d'autres avec Meryl Streep ou Jane Fonda, des séries où l'on cuisine...
Le machine learning déconstruit les productions télévisuelles et cinématographiques un peu à la manière dont Claude Lévi-Strauss déstructurait les mythes pour en découvrir les "grosses unités constitutives ou mythèmes" et la combinatoire. Chaque unité constitutive, dit Lévi-Strauss, "a la nature d'une relation", de "paquets de relations"...

La langue de Netflix, c'est la traduction
La personnalisation et la recommandation sont au bout de ces clusters, avec la langue des sous-titres et la localisation technique, dont la gestion du cache qui varie selon les ISP, les téléviseurs... Les combinaisons de langues peuvent demander jusqu'à 200 traducteurs pour traiter 45 langues d'une émission (le catalogue lui-même est publié en 25 langues). Pour paraphaser Umberto Eco, on dira que la langue de Netflix est la traduction, et ce sera de moins en moins l'anglais des native speakers.

Pour répondre aux besoins de sa programmation internationale, Netflix a été amené à développer une plateforme de traduction ("translator testing platform"). Netflix a donc son propre test de recrutement de traducteurs (Hermes) avec des questions à choix multiples pour calculer un score aisément. Les tests concernent la compétence langagière (notamment les tournures idiomatiques) mais aussi la maîtrise des aspects techniques du sous-titrage (timing, ponctuation, césure, etc.). Ainsi, Netflix, sans que l‘on n'y ait pris garde, est-il devenu l'une des plus importantes entreprises de l'industrie de la traduction dans le monde. Sans doute pourrait-elle un jour commercialiser ses services de traduction (à des MVPD, des éditeurs, des réseaux sociaux, des studios, etc.). Elle fait se rencontrer, sur sa place de marché, des traducteurs / sous-titreurs, d'une part, et des documents à sous-titrer (émissions, films), d'autre part. Alors que les vidéo regardées sur le web le sont souvent sans le son, le sous-titrage a un bel avenir, sous-titrage enrichi de notations culturelles adaptées à langue / culture cible et à la langue /cible /origine. Car ce que l'on ne comprend pas dans une émission étrangère, ce n'est pas seulement la langue mais aussi les allusions, les sous-entendus, les comportements et gestes symboliques...

Cette plateformisation donne à Netflix des airs d'Amazon qui commercialise sa plateforme logistique, son cloud computing ou Mechanical Turk, d'abord développés pour son propre usage... Netflix commercialiserait également sa technologie de streaming aux compagnies aériennes. Ainsi fait aussi The Washington Post (racheté par Amazon) qui vend les plateformes d'édition et de publicité qu'il a développées pour répondre à ses propres besoins.
Sommes-nous en train d'assister à une uberisation de la traduction ? Reste à Netflix à produire pour ses traducteurs des outils d'aide ou d'automatisation partielle à la traduction et au sous-titrage, tout comme les chauffeurs d'Uber utilisent son logiciel de facturation, sa cartographie...
Notons que YouTube a choisi une autre voie pour la traduction, celle du crowd-sourcing avec "Contribute translated content". On peut évoquer aussi une plateforme de recrutement (ressources humaines) comme celle de EasyRecrue...


Références

Pierre Bourdieu, Monique de Saint-Martin, "l'anatomie du goût" in Actes de la recherche en sciences sociales. Vol. 2, n°5, octobre 1976. Anatomie du goût, cf. Persée
Pierre Bourdieu, La distinction. Critique sociale du jugement, Paris, Editions de Minuit, 1979, 
Claude Lévi-Strauss, Librairie Plon, 1958, (Chapitre XI, "La structure des mythes")
René Thom, Prédire n'est pas expliquer, Paris, 1991

Cf. Variety, September 25, 2017


lundi 25 avril 2016

Micromoments, microgenres, microlocations, microcibles, micro-ads


L'économie publicitaire numérique, pour optimiser l'efficacité du marketing, désagrège l'action publicitaire en actions et en cibles de plus en plus fines pour atteindre le moment limite, celui à partir duquel on ne peut décomposer plus avant. Appelons atomistique ce moment (du grec ἄτομος, que l'on ne peut couper, insécable) pour évoquer l'évolution de la pensée publicitaire et médiatique à la manière dont Gaston Bachelard évoque l'histoire de la chimie. Un nouvel habitus se met en place que commande l'économie numérique : comme le souligne Marie-Anne Frison Roche ("Les conséquences régulatoires d'un monde repensé à partir de la notion de donnée"), "l'information sur la personne n'est pas qu'un reflet de celle-ci : elle est un découpage de celle-ci voire une pulvérisation de celle-ci, une autre façon de le mettre en miettes"; ("l'information est toujours parcellaire". Cf. Internet, espace d'interrégulation). Tel est le précepte de Descartes : "diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se pourrait".

Du point de vue des supports publicitaires (médias), de segmentations en décompositions, on aboutit à un micro-marketing de précision chirurgicale (on recourt parfois à la métaphore du sniper) : message délivré à l'approche d'un linéaire dans un point de vente (beacons), lors d'un tournant décisif dans un jeu vidéo sur mobile (cf. "emotional moments" de MediaBrix), suite à une émotion distinguée dans les traits d'un visage ("emotional targeting"). On ne vise pas une personne mais un modèle de comportement identifiable par des atomes de sens, mots ou actes de langage, images (et objets dans une image), traits du visage. Touchpoint. Dans aucun cas, il n'y a d'appel à l'expérience.
On est passé de cibles concrètes à des cibles abstraites, calculées (intersections de comportements, de moments et de lieux, données, algorithmes), les réseaux neuronaux apprenant une image à travers les couches (layers) successives du deep learning.
Les atomes, "particules élémentaires" constituant la matière publicitaire ne sont pas perceptibles ; pour le médiaplanner, leur réalité est d'être opérationnels, donc rationnels. Tout comme les SKU pour les inventaires dans la distribution (store-keeping unit).
La cible n'est pas trouvée, observée mais construite, elle résulte d'une configuration d'ensembles de comportements ; la cible, ce n'est pas telle ou telle personne, père d'adolescents, par exemple, mais tel ensemble de comportements caractéristiques de pères d'adolescents (à un moment donné, intentions d'achat de séjours de vacances et de matériel sportif, par exemple) ; dans la réalité, de tels comportements pourront être attribués à des grand-mères... Qu'importe à l'annonceur ?
Dans le médiaplanning, l'intuition intellectuelle l'emporte désormais sur l'intuition sensible, comme le souligne l'épistémologie de Gaston Bachelard à propos de la chimie. L'intuition sensible est même souvent un obstacle (épistémologique) au médiaplanning.

L'efficacité du micro-ciblage risque toutefois de buter sur une difficulté radicale : comment peut-on cibler finement en s'en tenant à une création générale, unique, passe-partout ? La réponse se trouve peut-être dans l'interactivité qui, de facto, est adaptation de la création à une demande de consommateur. On peut aussi modifier la création délivrée en fonction du consommateur présent (en recourant à un cookie ou, comme Vyking, à la reconnaissance faciale effectuée par des supports dotés de capteurs optiques). L'optimisation dynamique des créations (Dynamic Creative Optimization) contextualise les messages en tenant compte du lieu de réception, de la météo, du contenu environnant, etc.)... Cf. myThings. Le ciblage culmine dans la personnalisation et la recommandation (Netflix).

L'atomisation se généralise à toutes les dimensions de l'action publicitaire : le bon endroit, le bon moment, le bon message, la bonne cible.
  • Micro-genres. On doit à Netflix d'avoir popularisé les micro-genres (about something cf. infra). Netflix avait, il y a déjà deux ans, dégagé près de 80 000 micro-genres, un genre combinant généralement divers identifiants, des adjectifs, des sujets, des acteurs, des thèmes sous la forme de tags (metadata). Au lieu de genres généraux (Stanley Cavell), en nombre limité (western, karaté, comédie, policier, etc.), on peut identifier des atomes de fictions au terme d'analyses de contenus avec ou sans catégorie élaborée préalablement (folksonomie). Après le stade de l'analyse, les micro-genres peuvent être regoupés pour guider l'alchimie créatrice (solve et coagula !). Voir aussi The Music Genome Project de Pandora (450 attributs pour la catégorisation musicale et la personnalisation).
  • Micro-moments. Google met en avant la notion de micro-moments. Ce sont des moments décisifs, moments de vérité (cfZMOT, Zero Moment Of Truth), des moments favorables (cf. kairos, καιρός). Moments définis par une occasion, une intention, une envie de... (want-to-do moment, want-to-buy moment, want-to-go moment, want-to-know moment, what-do-I-eat moments...). "Data beats opinion", "Speed beats perfection", souligne Google. On parle de micro-engagements. Canvs parle aussi de moments "emotionnaly engaging" (score calculé à partir de 56 attributs et plus de 4 millions d'expressions). Twitter lance Moments ("The best of Twitter in an instant"). Pour Mindlytix, un moment de vie pertinent dure une vingtaine de minutes. Cette prégnance du moment instaure-elle un nouveau "régime d'historicité" ? Faut-il parler de "momentisme" à la manière dont François Hartog parle de "présentisme" (question à ambition heuristique) ? Les Snaps saisissent sur le vif des micro-moments (Snapchat spectacles) ? tapCliq repère le micro-moment adéquat, l'anticipe même.
  • Micro-lieux. Les beacons qui sont des capteurs permettent de cibler des micro-lieux (micro-locations) au cours de déplacements grâce au smartphone (cfProximity de Bluvision). Le beacon détecte la proximité d'un smartphone dès lors qu'il entre dans une zone préalablement définie (liée à la puissance de l'émetteur) et déclenche des actions prévues (envoyer un courrier, un message, une notification, un coupon). Par la géométrie de son rayonnement, un beacon définit une micro-zone de chalandise dans une rue, un centre commercial, un magasin (indoor mapping).
  • Micro-cibles (micro-segments). Intersections d'ensembles de données (exemple : porteurs d'une intention d'achat + degré de solvabilité + délais de réalisation). Ni l'âge, ni le sexe, ni la catégorie socio-professionnelle n'ont de pertinence particulière. Leur commodité s'estompe au profit d'une efficacité calculée. Micro-influenceurs ?
  • Micro-ads. Parce que l'on n'a que quelques secondes pour intéresser, convaincre.
On retrouve cette tendance au "micro", au minuscule, dans les domaines du temps dit réel (RTB), du quantified self, du micro-paiement, du micro-manufacturing, des micro-expressions (travaux de Paul Ekman), de la micro-entreprise, de micro-influencers (Instagram), "instant market research" (cfWishbone)... A propos de Mechanical Turk (amazon), Jean Tirole parle "microtâches moyennant microsalaires"... La désagrégation des médias en fut un signe prémonitoire qui fit passer du magazine à l'article, du CD au morceau de musique, de la chaîne de télévision à l'épisode... pour que chacun recompose sur mesure son  média (sa grille, sa playlist, etc.). Effet structurel de l'économie numérique. Accélération ? La décomposition en particules élémentaires atteint le machine learning (unsupervised) et les couches d'apprentissages (layers), les patterns de data (clusters, latent factors, etc.) ou la reconnaissance des objets peuplant une image.
Pour l'essentiel, c'est le smartphone qui, devenant un équipement personnel de base, un prolongement de soi, a raccourci les distances de visée, de ciblage, les délais de réponse, d'intervention, de consommation et surtout la prise en compte et l'exploitation de micro-moments : de l'"atomicité du temps" aux micro-engagements !
Des atomes de vie sociale, de goûts, d'habitus : "les intuitions atomistiques", selon Gaston Bachelard, invitent à se méfier du réalisme naïf. Le réalisme fait obstacle à la compréhension du ciblage numérique, qui est "géométrie du détail" et annonce un séquençage du génôme socio-culturel (datôme ?).
Le monde social, observé de près, à diverses échelles, laisse voir une composition fractale avec ses autosimilarités ; le simple dissimule du complexe, l'universel du singulier, le stable des turbulences.

Source : "How Netflix Reverse Engineered Hollywood", Alexis C. Madrigal, The Atlantic, January 2, 2014.


Ouvrages évoqués
  • Gaston Bachelard, Les intuitions atomistiques. Essai de classification, Paris, Librairie philosophique Vrin, 1933, réédition 2015, 181 p. Index
  • Gaston Bachelard, "Noumène et microphysique", in Recherches philosophiques, 1931-32, repris in EtudesParis, Librairie philosophique Vrin, 1970, pp. 7-24, Présentation de Georges Canguilhem
  • Mark C. Baker, The Atoms of Language. The Mind's Hidden Rules of Grammar, Basic Books, New York, 2001, Bibliogr., Index, Glossary
  • Jean Salem, Démocrite, Epicure, Lucrèce. La vérité du minuscule, Paris, Editions Encre marine, 1998, 247 p. Index
  • François Hartog, Régimes d'historicité. Présentisme et expériences du temps, Paris, 2012, Edtions du Seuil, 329 p. Index
  • Marie-Anne Frison Roche (sous le direction de ), Internet, espace d'interrégulation, 2016, Dalloz / The Journal of Regulation, 207 p. 
  • Kevin Murphy, Machine Learning. A probalistic Perspective, Cambridge, The MIT Press, 2012