jeudi 7 janvier 2016

Les mots et les choses dans les titres de la presse française


L'analyse lexicologique porte sur l'ensemble des termes présents dans les titres du corpus : tous les nouveaux titres et tous les hors-séries depuis 2003, soit 24 080 titres. Sont exclus de la collecte les titres de jeux et mot croisés, les titres de la presse syndicale et d'entreprise, de la presse des administrations territoriales, de la presse électorale, associative, etc.

Avant le comptage, nous avons effecué un nettoyage en plusieurs étapes. D'abord en excluant les signes de ponctuation (on compte 1092 points d'exclamation et 246 points d'interrogation), puis en évacuant les mots-outils et mots vides (stop words) : prépositions, conjonctions, articles, pronoms. Enfin, nous avons pratiqué une lemmatisation pour ne garder des mots que leur forme canonique (infinitif, masculin, pluriel). Sont regroupées à cette occasion les orthographes diverses d'un même terme (erreurs, translittérations variables de mots arabes, chinois, japonais, russes, turcs), des équivalences (& / et), recours ou non au tiret, abrévations, abandon ou non de signes diacritiques (accents)...
Source : Base presse MM (le comptage est arrêté au 1er décembre 2015). Cette statistique est issue d'un travail de recherche
dont les principaux résultats ont fait l'objet d'une communication au séminaire Média de l'IREP en décembre 2015.

L'histogramme obtenu pour la distribution des mots évoque la loi de Zipf. Une longue traîne de mots dont peu de mots émergent en tête de distribution.

La syntaxe des titres ne fait pas dans le sentiment (ou très rarement), elle est strictement dénotative faite de juxtapositions (parataxe de mots), de génitifs. On compte 5 144 prépositions "de", 2 004 conjonction "et" (hypotaxe), 1 017 "en".
"Vous", vocatif de l'apostrophe est présent 118 fois avec les adjectifs possessifs "votre" et "vos" (509) : injonctions à la participation, à l'appropriation, à la personnalisation de la réception peut-être (cf. le nombre de points d'exclammation : 1092 contre 246 ). Acte de langage, valeur performative. "Montez votre PC 100% gaming" (H-S PC Gamer), "Votre grand horoscope", "Réussir votre prépa" (Jogging international), "Votre histoire", "Rénover votre maison" (H-S Viva déco),  Défendez vos droits, "Les médicaments et vous" (H-S Notre Temps), etc.

Au terme de cette analyse, qu'avons-nous pu apprendre ?
  • Le mot le plus fréquent est "guide", il appartient à la définition d'un genre intervenant dans la composition d'un magazine tout comme les mots "recettes", "achat" et "idées". La dimension primordiale de la presse française, et la raison essentielle de son succès, est sa fonction d'utilité (cardinale), la satisfaction des consommateurs (lecteurs utilisateurs). 
  • Passés les 1 000 premiers mots, on peut observer une longue longue traîne de 13 000 mots mobilisés par les titres. Effet indirect de la loi Bichet : la presse magazine est diverse, changeante, riche. Des milliers de mots n'ont qu'une occurence. Richesse de mots, diversité d'idées ?
Les mots qui suivent le mot "guide" (fréquence décroissante) énoncent des thèmes, des domaines d'application de ces genres : cuisine, automobile, maison, histoire, sport... Cette liste corrobore celle des domaines distingués dans l'analyse en catégories et centres d'intérêt.
Le titre, s'il est l'élément majeur du paratexte -pour reprendre l'expression de Gérard Genette dans Seuils, relève surtout du marketing, qu'il s'agisse des titres de presse ou des titres de livres. Il appartient d'abord au packaging.

2 commentaires:

Meissonnier Olympe a dit…

Aussi marketing soient-ils, les titres sont un packaging révélateur non seulement du contenu mais aussi de la tonalité de la presse qui le choisit. L'usage des pronoms est bien connu par les publicitaires, au même titre que les impératifs, censés provoquer un engagement immédiat chez le lecteur. L'égocentrisme des humains - consommateurs de contenus culturels - n'est plus à prouver, qu'on parle de l'identification en fiction ou de "loi du kilomètre" en information : on se sent plus impliqué par un titre qui nous touche ("vos camélias ne remercieront jamais assez", "êtes-vous une maman débordée ?", "votre voiture en 2016...") que par un titre factuel, au risque de négliger le contenu réel de l'article. Tel est le prix à payer par les journalistes pour faire exister leur papier dans l'économie de l'attention.

La stratégie du titre est également fascinante sur le web, où l'on voit des pratiques nouvelles se dessiner sur les réseaux sociaux et agrégateurs d'articles : puisqu'il faut capter l'attention et concurrencer des centaines de contenus, ce n'est pas à l'intelligence rationnelle que l'on fait appel mais à la perception émotionnelle : il faut vendre une expérience inédite, une émotion, un moment unique, la promesse d'une surprise, d'un choc, d'un attendrissement... ("Ce que fait cette maman est absolument incroyable", "vous ne croirez pas à la transformation de cet homme"). On ne sait pas exactement ce qu'implique cette introduction, mais la curiosité est d'ores et déjà attisée. Il serait intéressant d'observer l'évolution de la presse, et l'éventuelle mutation des écritures de magazines pour correspondre au format "web" qui leur ravit une telle part de lectorat.

Une deuxième interrogation qui s'esquisse dans cette analyse des titres concerne la notion de longue traîne, qui est effectivement très courante en linguistique mais est aussi largement employée dans les circuits de distribution. La taille de la traîne de mots peu employés pose la question de la diversité de contenus : les publications peuvent-elles survivre à une exploitation papier (coûts fixes et variables très élevés) ou devront-elles à terme migrer sur le web ? Avec un coût marginal de diffusion nul, les sites internet semblent être une alternative rassurante pour la survie de la diversité alors que le papier pourrait tendre soit à la généralisation des offres premium à tarifs très élevés qui rapprocheraient la presse d'une gamme d'édition (de 5 à 15 euros), ou au contraire une désaffection progressive des titres thématiques au profit du web, laissant le papier aux quotidiens d'information et aux magazines généralistes à "forte audience"... Ces deux phénomènes seront certainement combinés, mais dans ce contexte de mutation médiatique, la longue traîne (de mots comme de contenus) n'aura probablement pas d'avenir dans les kiosques.

Chenai Soumaya a dit…

Une analyse très singulière, qui permet de connaître les tendances actuelles. En effet, les titres de la presse française permettent de connaître la tendance dans une ville ou un pays donné à un instant T.
Entre 2003 et 2016, une évolution des figures de styles doit également être perçue.
Au niveau des idées de sujet, les thèmes les plus actuels doivent être les plus récurrents dans le sport, la cuisine ...
Il serait intéressant de comparer avec d'autres grandes villes telles que NYC, Londres ... afin de comprendre si la mode se reflette dans différentes population...