dimanche 21 juin 2009

Not a home run


"Maybe you could say we are safe on third right now, [...] Third base I think is the process we are going thorough this weekend, which I think is proving by and large about what we expected it to be."

De quoi parle-t-on ? De baseball, de softball ?
Non. Ces phrases sont extraites d'une déclaration du Président de la FCC, à propos de la transition numérique de la télévision terrestre américaine (notre post du 13 juin 2009, "Kiss analog goodbye") : le Président explique que l'opération n'est pas, et ne saurait encore être déclarée un "home run". Seuls les trois quarts du chemin ont été parcourus.

Comment un moteur de recherche lexical traite-t-il un tel énoncé ?
Il s'agit de baseball ou de softball : on y reconnaît le vocabulaire de base(s) du passe-temps américain de l'été. On y retrouve aussi une métaphore d'adolescents américains pour décrire leur expérience amoureuse. Il s'agit d'une métaphore pour indiquer la progression, la réussite d'une opération. La partie de baseball se joue sur quatre bases, la quatrième étant appelée home base. Le home run désigne une réussite parfaite, acquise du premier coup. Culture de base donc, populaire s'il en est.

Or, il s'agit de télévision et de la diffusion numérique.
Le moteur de recherche, encore lexical, prend les mots au pied de la lettre. Tout comme la traduction automatique. Les automates y trouveront donc le lexique du baseball. La culture leur échappe, trop subtile. Et si l'on se met à écrire pour de tels outils de recherche ou de traduction, comme il est recommandé aux journalistes dans certaines rédactions (il faut écrire pour être trouvé par le moteur de recherche, etc.), la pauvreté langagière menace. Plus de métaphores, plus d'allusions...

Essayez "Third base" dans Google... qui place Wikipedia en tête, ou encore : dans Urban Dictionary, dictionnaire d'argot américain contemporain.

2 commentaires:

Periwinkle Blue a dit…

Good eye! And a "home run" for you!!! Hope this link "scores" with your readers...

http://www.youtube.com/watch?v=B0MIP6wUE-

Simona Candrian a dit…

J’espère vraiment que les journalistes ne se laissent pas trop encadre par la logique numérique. Je comprends que les articles sont censés être trouvés par les moteurs de recherche, mais ce n’est pas bien, si les articles doivent s’adapter aux logiques numériques. Les outils de recherche ou de traduction doivent s’adapter aux articles. Veut dire que les outils doivent être développés jusqu’ils sont capables à comprendre tous les formes de la langue. Je peux imaginer que ça fonctionnera avec un code pour des mots reliés. C’est claire que cette fonction compliquera le travail de Google, en particulier parce que les métaphores par exemple, diffèrent d’une culture à l’autre. Mai ce jeu en vaut la chandelle (cette métaphore m’a dit leo.org, j’espère qu’elle va bien ici) pour préserver des cultures.