Et peu importe le pourquoi du comment de cette “vraie” régularité. Peu importe que la vidéo 1 soit une vidéo sur la confection des Momo (plat traditionnel tibétain) en tibétain, que la 2 parle de ferronnerie et la 4 de skate. Peu importe de savoir si Mathieu (l’humain 3) n’a pas aimé les vidéos sur la confection de momos parce qu’il n’a pas l’âme d’un cuistot ou bien parce qu’il ne pipe rien au tibétain. Peu importe d’avoir l’explication de ce résumé matriciel et peu importe surtout si les recommandations qu’il contient nous précipitent dans “la vallée du collapse”.
L’algorithme n’a pas besoin de nommer les critères pour qu’ils soient pertinents et efficaces. Et c’est bien là l’enjeu de le laisser faire des regroupements dont la signification ne nous est pas forcément évidente.
Si sur les 1242 vidéos que vous avez regardées pendant l’été, 1242 étaient en français, vous ne verrez probablement pas passer beaucoup de vidéos en tibétain dans vos recommandations. La connaissance des raisons de votre obsession des vidéos francophones n’est pas nécessaire pour que la décision algorithmique soit efficace du point de vue de l’objectif qu’on a donné à cet algorithme.
La stratégie derrière une telle recommandation, si elle avait été pensée consciemment par le créateur des regroupements “spectateur francophone” et “contenu en tibétain non sous titré”, n’aurait eu aucun mal à être comprise et analysée. On aurait pu dans ce cas tenter d’anticiper les conséquences de ces regroupements et des recommandations qui en découlent. Par exemple, il est à prévoir une méconnaissance crasse des individus francophones sur la manière de bien confectionner le Momo ainsi qu’une stagnation de leur niveau de tibétain.
Le problème est qu’on ne connaît pas “à priori” ce qu’expriment les régularités que l’algorithme de recommandation va dénicher et qu’il ne nous les explique pas. On sait juste que ces regroupements expriment une régularité dans les goûts et les couleurs des usagers de la plateforme. Si un regroupement trouvé par l’algorithme signifiait par exemple que les gens qui aiment regarder des vidéos de fitness étaient bien plus sensibles que la moyenne aux vidéos “lifestyle” d’un illuminé perpignanais¹⁴ vous expliquant que se nourrir exclusivement des rayons du soleil, c’est excellent pour la santé. On serait contraints de le comprendre et de constater les conséquences dramatiques de ce regroupement à posteriori, une fois les urgences pleines d’adeptes curieusement affamés…
L’algorithme résume la table à “sa” manière (autrement appelé factorisation comme on l’a vu). Ses regroupements sont mathématiquement justes et pertinents mais il n y a aucune raison qu’ils correspondent à des catégories que nous aurions nous humains voulu utiliser (comme la catégorie “film d’action” ou bien la catégorie “documentaire”). C’est ainsi que dans l’histoire de Christiane C., on a constaté après coup que l’algorithme avait créé une catégorie qui, si on se risquait à la traduire en langage humain aurait pu porter le label : “utilisateur dont l’attention peut être retenue par le contenu à tendance pédophile”.
Les tableaux du dessus avec une telle légende, ça sent quand même pas très bon l’intérêt général. C’est pourtant ce qu’il s’est passé et continue de se passer tous les jours…
On ne comprend pas à priori les catégories créées. Il faut réaliser que cette opacité technique déjà présente dans le cas d’une technique aussi “simple” que celle qu’on vient de voir redouble d’épaisseur dès qu’on touche à des techniques comme l’apprentissage profond et les réseaux de neurones avec lesquels il est encore plus aisé de n’absolument rien comprendre du pourquoi du comment d’une décision, d’une évaluation ou d’un jugement. Il est aussi ardu de comprendre exactement comment ils fonctionnent que de constater qu’ils “fonctionnent” parfois diablement bien. La tâche de ceux qui veulent rendre ces domaines “explicables” me semble aussi immense qu’importante.¹⁵
Toutes ces opacités techniques sont autant de murs derrière lesquels peuvent se cacher les plateformes lorsque face à une commission d’enquête parlementaire, ils nous sortent, une main sur le coeur et l’autre sur la bible #US-Style, des tirades de ce style :
“On ne sait pas, on n’est pas tout à fait certains qu’en voulant extraire de l’attention, on n’est pas en train de saborder les fondements de nos sociétés démocratiques. Peut-être que oui, peut-être que non, en attendant d’être certains, laissez nous faire ce qu’on veut parce qu’économiquement, on est quand même hyper importants !” ¹⁶
Et ils ont raison, on n’en est pas certains comme nous restâmes incertains trop longtemps de la responsabilité des activités humaines dans le changement climatique ou bien de la responsabilité du tabagisme dans les cancers du poumon. Mais lorsqu’on arrive à un virage serré, on a beau être incertain de la présence d’une autre voiture arrivant en sens inverse, on n’accélère pas pour autant, surtout si on discerne un éclairage pouvant (mais toujours pas certain hein) être provoqué par une voiture.