Pour éviter que big data ne rime avec big cata

Dans un article intitulé « Les algorithmes ont eux aussi besoin de managers », la version française de la Harvard Business Review rappelle quelques règles simples pour tirer toutes les potentialités du big data.

Dans un contexte où le big data est souvent présenté comme une panacée apte à résoudre tous les problèmes, un article rédigé par Michael Luca, Jon Kleinberg et Sendhil Millaninathan pour la version française de la Harvard Business Review, rappelle quelques vérités indispensables à propos de ces techniques prédictives. L’espoir placé dans ces méthodes est tel que les déconvenues risquent d’être aussi big que les espoirs placés aujourd’hui et vraisemblablement déçus demain.

Car le big data n’est pas une sorte de super magicien capable de décider à la place des humains. Loin de là, expliquent en substance les trois auteurs. Ce sont un ensemble de méthodes qui peuvent aider à la décision, l’éclairer, à condition de savoir bien les utiliser.

UNE BOITE NOIRE QUI NE SAIT PAS POURQUOI ELLE FAIT CE QU’ELLE FAIT

Le trio de chercheurs (deux à Harvard, un à Cornell) rappelle deux vérités : les algorithmes font « ce pour quoi ils ont été conçus » et rien de plus ; il s’agit de « boites noires qui ne peuvent donc expliquer pourquoi ils proposent des recommandations particulières. » Par exemple, ils rappellent qu’ »un algorithme peut vous dire quels sont les employés les plus susceptibles de réussir, sans identifier les compétences qui sont les plus importantes pour parvenir à réussir. »

 

Pour étayer leurs propos, les auteurs utilisent de multiples cas concrets qui montrent quelques-uns des biais qui peuvent mener à des décisions absurdes si l’algorithme a été mal programmé. Ils insistent sur la nécessité de définir un objectif principal, mais aussi d’éventuels objectifs secondaires. Pour cela, il faut que les utilisateurs n’hésitent pas à les exprimer. S’appuyant sur l’exemple d’un algorithme chargé d’aider les autorités d’une municipalité à identifier les restaurants les plus susceptibles d’être en infraction avec les règles sanitaires, ils expliquent que son usage devenait sensible car ses résultats étaient liés à la présence de minorités ethniques. Pour éviter ce type de problèmes, il existe des solutions, rappellent les auteurs. L’article rappelle aussi fort opportunément cette vérité de base selon laquelle corrélation et causalité ne vont pas mécaniquement de pair.

 

FORMER LES MANAGERS ET VITE

Mais l’article montre aussi toute la potentialité du big data, avec un exemple d’inspections sanitaires dans des restaurants utilisant les commentaires des internautes sur le site Yelp. In fine, le même taux d’infractions a été détecté mais avec 40% d’inspecteurs en moins. Le travail avait été préparé en amont par les algorithmes dûment informés. L’un des enjeux majeurs est donc de « nourrir » les algorithmes avec des données pertinentes pour éviter de démontrer que l’eau froide est froide ou pour arriver à des conclusions mi-chèvre mi-chou. Les auteurs insistent sur la nécessité de diversifier les sources, d’avoir des informations indépendantes les unes des autres.

 

Cet article court (cinq pages) et écrit dans un langage très clair présente le mérite de recadrer les possibilités du big data. Il rappelle aussi l’urgence de former les opérationnels qui vont demain manier ces outils, pour qu’ils aient conscience de leurs limites, autant que de la puissance des potentialités offertes.

Comments are closed.