L'accumulation de toutes sortes de données, open ou big data, pourrait faire croire à une source de connaissance en soi. Mais il n'en est rien : les données ne sont jamais neutres.
Il nous faut admettre que les nouvelles technologies ne se substituent pas simplement aux anciennes. Elles se diffusent, escortées des prémisses d'un monde nouveau et de nouvelles manières d'être ensemble. Ce monde futur et déjà-là ne peut se confondre avec l'ancien. Il n'en est pas la simple amélioration. Les nouvelles technologies ignorent l'accumulation des savoir-faire, leur complémentarité. Elles imposent des manières de penser et de vivre inédites que leurs fonctionnalités contiennent. Leur manipulation dilue à notre insu le monde ancien, le plus souvent avec douceur, parfois avec inquiétude ou brutalité. De plus, l'économie de ces technologies est inhérente à leur conception comme à leur diffusion. Elle n'est pas la simple condition de leur apparition. La pensée économique n'offre guère d'espace critique à qui aurait l'ambition d'observer de l'extérieur le rôle des technologies sur la transformation des manières d'être ensemble.
Prenons le cas des data, qu'elles soient des open data, c'est-à-dire ces données disponibles pour être traitées par des machines contenant des Systèmes de Gestion de Base de Données, puis par des citoyens qui en feront librement usage, ou qu'elles soient des big data, ces ensembles mouvants de données hétérogènes produites en temps réel à partir d'une multitude de sources publiques ou privées, locales ou mondiales.
Il faut distinguer trois niveaux. Le premier est celui du statut de la vertu heuristique de ces données, une fois admis qu'un élément ou qu'un regroupement d'éléments de savoir sensibles ou chiffrés équivaut à une sorte de préconnaissance disponible pour construire une connaissance valide au regard des canons scientifiques. Le deuxième concerne l'interprétation des résultats obtenus par l'exploitation des données. Cette interprétation est constitutive de toute connaissance. Le troisième a trait à l'application des résultats au domaine de la vie sociale.
Deux questions se posent. La première est d'ordre épistémologique et technique : comment interprète-t-on toutes ces données disponibles ? La seconde est plutôt politique : dans quel but le fait-on ?
L'exploitation des data miningsuppose de définir intentionnellement des modalités d'extraction. Certaines données sont disponibles, d'autres sont à constituer. Les open data sont sollicitées pour éclairer des hypothèses de recherche ou orienter des programmes d'action. Les big data, par leur fluidité, leur intemporalité, leur recomposition permanente pourraient offrir la même fonction, mais ce n'est pas sûr. L'élargissement tous azimuts des sources d'informations à traiter, la sophistication des outils de traitement pourraient donner à croire que l'accumulation constitue une source de connaissance en soi. Mais les données ne peuvent être qualifiées de neutres, ceux qui les ont produites portaient des intentions en tête. De même, les résultats obtenus ne peuvent être considérés comme bruts. Ils sont a minima orientés par les modalités de recherche, même si l'intention préalable qu'inspirent ces modalités n'est pas toujours connue des chercheurs, des stratèges commerciaux, des politiciens ou des citoyens engagés dans l'action politique.
Une illusion nous guette. La sophistication des modes d'extraction, l'augmentation des données disponibles et produites pourraient nous faire croire que les uns et les autres constituent des connaissances, naturalisant à la fois notre vision du monde et les décisions prises au nom des data ? Il importe de préserver la dialectique existante entre la fabrication machinale des données et leur prise en main par les citoyens.
Aucun commentaire:
Enregistrer un commentaire