Parfois j’ai du pot et parfois pas tout à fait

Mon éditorial

Ce dernier temps je me suis engagé très sérieusement dans la conception des milieux expérimentaux pour l’absorption des nouvelles technologies. Ce qui m’intéresse c’est le comportement humain dans le processus d’absorption de l’innovation. Je me suis dit que nous sommes plus nombreux que jamais sur cette planète et lorsqu’il y a plus de monde dans un espace constant, cela veut dire plus d’interactions humain-humain dans l’unité de temps, ce qui à son tour veut dire apprentissage plus rapide et plus d’expérimentation. Je me suis aussi dit qu’en dépit d’avoir appris pas mal des trucs utiles dans l’expérimentation avec les technologies nouvelles, nous sommes toujours plutôt maladroits lorsqu’il est question d’expérimenter avec nos propres structures sociales. La notion-même tend à avoir une très mauvaise presse – les associations d’idées genre « Corée du Nord » ou bien « goulag » viennent presque spontanément à l’esprit – seulement il vaut mieux se rendre compte que nous expérimentons avec nos propres structures sociales de toute façon. Tout changement des politiques publiques – santé, éducation, emploi etc. – que les hommes politiques présentent comme des solutions uniquement bénéfiques pour leurs nations respectives sont, en fait, toutes faites d’expérimentation. Si on ôtait, pour quelques minutes, le masque professionnel d’assurance du visage d’un homme ou une femme politique qui nous présentent un nouveau projet de loi, nous pourrions voir la même incertitude qui accompagnait un inventeur du XIXème siècle qui mettait en marche un prototype nouveau de moteur ou de turbine et priait pour que le truc ne pète pas immédiatement.

Tout apprentissage est donc fait d’une séquence d’expériences, même si nous ne nous en rendons pas compte. Si de toute façon nous expérimentons avec nos structures sociales, autant apprendre à le faire bien, avec un maximum des résultats et un minimum des dégâts. Une bonne expérience scientifique consiste à créer un environnement contrôlé, où nous pouvons provoquer des phénomènes alternatifs et les observer de façon plus précise, plus rapide et moins coûteuse que l’observation des mêmes phénomènes, surtout dans leur occurrence alternative, dans la vie réelle. Une expérience réduit le temps et le coût d’observer les façons alternatives de faire la même chose. Si je veux créer un environnement expérimental pour observer les façons dont les gens absorbent les nouvelles technologies, je peux commencer, par exemple, avec un raisonnement en parallèle, où je mets des variables contrôlées côte à côte avec les variables observées.

J’ai l’impression qu’il est temps de puiser un peu dans la littérature du sujet qui, dans ma discipline de recherche, semble être le plus proche d’expérimentation pure et dure : l’économie béhavioriste. Un peu par tradition, on attribue les débuts de l’économie béhavioriste à Herbert Simon (1955[1]). Comme j’aime bien lire ma littérature dans le sens inverse, de la fin vers le début, je commence ma revue de la théorie d’Herbert Simon par l’annexe à l’article proprement dit. Dans la science, c’est comme dans un contrat : les trucs les plus intéressants sont souvent mis dans l’annexe. Alors, cette annexe décrit un problème pratique : j’ai une maison à vendre et le prix du marché change dans le temps. D’abord, la mise en scène exacte. Chaque jour k, j’établis un prix de départ, acceptable pour moi, que Herbert Simon symbolise avec d(k). Si le jour k je reçois au moins une offre égale ou supérieure à d(k), je vends la maison à ce prix. Si je reçois plusieurs offres égales ou supérieures à d(k), je vends la maison au plus offrant. Si je ne reçois aucune proposition au moins égale à d(k), je retiens la maison jusqu’au prochain jour d’enchères et pour ce jour prochain j’établis un nouveau prix de départ d(k + 1). A chaque moment donné, je connais les prix passés mais les prix futurs restent incertains. Comment puis-je choisir le meilleur moment pour vendre ? Herbert Simon dit que dans une telle situation je peux former une stratégie subjectivement rationnelle, où j’utiliserai ma connaissance d’offres passées pour établir un prix de départ qui va maximiser ma valeur espérée V{d(k)}.

Bon, ça c’est le problème pratique et maintenant je bondis en arrière, vers le début de l’article, et je commence bien gentiment, par le début du discours théorique. Herbert Simon commence par assumer que l’ensemble des stratégies de comportement que je considère comme possibles dans la situation donnée sera, en fait, un sous-ensemble de l’ensemble total des comportements réellement possibles. Herbert Simon approche donc la rationalité limitée dans les choix économiques par le côté étroit, pour ainsi dire : il assume que les choix parfaitement rationnels prennent en considération un éventail des comportements possibles plus large que celui perçu par les agents économiques réels, qui ont une vision systématiquement rétrécie.

A l’époque (les années 1950), une assomption de ce genre était presque une révolution copernicienne par rapport au corset artificiellement étroit imposé par la théorie économique classique, où les choix économiques étaient soit pleinement rationnels soit ils n’étaient pas des choix économiques du tout. Seulement moi, j’ai à l’intérieur de moi ces trois personnages distincts qui m’accompagnent dans mon voyage de découverte : le bouledogue joyeux, le singe curieux et le moine austère. Ce dernier est un peu dangereux, comme il adore manier le rasoir d’Ockham et poser des questions embarrassantes du genre « Comment pouvons-nous être sûrs que la chose X est vraiment la chose X ? Ça pourrait aussi bien être la chose Y, avec juste un peu de ressemblance à X… ».

C’est bien le moine qui commence la bagarre, cette fois. Comment pouvons-nous être sûrs, dans un cas donné, que l’assomption d’Herbert Simon est vraie ? Oui, il est bien vrai que dans la vie quotidienne nous avons une tendance patente à rétrécir, par la peur et l’ignorance, l’étendue de nos possibilités. Seulement une tendance ce n’est pas la même chose qu’une structure de réalité : c’est l’une des structures possibles. Je connais ces situations dans la vie, lorsqu’une compagnie exquise, combinée avec une consommation un peu excessive des spiritueux, me fait faire des plans et des promesses qui s’avèrent terriblement embarrassantes le jour prochain : je prends en considération un éventail plus large des comportements que celui qui m’est réellement accessible ici et maintenant. Dans des cas extrêmes, je peux même aller, mentalement et momentanément, dans un univers parallèle où pas une seule, parmi les stratégies que je considère tout à fait sérieusement (pour le moment), ait une correspondance quelconque avec la réalité. Il y a aussi ces cas mixtes, souvent rencontrés dans les décisions d’affaires, quand certaines de stratégies que je prends en compte sont tout à fait rationnelles pendant que d’autres ne sont pas réalisables du tout.

L’assomption d’Herbert Simon – que dans me choix économiques je prends systématiquement en considération moins d’options qu’il en ait en réalité – est donc un cas spécial. Le cas général, c’est une situation où ces deux ensembles des comportements – l’ensemble A des tous les comportements réellement possibles et l’ensemble Am des comportements que je perçois subjectivement comme possibles – entretiennent des relations tout à fait libres. Am peut être contenu dans A ou bien l’inverse ; Am peut être complétement disjoint du A ou bien ils peuvent avoir une partie commune et des parties disjointes. C’est fou le nombre des trucs qui peuvent arriver lorsqu’on pense sérieusement à tout ce qui peut arriver.

Ces relations mathématiquement libertines entre le concevable et le perçu sembles être la pierre angulaire de l’économie behavioriste. Tout en admettant que les choix économiques que nous faisons sont généralement rationnels, les béhavioristes assument que toute solution économique – optimale ou pas –  est atteinte à travers une séquence de x essais, où x peut se ranger entre 1 et une limite indéfinie a priori, et chaque essai est un test de perception et de compréhension de la part des agents économiques impliqués.

Bon, prouesse théorique bien exposée, il est temps que je revienne à la réalité. Mon moine austère interne me demande : « Bon, tout ce truc des relations variables entre A et Am, qu’est-ce que ça prouve en ce qui concerne cette vente immobilière ? Quand est-ce que je dois vendre ? ». Alors, cette annexe dans l’article d’Herbert Simon aboutit à la conclusion que je peux former une stratégie de vente autant plus proche de la solution idéale que ma connaissance de l’occurrence des prix est étendue. Plus des jours d’enchères j’ai traversés, plus j’ai d’information sur les prix qui sont réellement pratiqués dans le marché. Avec un peu de chance, je peux percevoir un cycle dans ces prix et avec un peu de grâce dans mes mouvements je peux cibler le sommet de la crête. En généralisant, si mon Am se contient dans A, chaque expérience consécutive m’approche d’une perception de plus en plus pleine et de plus en plus fidèle de A. La perfection n’est jamais possible mais je peux apprendre à faire des décisions de mieux en mieux ciblées. C’est donc un cas d’apprentissage béhavioriste positif.

Maintenant, je renverse la relation : je pense que je peux plus que je peux réellement, donc mon ensemble Am est plus spacieux que l’ensemble A et le contient. Chaque essai que je fais peut se terminer par un succès – l’action entreprise s’avère réalisable – ou bien par un échec, quand l’action que j’ai prise se contient dans cet excédent de mon Am à l’extérieur d’A, dans ce domaine des tapis volants, épées dotées des superpouvoirs ainsi que des taux de retour sur investissement aux alentours de 200% par semaine. Là, mon apprentissage peut se passer de trois façons différentes. La première est la plus simple et la plus facile, puisqu’elle imite le cas précèdent : chaque fois que je prends une décision, j’ai suffisamment de pot pour que mon comportement choisi dans l’ensemble Am atterrisse dans l’ensemble A. En Pologne, nous appelons ça « plus de chance que de cervelle ». Remarquez : il suffit que ça marche juste une fois ou deux et j’ai des fortes chances d’acquérir un peu plus de cervelle, qui va remplacer la chance le cas échéant, et je peux me trouver dans la situation bénie de mon Am contenu dans A, donc dans l’univers théorique d’Herbert Simon. C’est pas mal, comme univers : ça avait valu un prix Nobel d’économie.

En revanche, si je n’ai pas assez de chance pour que son surplus remplace le manque de discernement de ma part, mes premiers choix sont ratés : je choisis, une fois ou deux (bon, pas plus de cinq, quand même) des tels comportements dans mon Am qui se trouvent en dehors du A, donc qui sont tout simplement irréalistes. Je commence mon apprentissage par une série d’échecs. L’absence de succès me décourage et j’arrête complètement d’expérimenter avec le choix économique donné. C’est le cas d’apprentissage béhavioriste négatif.

Il y a enfin un troisième chemin d’apprentissage, lorsque au moins certaines de mes options dans l’ensemble Am sont suffisamment erronées pour se trouver à l’extérieur d’A, mais certaines autres sont acceptablement raisonnables, et au tout début de mon parcours parfois j’ai du pot et parfois pas tout à fait. Je combine des succès et des échecs. C’est un chemin d’apprentissage que je peux appeler « Bayésien », puisqu’il reflète l’expérience décrite par Thomas Bayes en 1763 : mes succès et mes échecs me fournissent des informations que je peux utiliser pour définir de plus en plus exactement ce fragment de mon Am qui est identique avec un fragment d’A (options faisables), par opposition au fragment d’Am complétement disjoint d’A (options fantasques). La logique d’apprentissage Bayésien, quand on étudie à fond la pensée de Thomas Bayes, est des plus intrigantes : des séquences différentes des succès et d’échecs peuvent conduire à des savoirs (et des savoirs-faire) complètement disjoints l’un de l’autre.

Bon, je résume. Si chacune de mes décisions est une découverte des possibilités déjà offertes par mon environnement, donc si j’apprends suivant le paradigme d’Herbert Simon, je développe, d’une façon plus ou moins linéaire, un corps de savoir formé par cet environnement.  En revanche, si ma cervelle me permet d’inventer des schémas de comportement complètement irréalistes, tout en me bénissant des passages de réalisme, donc si j’apprends de façon Bayésienne, j’ai des chances presque égales de développer des corps de savoir complètement différents dans le même environnement.

Je retourne maintenant à cette histoire d’environnement expérimental pour des technologies de la ville intelligente. Supposons que je crée un groupe d’utilisateurs qui testent des prototypes et/ou fournissent des informations précieuses à travers leur comportement-même. Si je ne leur permets pas d’avoir ces échecs, donc si je leur donne suffisamment d’information pour qu’ils n’inventent rien de vraiment raté, je les mets automatiquement sur le chemin d’apprentissage béhavioriste positif. Ils vont tous apprendre plus ou moins la même chose et la variable que je peux tester dans un tel environnement expérimental c’est essentiellement leur vitesse d’apprentissage. En revanche, si mon environnement expérimental donne la possibilité de faire quelque chose de vraiment bête et dysfonctionnel, je mets mes utilisateurs-cobayes sur le chemin d’apprentissage Bayésien et ils peuvent développer toute une multitude des savoirs différents.

La même logique accompagne la distinction entre un algorithme classique et l’intelligence artificielle. Si vous avez déjà travaillé avec un compilateur de programmation typique, par exemple celui de Python, il accepte uniquement des trucs qui marchent. Le savoir-faire que vous pouvez développer avec un tel outil est une copie du savoir-faire des créateurs du langage de programmation donné. Si, par contre, vous êtes en interaction avec un outil d’intelligence artificielle, il va accepter vos solutions ratées, donc vos échecs, comme une information de valeur et créer des solutions différentes suivant des séquences différentes des succès et d’échecs de votre part.

Je continue à vous fournir de la bonne science, presque neuve, juste un peu cabossée dans le processus de conception. Je veux utiliser le financement participatif pour me donner une assise financière dans cet effort. Voici le lien hypertexte de mon compte sur Patreon . Si vous vous sentez prêt à cofinancer mon projet, vous pouvez vous enregistrer comme mon patron. Si vous en faites ainsi, je vous serai reconnaissant pour m’indiquer deux trucs importants : quel genre de récompense attendez-vous en échange du patronage et quelles étapes souhaitiez-vous voir dans mon travail ?

[1] Simon A.,H., A Behavioral Model of Rational Choice, The Quarterly Journal of Economics, Vol. 69, No. 1 (Feb., 1955), pp. 99-118

2 thoughts on “Parfois j’ai du pot et parfois pas tout à fait

Leave a Reply