La situation est tellement nouvelle – hommage à John Nash

Je passe en revue les projets sur lesquels je travaille maintenant et je décide de me concentrer plus particulièrement sur l’un d’eux : la responsabilité sociale d’entreprise, ou RSE, dans le secteur d’assurance. C’est l’une de ces fois où j’utilise mon blog comme moyen de faire un point temporaire et partiel sur un sujet de recherche. Le fait de décrire l’état de ma recherche me permet faire de l’inventaire à l’intérieur de ma tête.

Honnêtement, lorsqu’on m’a engagé pour ce projet pour la première fois, je trouvais le sujet barbant comme tout. Oui, chaque entreprise de taille suffisamment importante pour être tenue responsable de quelque chose dans l’environnement social essaie de jouer un jeu à la limite de la gestion et de la communication pure, où cette responsabilité est joliment présentée en une forme des rapports, avec des graphes d’importance, des procédures de consultation avec des partenaires sociaux etc. Cette couche superficielle de RSE est donc, de mon point de vue, tellement imbue d’hypocrisie qu’elle en devient ennuyeuse.

Je fais parfois cette métaphore où je compare mon esprit à trois entités coexistâtes : le singe curieux, le bouledogue joyeux et le moine austère. Eh bien, il y a quelque temps, mon singe curieux interne avait commencé à explorer une forêt nouvelle, celle des valeurs éthiques dans la vie sociale et dans les phénomènes économiques. Je crois que ce voyage particulier d’exploration avait trouvé son point de départ aussi bien dans mon travail de recherche que dans l’introspection de mon expérience personnelle.

Le créneau théorique avait commencé à se clarifier comme je faisais une comparaison récurrente entre la théorie d’équilibre dynamique de John Nash et  la théorie de justice de John Rawls. John Nash postulait que dans tout jeu social les règles du jeu peuvent émerger même sans une régulation explicite, tout simplement comme un point de rencontre et d’équilibre entre les stratégies appliquées par les joueurs. En des termes plus terre à terre : lorsqu’on joue un jeu, on s’observe mutuellement entre joueurs et bon gré mal gré on adapte mutuellement les stratégies du jeu. Comme ça marche essentiellement en boucle du type « Moi je t’observe et je m’adapte, toi tu m’observes et tu d’adaptes », après un nombre fini des tours d’observation et d’adaptation les joueurs établissent des schémas de comportement qui forment ce fameux équilibre dynamique.

Si vous téléchargez l’article de John Nash de 1951 vous trouverez qu’en principe c’est de la mathématique plutôt abstraite, quoi que dans toute cette abstraction il aimait faire des allusions fréquentes au jeu de poker. Allez savoir pourquoi. Dans cette exposition abstraite, le truc qui initialement semble avoir éveillé le plus d’intérêt est le théorème selon lequel la solution de tout jeu se trouve à l’intérieur de l’espace du jeu. Traduit en humain simple cela veut dire que l’équilibre dynamique produit par les stratégies des joueurs peut se trouver à des endroits les plus incongrus pourvu que cet endroit satisfasse les stratégies individuelles. Appliqué à l’économie cela veut dire que les marchés peuvent trouver leurs points d’équilibre temporaire à peu près n’importe où. Tout est possible, quoi.

Les critiques de Nash s’étaient attaché le plus à ce point particulier en démontrant qu’il y a plusieurs phénomènes économiques qui sont des jeux – donc ils se déroulent comme des séquences d’essais et erreurs en présence d’information imparfaite – mais leurs solutions se trouvent à l’extérieur de l’espace de jeu, c’est-à-dire les joueurs doivent optimiser leurs stratégies en fonctions des critères exogènes. La théorie des marchés financiers était, je crois, l’exemple cité le plus fréquemment : lorsque vous mettez au point une stratégie d’investissement, vous pouvez faire des trucs les plus fous mais certains points de repère sont exogènes, comme les taux d’intérêt.

Seulement voilà, ici, il faut prendre en considération une assomption que Nash faisait dès le début et qui – pour des raisons que j’ignore, franchement – le plus souvent passe inaperçue aussi bien des partisans fervents de la théorie de John Nash que de ses critiques les plus sévères. John Nash avait écrit que l’équilibre dynamique était théoriquement possible seulement si la stratégie jouée par chaque joueur individuel était une soi-disant « stratégie dominante » et que cette stratégie dominante doit remplir les conditions suivantes : a) elle doit offrir le gain le plus élevé des toutes les stratégies accessibles au joueur donné b) elle est une stratégie complexe, dans la mesure où elle doit se rendre à une décomposition en des stratégies simples dont chacune maximise une valeur distincte.

Nash avait formulé cette assomption de façon très scolaire et je suppose que cela peut être l’une des raisons pour lesquelles cette pièce de raisonnement mathématique d’une profondeur étonnante semble être royalement ignorée. Décomposons-là donc pour comprendre. Qu’est-ce que ça veut dire qu’une stratégie donnée offre le gain le plus élevé de parmi toutes les stratégies accessibles au joueur ? Parlons-nous du gain strictement objectif et mesurable en tant que tel ? Si tel est le cas, la plupart des jeux que nous jouons n’offre pas de possibilité pratique de mesurer les gains possibles avec 100% de certitude, puisque ces gains sont incertains par définition. Par conséquent, avec cette interprétation de stratégie dominante, l’équilibre dynamique de Nash serait un état qui s’auto-exclue.

Peut-être alors il suffit que les gains escomptés soient simplement mesurables objectivement tout en étant sujets à l’incertitude ? Dans ce cas, une stratégie dominante serait celle que le joueur pense être la meilleure et elle reste dominante – donc elle peut servir de base à construire un équilibre dynamique – même si le joueur se trompe et la meilleure stratégie est en fait une autre, qu’il laisse de côté ou qu’il ne perçoit même pas comme alternative.

Voilà donc la première grande question que le travail de John Nash provoque si on regarde sa théorie vraiment de près : pouvons-nous construire des équilibres dynamiques dans notre société à partir de n’importe quel ensemble des jugements et espérances à propos de l’avenir ou bien y-a-t-il comme un filtre bâti naturellement dans notre culture, qui ne nous laisse pas nous équilibrer, comme société, autour des conneries complètes ? Allons savoir. Peut-être. Ça dépend de ce que nous voulons.

La seconde partie de l’assomption de Nash, donc celle qui réfère à la maximisation des valeurs, est même plus intéressante lorsqu’on y pense. Imaginons notre comportement. Nous faisons des trucs complexes, comme chercher et trouver un emploi, se marier ou démarrer une entreprise. Ce sont des stratégies complexes. Il y a une chance que ces stratégies complexes deviennent des stratégies dominantes, donc qu’elles peuvent mener à l’émergence d’un équilibre dynamique de Nash. Il y a une condition : ces stratégies complexes doivent être liées, sans équivoque, à des valeurs de base qui, à leur tour, sont sujettes à la maximisation.

A première vue, c’est simple. J’ai mes objectifs et je les maximise à travers une stratégie complexe. Seulement voilà, comment étais-je venu à définir ces objectifs précis ? La réponse est relativement claire : si j’ai ne serait-ce qu’un peu de volonté individuelle autonome, mes objectifs sont ce qu’ils sont parce qu’ils maximisent ce qui est cher à mon cœur. Je suis efficace dans l’accomplissement des objectifs qui engagent mes émotions et l’engagement émotionnel, il vient d’un jugement de valeur, donc d’un jugement éthique.

Voilà le secret ninja de la théorie de John Nash. Un équilibre dynamique qui produit une solution au jeu, placée entièrement à l’intérieur de l’espace du jeu, donc faite entièrement par les stratégies individuelles des joueurs, peut se développer seulement si les joueurs ont un ensemble des valeurs éthiques qui peuvent être maximisées.

Quel jeu jouons-nous ? Je veux dire, y-a-t-il une façon scientifique de définir nos valeurs, comme civilisation ? Une réponse qui me vient à l’esprit, est celle liée à l’énergie, donc à cette recherche que je suis en train de faire pour mon projet EneFin, ainsi qu’à une recherche plus fondamentale que j’avais effectuée l’année dernière quant au rôle de l’énergie dans la géographie de la civilisation humaine. Je reprends le modèle que j’ai déjà utilisé, basé sur la fonction de production ainsi que sur son application à la géographie économique, par Paul Krugman. Voilà la logique de base. Toute espèce vivante a besoin d’énergie. En fait, nous pouvons percevoir tout organisme vivant comme un système de transformation d’énergie. Nous, les humains, avons bâti une civilisation qui transforme énergie en deux formes principales : la bouffe et tout le reste. Nous avons besoin de nourriture, d’une part, et nous consommons de l’énergie pour alimenter nos technologies. Nous pouvons assumer que le nombre d’êtres humains vivant dans un endroit donné à un moment donné est une fonction de l’abondance relative en énergie et nourriture :

Population = f(énergie par personne ; nourriture par personne)

En la notation plus élégante de la fonction de production nous pouvons exprimer cette fonction comme :

N = A * (E/N)a * (F/N)1-a    a < 1

…où N est la taille de la population, E/N est l’énergie par tête d’habitant ; F/N est la quantité de nourriture par la même (enfin, probablement la même) tête d’habitant, « a » est un paramètre arbitraire et A est un facteur de proportion.

La théorie de base de cette formule, fournie par le travail de Charles Cobb et Paul Douglas, assume que l’énergie et la nourriture, accessibles ici et maintenant, produisent une utilité agrégée, que nous, les humains, pouvons exploiter pour vivre ici et maintenant. Le surplus théorique, ajouté brillamment par Paul Krugman, assume que dans cette équation, le facteur avec la plus grande exposante est le facteur dominant de changement socio-économique. En effet, si mon énergie par personne a l’exposante comme 0,7 et mon nourriture par personne (donc pour moi) a donc l’exposante 1 – 0,7 = 0,3, tout changement en ce qui concerne la quantité de l’énergie produira un changement relativement plus grand, côté population (donc le nombre des moi qui peuvent vivre ici et maintenant), qu’un changement de même magnitude dans la quantité de nourriture accessible.

Maintenant, imaginons que cette équation est celle d’un jeu de Nash, donc un jeu capable de produire un équilibre dynamique. La taille de la population est l’équilibre en question. C’est le nombre d’humains qui se tolèrent mutuellement ici et maintenant. Ils se tolèrent de façon dynamique – donc le N peut changer – mais en même temps ils se tolèrent de façon prévisible : le N peut changer organiquement, de génération en génération, sans guerres ou exterminations de masse. L’équilibre dynamique en N est associé à un ensemble des stratégies déployées par des individus et des groupes, des stratégies qui assurent la formation et le maintien des réseaux et des hiérarchies qui tous ensemble forment la structure sociale.

Les stratégies capables de produire l’équilibre dynamique en N doivent être des stratégies dominantes, donc celles dont les joueurs peuvent rationnellement espérer des gains les plus substantiels eu égard aux valeurs de base qu’ils veulent maximiser. Dans cette équation il y a juste deux valeurs de base : l’accès à l’énergie et celui à la nourriture. Lorsque c’est l’énergie (E/N) qui a une exposante prépondérante dans ce jeu, donc lorsque « a > 0,5 », les stratégies qui s’équilibrent en N seront orientées surtout sur l’appropriation et le contrôle de l’énergie. Celles centrées sur l’acquisition de la bouffe seront relativement moins importantes. En revanche, si « a < 0,5 » et si donc c’est l’accès à la nourriture (F/N) qui est l’atout dans ce jeu, l’équilibre

Ça devient un peu théorique, tout ça. Je le sens. Il est temps de faire un saut vers le monde réel. Ledit monde réel est habité par plus de 7 milliards d’humains. Sommes-nous en équilibre dynamique, comme espèce planétaire ? Jusqu’à récemment, j’avais accepté, à ce sujet, les résultats de recherche obtenus et publiés par d’autres chercheurs. Vous pouvez voir ce raisonnement dans mon livre intitulé “Capitalism and Political Power”. J’y cite, par exemple, les travaux de Ehrlich & Ehrlich 2013[1] ou bien la ligne de recherche de Club de Rome qui se somment à dire que la Terre est sévèrement surpeuplée et que la race humaine devrait s’efforcer de réduire son empreinte sur la biosphère de la planète.

Néanmoins, ces derniers mois, je suis en train de changer mon approche, précisément comme je réfléchis sur les valeurs éthiques qui me sont chères. Je suis un homme simple. Lorsque je me dis qu’un truc est important comme valeur éthique, je mets mon énergie personnelle, tous les jours, dans la réalisation de cette valeur. Si j’assume que la Terre est surpeuplée, mon action éthique à prendre tous les jours, ce serait quoi, au juste ? Génocide ? Je trouve ça un peu bête. C’est comme si je me trouvais dans un l’une de ces banlieues à haute criminalité et haut risque et – en face de ces risques – je jetais mon portefeuille et mes clés de la voiture dans l’égout et je cognais ma tête contre le mur le plus proche.

D’autre part, avec chaque année de ma vie je me rends de plus en plus compte qu’il faut prendre ses responsabilités, dans la vie. Si j’habite quelque part et je constate que ma présence a un impact sur cet endroit, le comportement responsable consiste à contrôler cet impact, pas à me suicider ou à fuir.

De toute façon, j’essaie donc de réassumer à travers ma propre recherche la question de population, en la posant comme question d’équilibre dynamique de Nash. Si je peux démontrer que – contrairement à ces chercheurs que je viens de citer – la population humaine sur Terre est grosso modo en équilibre avec l’énergie et la nourriture accessibles, je peux ensuite interpréter les exposantes sur le côté droit de l’équation comme des valeurs maximisées dans les stratégies d’acteurs sociaux.

Bon, je démontre donc. Je prends les données de la Banque Mondiale sur la population de la Terre (donc le côté gauche, le « N » de l’équation N = A * (E/N)a * (F/N)1-a    a < 1 ) ainsi que sur la consommation moyenne d’énergie par personne. D’autre part, j’utilise les données du service FAOSTAT en ce qui concerne la consommation moyenne de nourriture en kilocalories par jour par personne. De tout en tout, pour ces trois variables empiriques, j’ai des séquences temporelles qui se correspondent mutuellement de 1971 jusqu’à 2013. Comme je l’avais appris l’année dernière, le test de l’équation N = A * (E/N)a * (F/N)1-a    a < 1 a des chances de marcher si j’exprime la population en millions, la consommation d’énergie par personne (E/N) vient en tonnes d’équivalents pétrole par an par personne et la consommation alimentaire (F/N) est exprimée en mégacalories par an par personne.

Je mets tout ça dans un fichier Excel commun et je teste en récurrence avec des valeurs différentes de l’exposante « a ». Le but du test est de trouver une telle valeur en « a » pour laquelle le facteur de proportion « A », mesuré comme la moyenne des « A » locaux pour chaque année de 1971 à 2013, soit aussi près de A = 1 que possible. En d’autres mots, je veux savoir si je peux trouver une telle exposante « a » qui rende possible un équilibre général entre la population humaine sur Terre et ses ressources.

Je tombe sur des « A » intéressants pour 0,23 ≤ a ≤ 0,24. Dans cette fourchette de valeurs mon équation produit, respectivement, un « A » moyen égal à 1,025556523 pour N = A * (E/N)0,23 * (F/N)0,77 et A = 0,952317642 pour N = A * (E/N)0,24 * (F/N)0,76. La meilleure approximation possible de la population humaine sur la planète est donc obtenue avec un paramètre « a » qui suggère que nos stratégies d’interactions sociales sont orientées sur la maximisation d’accès à la nourriture – comme valeur de base dans la logique d’équilibre dynamique de Nash – bien plus que sur l’accès à l’énergie non-alimentaire. Nous sommes toujours décidément plus bouffe que techno. Pas très ambitieux pour une civilisation qui veut coloniser Mars. Enfin, on fait avec ce qu’on a.

Développons un peu sur cet équilibre. Pour vous en donner une idée plus claire, je place ci-dessous un graphe comparatif, avec trois lignes qui représentent la population réelle de la Terre, comparée aux populations modèles selon l’équation N = A * (E/N)a * (F/N)1-a    a < 1.

Population réelle de la Terre comparée aux populations modèles 1

Nous pouvons constater que les deux lignes des populations modèles, qui rendent un équilibre raisonnablement cohérent en « N » sont plus horizontales que la ligne de la population réelle. La première conclusion, purement mathématique, est donc que dans les années 1970 et 1980, l’humanité avait comme une légère réserve des ressources vitales. Nous semblons avoir passé le point d’équilibre strictement dit entre 1990 et 1996 et maintenant nous sommes en l’état de surpopulation. Mon analyse démontre une surpopulation entre 13% et 22% de ce qui est offert comme équilibre « nourriture – énergie » mais c’est bien moins dramatique que les nombres suggérés par Ehrlich & Ehrlich 2013[1].

Je reviens au sujet des stratégies, des valeurs éthiques et de l’équilibre dynamique de Nash. Comme nous sommes maintenant, je veux dire comme civilisation, nous avons toutes les raisons de donner plus de valeur aux stratégies d’accès à la nourriture qu’à celles donnant accès à l’énergie. Notez que ça change énormément suivant le pays. Maintenant je simule le scénario où, dans l’équation N = A * (E/N)a * (F/N)1-a    a < 1, le paramètre « a » est quelque part dans les 0,76 ≤ a ≤ 0,77. Ce serait la population que nous pourrions développer en devenant une civilisation technologique strictement dite, donc technologique au point de ne plus s’en faire, ou presque, de la bouffe. Le résultat est époustouflant : avec a = 0,76 la population modèle de la Terre est de 313 milliards des personnes et avec a = 0,77 ça donne presque 338 milliards d’humains sur la planète.

Voilà donc une vision bien science-fiction. Si notre civilisation se transforme au point d’assurer un accès acceptablement bon à la nourriture pour la plupart des gens, ladite plupart serait la plupart dans quelque chose comme une ville planétaire, où lest structures urbaines couvriraient pratiquement tout l’espace habitable. C’est bien ça, plus de 300 milliards de gens sur la planète.

Maintenant, je simule le cas inverse : nos stratégies changent dans la direction bouffe. Nous mutons en une civilisation orientée presque à 100% sur le contrôle des sources d’approvisionnement en nourriture. Mathématiquement, cela veut dire que dans l’équation N = A * (E/N)a * (F/N)1-a    a < 1, le paramètre « a » devient a = 0,01. La population planétaire en 2013 est alors de N = 1,13 milliards, soit moins d’un sixième de ce qu’elle était réellement.

Récapitulons. Nous avons le même ensemble des données empiriques en ce qui concerne la population de la Terre, la consommation moyenne d’énergie par personne ainsi que la consommation alimentaire moyenne. Dans cet ensemble des données, trois chemins analytiques ont été tracés, avec l’aide de l’équation paramétrique N = A * (E/N)a * (F/N)1-a    a < 1. Lorsque l’analyse consiste à trouver une valeur du paramètre « a » qui rende justice, de la façon la plus précise possible, aux proportions réellement observées, j’obtiens une équation définitivement dominée par la variable (F/N), donc par l’accès à la nourriture. Si j’interprète la population de la Terre comme un équilibre dynamique de John Nash, c’est un équilibre basé précisément sur l’accès à la nourriture comme base des valeurs éthiques. Que ce soit l’éthique de l’acquisition, l’éthique du contrôle ou bien celle du partage, c’est autour de la bouffe que ça tourne.

Tel est le fondement comportemental de toute stratégie dominante dans tout équilibre dynamique de Nash pour la civilisation humaine prise en entier. Quels sont ces équilibres ? Les relations de commerce international, par exemple. Savez-vous quelle est la route commerciale la plus fréquentée du monde ? C’est le Pacifique Occidental, le long de la côte Asiatique. C’est aussi la région du monde où le déficit alimentaire est le plus notable. Coïncidence ? Peut-être.

Prenons un exemple du jeu simulé centré sur l’énergie, donc celui qui, si appliqué à la civilisation humaine entière, nous mènerait à ladite civilisation prenant la forme d’une ville géante pan-planétaire de plus de 300 milliards d’êtres humains. Je parle de N = A * (E/N)0,76 * (F/N)0,24 par exemple. Ma recherche de l’année dernière m’informe qu’en fait, la plupart des pays relativement petits en termes de population, ça marche très largement suivant cette équation (avec cette valeur relativement élevée du paramètre « a ») : Lituanie, Lettonie, New Zealand, Sweden, Slovenia, Austria, Botswana, Bulgarie etc. Leur trait commun est qu’elles démontrent toutes comme une légère réserve de ressources par rapport à la population, comme s’il y avait de poches d’espace vital. En revanche, les plus grandes populations nationales du globe, celles de la Chine et de l’Inde, marchent selon le modèle N = A * (E/N)0,01 * (F/N)0,99 .

Voilà donc une tirade bien longue autour de l’équilibre dynamique de Nash. La logique que je viens de développer est celle du constructivisme (ou utilitarisme) éthique : mes valeurs éthiques de base sont fonctionnellement dérivées de mes besoins essentiels et maximisent la satisfaction de ses besoins. Au début de cette mise à jour j’ai fait référence à une autre approche, à la théorie de justice de John Rawls. Celle-ci, en revanche, est basée sur la théorie de contrat social et véhicule une idée bien intéressante, celle de la situation initiale.

Imaginez une situation collective, où vous avez vos objectifs constructivistes, comme ceux décrits plus hauts, mais personne, vous inclus, n’en sait que dalle comment les accomplir, ces objectifs constructivistes. La situation est tellement nouvelle et comporte autant d’éléments inconnus qu’il est pratiquement impossible de mettre au point un bon plan d’action. Tenez, la situation après une catastrophe naturelle majeure, comme un ouragan. Rien ne marche, personne ne sait où trouver des ressources de base, ‘y a des cons qui se livrent au pillage, bref, un chaos complet. Voilà une bonne illustration de la situation initiale de Rawls. Le démarrage d’un nouveau business, complètement révolutionnaire du point de vue technologie, peut livrer un autre exemple.

Dans une situation comme celle-là, les stratégies basées sur la satisfaction des besoins essentiels perdent beaucoup de leur efficacité car nous ne savons pas quoi faire et notre action est imbue d’expérimentation constante. John Rawls dit quelque chose de profond à propos de telles situations : c’est le comportement d’autres gens (d’autres joueurs) qui devient le plus important. La possibilité de compter sur quelqu’un ou bien la menace de la part de quelqu’un deviennent des repères essentiels dans notre univers personnel. C’est dans des situations de tel type, donc dans des situations à très haute incertitude, que nos valeurs éthiques se cristallisent. Le comportement éthiquement désirable est celui qui maximise la cohésion de la communauté.

Si je croise la théorie d’équilibre dynamique de John Nash avec la théorie de justice de John Rawls, et si je viens à bout des objections relative à la mésalliance possible, une construction intéressante fait surface. Dans des situations à haute incertitude, l’équilibre dynamique de Nash peut se former – donc les gens peuvent faire leurs propres règles du jeu et ça a des chances de marcher à la longue – autour des stratégies de cohésion sociale et surtout autour d’elles. A mesure que tombe ce que John Rawls appelait « le voile de l’ignorance », donc à mesure que nous avons de plus en plus d’information valable sur les résultats de nos actions, nos stratégies mutent. Elles deviennent de plus en plus utilitaires et constructivistes. Nous commençons à accepter des solutions qui peuvent mettre en péril la cohésion sociale.

L’innovation technologique semble avoir le plus de chances durant ce moment de transition, précisément. Mon concept EneFin, si je veux l’appliquer au développement socio-économique des communautés humaines les plus pauvres du monde, a des chances de marcher lorsque le système social et politique en place est déjà suffisamment solide pour assurer des droits fondamentaux, d’une part, mais la société change très vite.

Je continue à vous fournir de la bonne science, presque neuve, juste un peu cabossée dans le processus de conception. Je vous rappelle que vous pouvez télécharger le business plan du projet BeFund (aussi accessible en version anglaise). Vous pouvez aussi télécharger mon livre intitulé “Capitalism and Political Power”. Je veux utiliser le financement participatif pour me donner une assise financière dans cet effort. Vous pouvez soutenir financièrement ma recherche, selon votre meilleur jugement, à travers mon compte PayPal. Vous pouvez aussi vous enregistrer comme mon patron sur mon compte Patreon . Si vous en faites ainsi, je vous serai reconnaissant pour m’indiquer deux trucs importants : quel genre de récompense attendez-vous en échange du patronage et quelles étapes souhaitiez-vous voir dans mon travail ?

Vous pouvez donner votre support financier à ce blog

€10,00

[1] Ehrlich PR, Ehrlich AH. 2013 Can a collapse of global civilization be avoided? Proceedings of the Royal Society B 280: 20122845. http://dx.doi.org/10.1098/rspb.2012.2845

Advertisements

One thought on “La situation est tellement nouvelle – hommage à John Nash

Leave a Reply