La valeur espérée

Dans ma dernière mise à jour en anglais – Safely narrow down the apparent chaos– j’avais fait un pas en avant (enfin, j’espère) dans l’estimation du nombre des clients que je pourrais faire dans mon projet EneFin. Je me suis dit que ça ne serait peut-être pas entièrement idiot d’aller un peu en profondeur et expliquer toute cette idée de prédire le nombre des clients en s’aidant de la distribution normale.

Voilà le problème de départ : comment prédire une quantité future et incertaine ? Lorsque nous voulons prédire le nombre ou la taille de quoi que ce soit, serait-ce le nombre des billets vendus pour un concert ou la quantité de matériel rocheux éjecté dans l’éruption d’un volcan, vous avons deux voies – mutuellement alternatives mais pas mutuellement exclusives – à suivre : la méthode épidémique ou bien la méthode de changement structurel.

Dans la méthode épidémique, je me concentre sur le nombre (ou la taille) de départ et je me demande comment ce numéraire initial peut possiblement croître. Lorsque j’applique cette logique au nombre des clients potentiels, je peux utiliser ce qu’on appelle la théorie de l’épidémie : l’attraction des clients consécutifs est étudiée comme la propagation d’un pathogène. Ça commence avec le patient zéro – mon premier client – qui contacte (contamine) ses potes et ses cousins et certains parmi eux deviennent mes clients. Ceux-là, à leur tour, contaminent d’autres et ainsi ça se développe, par contamination.

Si je veux modeler me développement de mon portefeuille des clients comme une contamination épidémique, j’ai besoin des assomptions initiales en ce qui concerne la contamination strictement dite. Il faut quelque sorte de contact pour rendre possible la transmission. En d’autres mots, il faut que je raconte une histoire plausible à propos des relations sociales entre mes clients potentiels et de la façon dont ils se transmettent mutuellement des schémas de comportement. Mathématiquement, j’ai deux outils de base pour modeler l’effet agrégé de cette transmission des schémas de comportement: le premier c’est la fonction factorielleou bien sa cousine, la fonction gamma, le deuxième c’est la fonction exponentielle.

Dans la méthode de changement structurel, je change d’optique et au départ je me concentre sur la population totale des toutes les entités qui peuvent potentiellement devenir mes clients. Je définis donc un marché potentiel total et ensuite je me demande comment je vais développer mon portefeuille clients à l’intérieur de cet univers. Je perçois l’ensemble de mes clients comme un sous-ensemble d’une population plus large. Comme certains membres de cette population totale graviteront vers mon offre, la proportion entre mon portefeuille clients et cette population totale changera. Dans cette approche, ma prédiction se concentre plus sur le pourcentage que mes clients vont représenter dans la population totale que sur leur nombre absolu. Côté maths, c’est le bon moment pour sortir de mon sac des outils comme la distribution normale, ou bien celle de Poisson, ou encore celle de Weibulletc.

Epidemie et changement structurel

 

Maintenant, vous pouvez légitimement demander laquelle de ces deux méthodes – épidémique et structurelle – est la meilleure des deux et si on peut possiblement les mélanger. A mon avis, la méthode structurelle est la meilleure des deux en général. Elle est à la fois plus rationnelle, plus intuitive, plus simple et mieux instrumentée mathématiquement. Encore, pour avoir une idée vraiment précise et un modèle analytique vraiment solide, il est bon d’ajouter une pincée de la méthode épidémique.

Je commence par expliquer l’aspect rationnel. Peut-être vous vous souvenez de ces épisodes d’enfance lorsque vous mesuriez votre taille en faisant des marques sur le châssis dormant d’une porte. Vous pouviez observer la progression directement – « je suis plus grand(e) qu’il y a deux mois » – et vous aviez une idée vague de la taille finale que vous pourriez probablement atteindre. Vous observiez les adultes autour de vous et vous vous disiez qu’un jour, vous serez aussi grand(e) qu’eux. Vous perceviez votre propre taille en proportion à la taille-cible des adultes. A un niveau plus général et plus profond, c’est comme ça que marche la réalité : comme des structures entremêlées. Tout ce qui existe est une structure à l’intérieur d’une structure plus vaste et en même temps contient des structures plus locales à l’intérieur de soi-même. La méthode structurelle est fondamentalement en phase avec la façon dont notre cerveau rationnalise notre expérience de la réalité.

Encore, si vous étiez un gosse bien curieux – moi j’étais une vraie peste à cet égard, je tuais les adultes avec mes questions – vous voulez comprendre comment ça se fait que la marque de votre taille, sur le châssis de la porte, et plus haut que celle d’il y a deux mois. Alors voilà que vous prenez connaissance de toute l’histoire des cellules qui se multiplient. Vous passez de l’approche structurelle à la théorie de l’épidémie. Toute croissance de matière organique peut être étudiée comme une épidémie, celle d’un certain code génétique. Voilà la bonne place pour la méthode épidémique : comprendre ces petites interactions locales dans des petites structures locales.

Dans la prédiction du nombre futurs de mes clients, dans un business plan, la méthode structurelle commence avec des assomptions bien vérifiables empiriquement. La taille de mon marché potentiel entier, je peux la mesurer – ou bien faire des assomptions solides à ce sujet – sur la base des données économiques accessibles : démographie, consommation ménagère, investissement entrepreneurial etc. Tout ça, ce sont des repères bien distincts et ce qui est même plus important, intersubjectifs. Vous allez chez INSEE, chez Eurostat, ou bien chez la Banque Mondiale, et vous avez ces données de départ. C’est comme si vous aviez la carte essentielle d’un territoire : ça rassure.

Ensuite, lorsque je passe en revue – tout à fait subjectivement, je l’admets – les outils mathématiques dont je dispose pour prédire le nombre de mes clients, les structurels sont beaucoup plus simples à utiliser que les épidémiques. En fait, je pense qu’il est utile d’étudier la différence en peu plus en profondeur. Je retourne donc à mon concept EneFin(regardez du côté de Le modèle d’un marché relativement conformistepour vous rafraichir la mémoire) et je me dis : « OK, j’ai donc le premier client : la première personne qui a acheté au moins un contrat complexe via EneFin. Qu’est-ce qui se passe ensuite ? ».

L’épidémie d’abord. Mon premier client convainc deux autres. Ça fait 1 plus la factorielle de deux, donc dans ce deuxième moment de mon histoire j’ai 1 + 2 ! = 1 + 1 * 2 = 1 + 2 = 3 clients. Ces deux autres font de même, donc chacun d’eux convainc deux suivants, ce qui fait 4 de plus. Par conséquent, dans le troisième moment de mon histoire j’ai 1 + 1 * 2 + 2 * 2 = 7 = 1 + 3 ! clients. Ainsi vient le quatrième moment de l’histoire et des suivants. A chaque fois chacun des clients convaincus jusqu’alors en attire deux autres et j’ai bien sûr mon patient zéro. Au moment « t » j’ai donc le double du nombre des clients gagnés au moment « t – 1 » plus 1. En mathématique commun ça fait n(t) = 2*n(t-1) + 1.

Est-ce que ça se marie avec les factorielles des moments consécutifs ? Pas tout à fait. A partir du moment no. 4, la discorde s’insinue. Prenez le cas du moment no. 8. La chaîne n(t) = 2*n(t-1) + 1donne n(8) = 255clients, mais la factorielle 8 ! ça fait 40 321 clients. Comme une légère différence. Eh ben oui, puisque la factorielle pure et dure ça implique une contamination de plus en plus rapide. Pour avoir 8 ! = 40 321 clients au moment 8, chacun des 7 ! = 5 041 clients déjà attirés préalablement jusqu’au moment 7 devrait attirer 40 321/5 041 = 7,998611387 amis et cousins. Pour avoir le point de départ du moment 7, donc ces 7 ! = 5 041 clients, au moment 6 j’étais obligé d’avoir 6 ! = 721 clients, dont chacun avait convaincu 6,991678225 autres.

Alors voilà que j’ai deux contaminations différentes : une avec la progression n(t) = 2*n(t-1) + 1, l’autre qui file au rythme de n(t) = t ! + 1. Tableau 1 ci-dessous donne une idée de ces deux propagations épidémiques.

Tableau 1 – Comparaison des propagations épidémiques : n(t) = 2*n(t-1) + 1et n(t) = t ! + 1.

  Épidémie n(t) = 2*n(t-1) + 1 Épidémie n(t) = t ! + 1
Moment Nombre total des clients Nombre des clients nouveaux attirés par chaque client existant Nombre total des clients Nombre des clients nouveaux attirés par chaque client existant
1 1 2 2 2
2 3 3 3 1,5
3 7 2,333333333 7 2,333333333
4 15 2,142857143 25 3,571428571
5 31 2,066666667 121 4,84
6 63 2,032258065 721 5,958677686
7 127 2,015873016 5 041 6,991678225
8 255 2,007874016 40 321 7,998611387
9 511 2,003921569 362 881 8,999801592
10 1 023 2,001956947 3 628 801 9,999975198
11 2 047 2,000977517 39 916 801 10,99999724
12 4 095 2,00048852 479 001 601 11,99999972
13 8 191 2,0002442 6 227 020 801 12,99999997
14 16 383 2,000122085 87 178 291 201 14
15 32 767 2,000061039 1 307 674 368 001 15
16 65 535 2,000030519 20 922 789 888 001 16

 

A première vue, la progression purement factorielle n(t) = t ! + 1c’est un peu fou. Ça pourrait servir à simuler, par exemple, le nombre des transactions dans une fonctionnalité FinTech, mais pas le nombre des clients. La propagation géométrique n(t) = 2*n(t-1) + 1semble un peu plus réaliste. Elle a aussi un trait mathématique intéressant. Si vous tirez le logarithme naturel du nombre total des clients à chaque moment consécutif et ensuite vous divisez ce logarithme par la valeur du moment – donc par 4 au moment no. 4 etc. – vous arrivez très vite, dès le moment no. 5, à la valeur quasi constante de ln[n(t)/t] ≈ 0,69. En d’autres mots, la propagation épidémique n(t) = 2*n(t-1) + 1est à peu de chose près équivalente à la croissance exponentielle n(t) = e0,69*t. Qu’est-ce que ça prouve ? Eh bien, dans les sciences économiques on assume que si la croissance quantitative d’un phénomène suit la logique de n(t) = e ß*t, avec ßplus ou moins constant, cela représente raisonnablement une hystérèse, donc un développement où chaque pas consécutif détermine le pas suivant d’une façon plus ou moins cohérente.

J’ai donc une hystérèse bien jolie, mais est-elle réaliste ? Puis-je assumer une progression où chaque période consécutive va me permettre de doubler la taille de mon portefeuille clients ? Comment définir cette période de changement du simple au double ? Comment puis-je simuler une situation ou quelques-uns de parmi mes clients attirent, chacun, deux nouveaux pendant que d’autres attirent cinq nouveaux ?

Voilà le moment quand la méthode épidémique, illustrée ci-dessus, devient de plus en plus encombrante avec toutes les assomptions qu’il faut y ajouter. Voilà donc le moment de tourner vers la méthode structurelle. Nous y retournons avec la version française des mêmes schémas graphiques que j’avais déjà présentés dans Safely narrow down the apparent chaos. Je les présente ci-dessous en j’enchaîne ensuite.

Distribution normale de base

 

Distribution normale interpretation

L’application pratique de la distribution normale exige un peu de flexibilité, surtout dans l’interprétation d’un paramètre-clé : la moyenne ou le « µ » dans l’équation. En théorie, la moyenne est la valeur espérée dans un ensemble des données. D’habitude, on l’interprète comme un attribut de la moyenne : dès qu’on la calcule, on peut la considérer comme valeur espérée. Maintenant, je vous propose d’inverser le raisonnement. Prenons une valeur que nous pouvons considérer comme espérée, donc comme, à la fois, ce que nous voulons avoir (espérons), et ce qui est objectivement vérifiable (pour savoir si on a obtenu ce qu’on espérait d’avoir). Dans cet outil de calcul que vous pouvez trouver sur mon blog, le « Business Planning Calculator », une telle valeur est le point mort des ventes, donc le nombre des clients qui nous garantit la couverture de nos frais fixes. On peut prendre le niveau des ventes qui garantit 20% de marge opérationnelle. On peut prendre, comme notre valeur espérée, tout ce qui est : a) désirable b) objectivement mesurable et vérifiable.

Une fois notre valeur espérée identifiée, nous assumons que c’est la moyenne d’une distribution normale. Tout autour de cet état que nous voulons atteindre, il y a des états plus ou moins voisins, qui se composent en une courbe de Gauss. Si nous vérifions la réalité autour de nous, nous découvrirons ces états voisins de la moyenne – par exemple à travers l’étude des cas des business similaires au notre – et ainsi nous pouvons estimer la déviation standard de notre courbe. Voilà, on a les deux paramètres de la distribution normale.

Bon, j’en finis avec la science, pour aujourd’hui. Je continue à vous fournir de la bonne science, presque neuve, juste un peu cabossée dans le processus de conception. Je vous rappelle que vous pouvez télécharger le business plan du projet BeFund(aussi accessible en version anglaise). Vous pouvez aussi télécharger mon livre intitulé “Capitalism and Political Power”. Je veux utiliser le financement participatif pour me donner une assise financière dans cet effort. Vous pouvez soutenir financièrement ma recherche, selon votre meilleur jugement, à travers mon compte PayPal. Vous pouvez aussi vous enregistrer comme mon patron sur mon compte Patreon. Si vous en faites ainsi, je vous serai reconnaissant pour m’indiquer deux trucs importants : quel genre de récompense attendez-vous en échange du patronage et quelles étapes souhaitiez-vous voir dans mon travail ?

Vous pouvez donner votre support financier à ce blog

€10,00

 

Leave a Reply