Czasami coś odrasta

 

Zastanawiam się – dalej się zastanawiam – nad tym, jak wydobyć maksymalną wartość dodaną z nauczania, jakie serwuję moim studentom. W języku polskim nauczam przede wszystkim podstaw zarządzania, mikroekonomii oraz budowania biznes planu, także w kontekście wdrażania nowych technologii. Mam taką małą obsesję na temat nauczania nauk społecznych: postrzegam je trochę w taki sposób, w jaki stulecia temu postrzegano astronomię, czyli jako dyscyplinę nauki służącą do określenia swojej pozycji na jakimś terytorium i do nakreślenia mapy tego terytorium. To trochę jak te programy w stylu „Szkoła przetrwania”: zrzucają Cię, czasami nawet na spadochronie (czasami bez) w środku czegoś, co tylko przez grzeczność określasz jako „dziką przyrodę” raczej niż „zadupie” i masz znaleźć drogę do wyznaczonego punktu ponownego kontaktu z tym, co zwykłeś uważać za cywilizację.

Nawiązuję w ten sposób do mojego poprzedniego wpisu, pod tytułem „Gra w tożsamość”. Szukam takich twierdzeń i teorii w naukach społecznych, które są solidnie potwierdzone badaniami empirycznymi – a więc zasługują na miano prawd naukowych – a jednocześnie są przydatne w codziennym życiu. W „Grze w tożsamość” rozwinąłem krótkie rozumowanie na temat jednej z takich podstawowych prawd naukowych: faktu, że jesteśmy istotami społecznymi. Teraz chcę się skupić na czymś innym i jednocześnie pokrewnym: prawie wszystko co robimy, robimy w sposób powtarzalny, według powtarzalnych wzorców, a każdy taki wzorzec można rozpisać jako sekwencję.

Na początek trochę praktycznych przykładów, tak tylko żeby szybko nakreślić o co mi chodzi. Powiedzmy, że zaczynamy nowy biznes, np. internetowy sklep z odzieżą. Staramy się sprofilować potencjalnych klientów. Kiedy po raz pierwszy zadajemy sobie pytanie: „Jak może podejmować decyzję nasz klient?”, odruchowa odpowiedź brzmi często „Nie mam pojęcia, oni są tacy różnorodni”. Otóż nie. Jedna z solidnych, teoretycznych zdobyczy nauk społecznych to stanowcze stwierdzenie, że nasi klienci będą się zachowywać według przewidywalnych wzorców. Marketing opiera się na identyfikacji tych wzorców.

Powiedzmy, że jesteśmy kimś ważnym w państwie ( np. doradcą asystenta wiceprzewodniczącego komitetu politycznego przy kimś, kto na skutek niezręcznego zbiegu okoliczności tylko firmuje nas swoim nazwiskiem ) i uczestniczymy – naprawdę uczestniczymy – w negocjacjach na temat jakiegoś ważnego traktatu międzynarodowego. Sytuacja bywa napięta i mamy skłonność do traktowania innych stron negocjacji jako nieodgadnionych pokerzystów, którzy mogą w każdej chwili nas czymś zaskoczyć. Otóż znowu: nie. Państwa, tak samo jak ludzie, działają według powtarzalnych wzorców. Rzeczywisty margines manewru Waszych partnerów negocjacyjnych naprawdę nie jest znacząco odmienny od Waszego.

Pora na poważniejszą teorię. Zacznę od matematyki, a dokładnie od rachunku prawdopodobieństwa. Wiem, jak zaczynam od matmy, to wielu z Was może spontanicznie zamknąć tą stronę. Wiem, wielu z Was czuje instynktowną niemal odrazę do matematyki. Ja też ją kiedyś czułem. Wobec chyba wszystkich z nas, kiedy byliśmy dziećmi, zastosowano zabieg intelektualnego okaleczenia polegający na rozpoczęciu nauki matematyki od wkuwania na pamięć tabliczki mnożenia.

Mogę Was pocieszyć: czasami, nawet po okaleczeniu, coś odrasta. Mnie odrosła ciekawość matematyczna, tzn. intuicyjne przeświadczenie, że matematyka odzwierciedla strukturę rzeczywistości. Wam też może odrosnąć. Odwagi. Jedną z rzeczy, które wkuwamy na matmie w szkole jest pojęcie średniej arytmetycznej. Dlaczego?

Siedemnasty i osiemnasty wiek w Europie były okresem fascynacji matematyką i z czasem ta fascynacja przerodziła się w praktyczne zastosowanie. Pytanie „Co może się wydarzyć ?” było jednym z podstawowych, na które matematyka próbowała znaleźć odpowiedź. Na przełomie XVII i XVIII wieku, Isaac Newton oraz Gottfried Wilhelm Leibniz wytyczyli pierwszą ścieżkę odpowiedzi na to pytanie, kładąc podwaliny pod dziedzinę matematyki, którą znamy dzisiaj jako analizę matematyczną. Ich głównym odkryciem było stwierdzenie, że kiedy rzeczy się zmieniają, to zmieniają się w kierunku określonym przez zależności z innymi rzeczami, czyli według określonej funkcji.

Jednym z badaczy, którzy podjęli ten temat był o jedno pokolenie starszy od Newtona Abraham de Moivre. W swoim dziele pt. „The Doctrine of Chances”, w 1738 roku (następnie w 1756) wyłożył następującą teorię, potwierdzoną zresztą żmudnymi badaniami empirycznymi: jeżeli mamy jakieś zjawisko, które można zmierzyć, to przy dużej liczbie możliwych zdarzeń tego zjawiska najczęściej będzie się powtarzać wartość równa średniej arytmetycznej, czyli sumie wszystkich zaobserwowanych wartości podzielonej przez liczbę obserwacji.

Zastanówmy się nad tym chwilę. Jeżeli mam ten sklep internetowy z odzieżą i zastanawiam się, jaki typowy budżet moi klienci wydadzą na zakupy, to zgodnie z teorią de Moivre’a mam prawo oczekiwać, że będzie to średnia arytmetyczna, czyli suma wszystkich indywidualnych budżetów podzielona przez liczbę klientów. Mniej więcej w tym kierunku poszły badania i odkrycia Adama Smitha, jednego z ojców założycieli ekonomii. Odkrył, że ceny wielu dóbr, zwłaszcza tych o podstawowym znaczeniu dla społeczeństwa (np. ceny zboża albo cena pieniądza czyli stopa procentowa), zmieniają się według możliwych do przewidzenia trajektorii oraz że w danym miejscu i czasie przyjmują najczęściej wartości bliskie średniej arytmetycznej.

Teoria de Moivre’a dała początek założeniu, które z kolei wkuwamy na zajęciach ze statystyki, ze tzw. wartością oczekiwaną w zbiorze obserwacji jest średnia arytmetyczna. Z jednej strony zachęciło to późniejszych badaczy, po de Moivrze, do eksploracji okolic tej średniej arytmetycznej i do opisu całej struktury rzeczywistości dookoła. W tym kierunku poszedł Carl Friedrich Gauss, którego odkrycia pozwalają nam dzisiaj stosować tzw. rozkład normalny, zwany pieszczotliwie krzywą Gaussa.

Z drugiej jednak strony pojawiły się pytania o to, co robić, kiedy nie mamy warunków do wykonania np. 2000 prób i do określenia średniej arytmetycznej. Trudno może być znaleźć chociażby samą tylko metodę dla wyliczenia średniej np. z czasu, jakiego potrzebuje do namysłu gracz po drugiej stronie pokerowego stołu. Czasami w życiu bywa tak, że mamy niewiele prób. Warto mieć jednak metodę oswojenia niepewności i na taką okoliczność. Jednym z pierwszych teoretyków, którzy poszli tą ścieżką był wielebny Thomas Bayes, którego tajemniczy skądinąd esej, opublikowany post mortem oraz intepretowany czasami jako poszukiwanie dowodu na istnienie Boga, stworzył fundamenty dla tego, co dzisiaj określamy jako statystykę Bayesowską. W ślady Bayesa poszli inni i w ten sposób (prawdopodobnie) narodziła się teoria gier.

Gauss i Bayes to dwie różne metody określenia powtarzalnych wzorców w zachowaniu ludzi. Zgodnie z moim podejściem do dydaktyki nauk społecznych są to dwie różne metody znajdowania własnej drogi w złożonej rzeczywistości społecznej. Idąc w ślady Gaussa, staramy się odtworzyć strukturę rzeczywistości ujętą w liczbach. Podążając z kolei śladami Thomasa Bayesa, racjonalnie eksperymentujemy i stopniowo redukujemy niepewność poprzez interpretację wyników kolejnych eksperymentów.

Przyjrzyjmy się bliżej tym dwóm ścieżkom rozumowania oraz ich praktycznemu zastosowaniu. Mówiąc najprościej, każda z nich pasuje do innego typu sytuacji. Rozumowanie de Moivre’a i Gaussa pasuje do okoliczności, kiedy w zasięgu ręki mamy dużo informacji, czasami tak dużo iż mamy wrażenie nadmiaru. Powtarzalne wzorce w zachowaniu ludzi odtwarzamy, znajdując porządek ukryty w natłoku informacji. Bywa jednak i tak, że informacja jest skąpa, a przynajmniej takie mamy wrażenie. Potrzebujemy wtedy metody, która działałaby w pewnym sensie odwrotnie do „ilościówki” de Moivre’a. Potrzebujemy czegoś, co wyciśnie informacje i pozwoli nam wyrobić sobie zdanie na temat powtarzalnych zachowań ludzi tam, gdzie pozornie takich informacji nie ma.

Zanim przejdę do uczonego wykładu, mała dygresja. Po jaką ciężką cholerę zajmować się tym, co napisał jakiś gość dwieście z górą lat temu ? Co, nie mamy świeższej bibliografii ? Jasne, że mamy. Zachęcam, aby się z nią zapoznawać na bieżąco. Mam jednakowoż takie osobiste przekonanie, zbieżne z filozofią hermeneutyczną: jakiejkolwiek historii bym nie opowiadał, koniec końców opowiadam historię mojej własnej egzystencji. Opowiadam kontekst, w takim moja historia powstała. Teoretycy z osiemnastego wieku opowiadali historię społeczeństwa, które mniej więcej od połowy siedemnastego wieku stopniowo odkrywało zastosowania matematyki. To były czasy, kiedy akuratne obliczenia miały strategiczne znaczenie: w kartografii, w ekonomii (która jeszcze wtedy nie miała pojęcia, że nazywa się „ekonomia”), w architekturze, w wojskowości itd. Europa odkrywała wtedy całą potęgę informacji ujętych w liczby. Brzmi znajomo ? Ludzie tamtych czasów starali się znaleźć powtarzalne wzorce w sytuacjach, kiedy nagle mieli do dyspozycji nowe narzędzia ich zbierania, tak jak my dzisiaj. Książka de Moivre’a czy też esej Bayesa, pod powierzchnią rozważań teoretycznych, opowiadają taką właśnie historię. No i przy okazji można zrozumieć nieco lepiej, o czym ględzę ja albo inny wykładowca kiedy staramy się przekazać, na przykład, na czym polega rozkład normalny.

Na i jeszcze jedna dygresja: w zasadzie każde równanie matematyczne wywodzące się z tych osiemnasto- i dziewiętnastowiecznych teorii miało swój początek w geometrii. Wszystko, co się może wydarzyć wyobrażamy sobie jako dwuwymiarową płaszczyznę. No wiem, Gauss poszedł dalej i zrobił to w trzech wymiarach, ale staram się nie spłoszyć czytelnika. Nie wiem, skąd dokładnie wywodziła się ówczesna fascynacja geometrią. Być może z faktu, że szybki rozwój astronomii umożliwił wtedy o wiele bardziej precyzyjny pomiar odległości i tworzenie o wiele dokładniejszych niż wcześniej map. To jednak tylko domysły, a ja chcę się skupić na podstawowej regule geometrycznej, która będzie nam tu towarzyszyć: jeżeli dzieją się dwa zjawiska, oddzielone od siebie czasem lub przestrzenią, to różnicę między tymi zjawiskami możemy wyrazić jako odległość, czy też jako drogę z punktu A do punktu B. Kiedy zastosować tą regułę do ludzkiego postępowania, zachowania bardzo odmienne dzielić będzie stosunkowo duża odległość, podczas gdy zachowania stosunkowo podobne są bliskie jedne drugiego.

To jednak nie wszystko. Jeszcze trochę tej geometrii. Znacie twierdzenie Pitagorasa ? No wiecie: w trójkącie prostokątnym kwadrat długości przeciwprostokątnej jest równy sumie kwadratów długości przeciwprostokątnych. No właśnie: każdy odcinek, czyli każdą odległość od zjawiska A do zjawiska B można wyobrazić sobie jako przeciwprostokątną (no, ten skośny bok) trójkąta prostokątnego. Ta odległość jest więc pierwiastkiem z sumy kwadratów dwóch współrzędnych: X (kategoria zdarzeń) oraz Y(natężenie zdarzeń). Poniżej przedstawiam to graficznie.

Odległość Euklidesowa_Pitagorejska

Teoria jest uogólnieniem doświadczenia. Odległość Euklidesowa jest tego doskonałym przykładem. Kiedy staramy się czaić bazę na temat zachowań ludzi dookoła nas, robimy tak: dzielimy te zachowania na ogólne kategorie, a następnie dokonujemy bardziej finezyjnej oceny natężenia, z jaką każda kategoria występuje. Pierwszy tydzień w pracy: wszyscy w tym biurze to młoty albo pijawki, chociaż jest paru fajnych (grupowanie według kategorii, współrzędna X). Drugi tydzień w pracy: jeden z kategorii „młoty” ma w sobie sporo młota, ale także jest trochę fajny, a jedna „fajna” ma jakby lekki odcień pijawki (ocena natężenia cech, czyli współrzędna Y).

No dobra, czyli biorę się za krzywą Gaussa i za ukryte pod nią założenia na temat rzeczywistości oraz ludzkich zachowań. Jesteśmy więc w świecie obfitej informacji, którą trzeba uporządkować. Mamy ten sklep internetowy z odzieżą, nasi klienci wypełniają ankiety na temat swojego stylu życia, obserwujemy ich decyzje w naszym sklepie, być może jeszcze zamawiamy badanie zachowań użytkowników Internetu przy pomocy silnika behawioralnego. Mamy sporo mierzalnych (liczbowych) danych na temat naszych klientów.

Kiedy zadajemy sobie pytanie „Jak mogą się zachowywać nasi klienci ?” i kiedy świta nam intuicyjna odpowiedź „Jak tylko chcą ?”, teoria de de Moivre’a i Gaussa mówi nam „Niezupełnie. Ludzkie zachowania, tak samo jak wiele innych zjawisk, mają skłonność do skupiania się. Najwięcej przypadków będzie skupionych wokół średniej, czyli wokół wartości oczekiwanej. To skupienie ma swoje reguły. Poniżej przedstawiam ogólny wzór na rozkład normalny oraz jego interpretację, która pozwala lepiej zrozumieć te reguły.

Rozkład normalny 1

Rozkład normalny 2

 

Teraz łączymy założenia odległości Euklidesowej z założeniami rozkładu normalnego. Cokolwiek ludzie robią, to co robią zaliczamy do jakiejś kategorii ‘x’. Każdy zbiór zachowań ma swoją średnią, czyli wartość oczekiwaną, czyli najbardziej prawdopodobną kategorię zachowań określaną jako ‘µ’. Każda kategoria zachowań ‘x’ występuje z prawdopodobieństwem – natężeniem ‘y’ – wyznaczanym przede wszystkim przez to, jak daleko jest od najbardziej prawdopodobnej kategorii ‘µ’. To, jak daleko kategoria zachowań ‘x’ znajduje się od najbardziej prawdopodobnej kategorii ‘µ’ jest mierzone w jednostkach odchylenia standardowego, czyli w sigmach. No i dalej to już z górki: dokładne prawdopodobieństwo występowania kategorii zachowań ‘x’ – czyli jej natężenie ‘y’ – jest określane wzorem omówionym powyżej. Najpierw wycinamy z całej rzeczywistości kawałek określany jako „stała Gaussa” czyli jeden dzielone przez pierwiastek z dwukrotności liczby pi, a potem ścinamy dalej według wzoru.

No i byłoby zupełnie fajnie, gdyby nie to, że nasze doświadczenie mówi nam często co innego: nie widzimy jasno określonych kategorii w zachowaniach ludzi dookoła nas. Nie widzimy jednego, dominującego typu zachowań. Co robić ? Jak działać ? Tu wracamy do filozofii matematycznej Thomasa Bayesa. Postaram się o niej szerzej opowiedzieć w kolejnych wpisach na moim blogu, a na razie zadowolę się ogólnym zarysem: w warunkach ogólnej niepewności co do zachowań innych ludzi zaczynamy eksperymentować i określamy w ten sposób, co jest dla nas korzystne, a co nie. Definiujemy, co jest dla nas sukcesem, a co porażką. Następnie, w drodze kolejnych eksperymentów, stopniowo zawężamy prawdopodobieństwo sukcesu albo porażki, a w jeszcze bardziej wyrafinowanej formie, określamy prawdopodobieństwo osiągnięcia ‘p’ sukcesów i ‘q’ porażek w serii ‘n’ prób.

Jak to może wyglądać w praktyce ? Powiedzmy, że mamy pomysł na biznes i staramy się znaleźć inwestorów. Spotykamy się z pierwszym możliwym z nich. Jeszcze nic z tego spotkania nie wynikło, ale mentalnie kreślimy mapę możliwych zachowań: każdy kolejny rozmówca może być tak jakby bardziej w tą stronę od tego pierwszego, albo jakby bardziej w przeciwną stronę. Spotykamy się z kolejnymi potencjalnymi inwestorami i za każdym razem staramy się wyciągać wnioski w podobny sposób: każdego kolejnego rozmówcę traktujemy jako typ, czyli jako reprezentatywny przykład jakiejś szerszej kategorii. W ten sposób tworzymy katalog możliwych typów zachowań u naszych potencjalnych inwestorów. Mniej lub bardziej świadomie tworzymy asocjacje: każdy typ zachowań kojarzymy z jakimś jednostkowym prawdopodobieństwem sukcesu albo porażki i jednocześnie dokonujemy skojarzenia z jakimiś czynnikami zewnętrznymi. „Jeżeli trafię na prezesa funduszu inwestycyjnego na początku kwartału, to mam większe prawdopodobieństwo zaangażowania go w negocjacje na temat finansowania mojego biznes planu, niż gdybym rozmawiał jedynie z analitykiem tego funduszu pod koniec okresu rozliczeniowego” – coś w tym rodzaju.

Jeżeli się temu bliżej przyjrzeć, mamy tu raz jeszcze do czynienia z fundamentalnym mechanizmem naszej psychiki, podobnie jak w przypadku odległości Euklidesowej. Kolejne doświadczenia są dla nas podstawą do budowania mentalnych kategorii oraz do kojarzenia ich wzajemnie między sobą. W ten sposób tworzy się język, którym się porozumiewamy.

Tyle na dzisiaj. Do zobaczenia w kolejnych wpisach na tym blogu.