Chaos jak po zbóju, czyli karteczki dla premiera

Mój wstępniak na You Tube

Jedną z sytuacji, kiedy ktoś musi znaleźć swoją ścieżkę w przestrzeni społecznej jest tworzenie własnego biznesu. Najlepiej mogę sprawdzić jak moje nauczanie może pomóc w tworzeniu czyjegoś biznesu, jeżeli sam co jakiś czas wezmę się za przygotowanie biznes planu. Temu właśnie chciałbym poświęcić przynajmniej kilka wpisów w polskojęzycznej wersji mojego bloga naukowego. Mam dwa, autentyczne i nieudawane pomysły na biznes i staram się je rozwinąć. Jeden to projekt, który nazwałem BeFund, przedsięwzięcie bliskie mojej pracy naukowej. Jest to połączenie laboratorium behawioralnego z funduszem inwestycyjnym dla startupów. Podstawowa idea tego projektu opiera się na obserwacji, że najwięcej porażek startupów technologicznych ma miejsce w fazie dostosowania technologii do potrzeb użytkowników i utrzymania konkurencyjności tej technologii. Laboratorium behawioralne miałoby służyć optymalizacji cech użytkowych technologii, na których startup się opiera. Dla tego projektu mam już nakreślony biznes plan w języku angielskim i teraz postaram się przedstawić go w polskojęzycznej ścieżce mojego pisania.

Cała idea projektu BeFund wzięła się z mojej fascynacji zjawiskiem tzw. Smart Cities, czyli inteligentnych miast. Ta fascynacja ma z kolei swoje korzenie w innej, tej związanej ze zmianami technologicznymi i relacją pomiędzy energią, technologią – szczególnie elektroniką i technologiami cyfrowymi – a ludzką cywilizacją. Wracam jednak do projektu BeFund. Na początek: co to jest laboratorium behawioralne i po kiego licha tworzyć kolejne? Otóż jest to laboratorium przeznaczone do badania ludzkich zachowań, w tym szczególnie interakcji z nowymi technologiami. „Zachowanie” rozumiem szeroko. Sposób podejmowania decyzji to wzorzec zachowań i ewentualne przyspieszenie oddechu podczas podejmowania niektórych z tych decyzji też jest wzorcem zachowań. Zauważcie: płynnie przeszedłem od pojęcia zachowania do wzorca zachowań. Nawiązuję w ten sposób do jednej z podstawowych zasad nauk społecznych: my, ludzie, działamy według powtarzalnych wzorców, których uczymy się w drodze kolejnych eksperymentów. Piszę więcej na ten temat w moim poprzednim wpisie pt. „Dwie kule w Kalifornii i wielebny Thomas Bayes”.

Kiedy zacząłem się interesować rozwojem inteligentnych miast, zauważyłem kilka interesujących zjawisk. Inteligentne miasta rozwijają się w dużej mierze poprzez inkubację startupów technologicznych (czyli świeżo zakładanych, z reguły stosunkowo niewielkich firm ukierunkowanych na komercjalizację nowych technologii). Startupy technologiczne odznaczają się stosunkowo wysoką śmiertelnością: większość z nich pada po 2 – 3 latach albo zostaje wchłonięte przez duże korporacje. Technologie lansowane przez startupy są najczęściej swego rodzaju użytkowymi mutacjami jakiejś szerszej bazy technologicznej. Dla przykładu, taką modną ostatnio bazą technologiczną jest język programowania Python. Wiele aplikacji FinTech, lansowanych przez startupy, jest opartych właśnie na nim.

To trochę jak wiele konkurujących ze sobą domów mody. Mają dostęp do tych samych materiałów i tych samych technik krawieckich. Różnica tkwi w koncepcji estetycznej, czyli w dopasowaniu tych materiałów i tych technik do oczekiwań określonej grupy klientów, a jednocześnie trzeba mieć kreatywny pazur. Ze startupami technologicznymi jest tak samo. Opieramy się na jakieś szerokiej bazie technologicznej i coś wymyślamy. To coś musi oryginalne i prowokujące ciekawość, lecz jednocześnie funkcjonalnie dopasowane do określonego użytkownika. Taki mały paradoks tu mamy: z jednej strony musimy dać funkcjonalność niecodzienną i prowokującą, ale z drugiej strony, pod powłoką prowokacji i unikalności, to coś musi być dopasowane do wyuczonych, rutynowych wzorców zachowań po stronie użytkowników.

Tu pojawia się czysto praktyczna strona mojego pomysłu BeFund. Kontrolowane środowisko eksperymentalne, które twórcy startupów technologicznych mogliby wynajmować na godziny po to, aby testować interakcje tworzonych rozwiązań technologicznych z użytkownikami, byłoby jak znalazł. W ten sposób znacznie zmniejsza się ryzyko, że jakaś funkcjonalność dozna porażki biznesowej na skutek niewystarczającej konkurencyjności dla użytkownika.

Przykład eksperymentu behawioralnego ? A proszę bardzo. Każda technologia musi być niezawodna. Jednym z aspektów niezawodności jest odporność na błędy popełniane przez użytkownika. Błąd to sytuacja, kiedy użytkownik powinien wykonać działanie A, lecz zamiast tego wykonuje działanie B. Umieszczamy osoby reprezentatywne dla tego, co pokolenie młodsze od mojego określa mianem „targetu”, w kontrolowanym środowisku eksperymentalnym. Są sam na sam z testowaną technologią. Poddajemy ich celowej dystrakcji, czyli rozpraszamy ich uwagę. W pomieszczeniu, gdzie się znajdują jest np. bardzo gorąco albo bardzo zimno. Miga tam ostre światło. Gra głośna muzyka. Zawieszony na ścianie telewizor wyświetla coś strasznego, np. kolejny wiec wyborczy albo kolejny przegrany mecz polskiej drużyny w jakąś piłkę (rodzaj piłki do wyboru). Można te bodźce mnożyć do woli.

Teraz kalibrujemy. Dajemy uczestnikom eksperymentu jakieś zadania wymagające koncentracji uwagi: połącz punkty na rysunku, rozwiąż zadania matematyczne, dopasuj elementy puzzla itp. Najpierw robimy to w środowisku sprzyjającym koncentracji uwagi – nie ma wiecu wyborczego w telewizorze na ścianie. Zapisujemy wyniki osiągnięte przez uczestników eksperymentu. Potem stopniowo podkręcamy strumień bodźców i zwiększamy dystrakcję. Robimy to np. w pięciu kolejnych stopniach. Na każdym stopniu dystrakcji dajemy uczestnikom do wykonania identyczny zestaw zadań (oczywiście puzzle jest inny i działania matematyczne są inne, ale struktura zadania jest taka sama) i mierzymy ich wyniki.

W ten sposób kalibrujemy nasze środowisko eksperymentalnie, tzn. określamy różne poziomy dystrakcji u naszych uczestników. Może być spokój i porządek – stopień pierwszy – albo trochę nieporządku, tak jak pod koniec dnia w centrum rozliczeniowym – stopień drugi – albo sporo nieporządku, jak tuż przed rodzinnym wyjazdem na wakacje – stopień trzeci – albo znowu tak, jak wtedy, kiedy nazajutrz rano po solidnej imprezie trzeba się wybrać do pracy na 6:30 rano – stopień czwarty – albo wreszcie tak, jak wtedy kiedy naszym szefem jest premier i właśnie się dowiedział, że nie przygotowaliśmy mu tych małych karteczek do przemówienia, które ma wygłosić za 5 minut – to jest stopień piąty, czyli chaos po zbóju.

Teraz nasi uczestnicy zaczynają korzystać z testowanej technologii. Obserwujemy błędy, jakie popełniają na kolejnych stopniach dystrakcji. Interesuje nas kilka różnych rzeczy. Po pierwsze, ważny jest katalog możliwych błędów. Twórcy testowanej technologii mogą do nich dopasować funkcjonalności typu „głupi Jasio”. Najdalej idącym rozwiązaniem jest automatyzacja tego konkretnego fragmentu procesu tak, żeby użytkownik nawet nie miał okazji podejmować decyzji prowadzących do popełnienia błędu. Innym rozwiązaniem jest sugestia ukierunkowana na podświadomość, np. wyeksponować graficznie to, co użytkownik powinien kliknąć na ekranie i raczej zmniejszyć albo schować w mniej widocznym menu to, czym w danej chwili raczej nie powinien się zajmować jak nie chce żeby mu się apka zawiesiła. Największe zaufanie do użytkowników wykazujemy wtedy, kiedy po prostu umieszczamy sugestie ukierunkowane na świadomość, jak na ekranach zamówienia w McDonaldzie: „czy jesteś pewien/pewna że to jest Twoje zamówienie ?” itp.

Wyposażamy kolejną generację prototypów w tego typu zabezpieczenia i testujemy ponownie. Ideałem jest dojście do zerowej liczby błędów użytkowników na najwyższym poziomie dystrakcji. Eksperyment może jednak wykazać, że realistycznie możliwy do osiągnięcia jest nieco niższy poziom doskonałości. Pozwala nam to określić, jaka liczba jakiego rodzaju błędów jest realistycznie do przewidzenia w typowej interakcji naszego reprezentatywnego targeta z definitywną, lansowaną na rynku technologią.

Tak sobie pomyślałem, że takie laboratorium behawioralne, jakie chciałbym stworzyć w projekcie BeFund może już na wejściu oferować twórcom nowych technologii środowisko eksperymentalne skalibrowane – i to starannie – pod kątem możliwych stopni dystrakcji. To byłoby jak znalazł do testowania różnych aspektów technologii. Niezawodność to jedno, ale szybkość to drugie. Jak szybko nasze króliki eksperymentalni (królicy eksperymentalni ?) zarejestrują 100 faktur w systemie rachunkowo – księgowym, na różnych stopniach dystrakcji ? Jakie błędy przy tym popełnią ? No i jeszcze jedno: jak bardzo będą kontent, albo wręcz przeciwnie, po wykonaniu całego ciągu operacji ?

Ta ostatnia kwestia, czyli subiektywne doznania uczestników eksperymentu, jest istotna dla procesów uczenia się, o których pisałem już wcześniej, we wpisie pt. „Dwie kule w Kalifornii i wielebny Thomas Bayes”. Kiedy uczestnik eksperymentu przechodzi sekwencję działań, w których może popełniać błędy, jest to sekwencja sukcesów i porażek, która prowadzi do wyćwiczenia określonych wzorców zachowań lub do uświadomienia, że trzeba wykształcić nowe wzorce, lepiej dopasowane do określonego kontekstu. Pojawia się tutaj subtelne rozróżnienie między obiektywną a subiektywną definicją sukcesu lub porażki.

Każda technologia ma jakiś obiektywnie mierzalny wzorzec optymalnego wykorzystania: taki to a taki czas trwania procesu, taka to a taka liczba powtórek w poszczególnych działaniach, taka to a taka liczba błędów poszczególnych typów itd. Można zdefiniować sukces w korzystaniu z tej technologii, np. w jednokrotnym przejściu procesu księgowania faktury, jako określony stopień zbieżności z wzorcem optymalnego działania. Wszystko inne jest porażką. Sukcesem jest np. wykonanie określonego działania bezbłędnie lub w oznaczonym minimalnym czasie. Błędy w wykonaniu tych działań lub dłuższy od wyznaczonego czas wykonania to porażka.

Wiele technologii, zwłaszcza tych obsługiwanych cyfrowo przez użytkownika, zawiera mechanizmy natychmiastowej kompensacji błędów popełnianych przez tego ostatniego lub też natychmiastowego wspierania użytkownika. Podręcznikowym przykładem jest system kontroli trakcji w samochodzie albo też znana wielu osobom funkcjonalność cyfrowa, gdzie system kupowania czegoś przez Internet pyta czy wypełnić dany formularz wcześniej zapisanymi danymi użytkownika. W obecności takich rozwiązań pojawia się różnica między obiektywnie pojętym sukcesem lub porażką z jednej strony, a subiektywnym postrzeganiem sukcesu i porażki przez użytkownika technologii. Ten ostatni często nie zauważa że popełnił błąd albo że działał z nieoptymalną sprawnością, gdyż technologia „zamaskowała” to.

Wyobraźmy sobie sekwencję działań w 12 krokach, wykonywaną w środowisku eksperymentalnym. Dla każdego kroku, poza obiektywną obserwacją pytamy uczestnika eksperymentu o jego opinię, czy działał optymalnie (sukces) czy też nie (porażka). W tabeli poniżej przedstawiam dwa równoległe zapisy tej sekwencji, jeden wynikający z obiektywnej obserwacji, drugi z subiektywnego postrzegania uczestnika eksperymentu.

Krok sekwencji Obiektywna obserwacja Subiektywne wrażenie uczestnika eksperymentu
1 Porażka Sukces
2 Porażka Sukces
3 Sukces Sukces
4 Porażka Porażka
5 Porażka Sukces
6 Porażka Sukces
7 Sukces Sukces
8 Porażka Sukces
9 Porażka Sukces
10 Porażka Sukces
11 Porażka Porażka
12 Sukces Sukces

Sekwencja sukcesów i porażek wynikająca z obiektywnej obserwacji wskazuje, że użytkownik testowanej technologii odniósł więcej porażek niż sukcesów, a więc jego zachowanie wymaga zmiany, czyli wykształcenia nowego wzorca. Co więcej, ciągi porażek pomiędzy punktowymi sukcesami są coraz dłuższe w miarę upływu kolejnych sekwencji testowanego procesu. Użytkownik potrzebuje coraz więcej działań, żeby uczyć się wykonywać poprawnie przynajmniej niektóre z działań poprawnie. No, kochanieńki, trza się wziąć za siebie i odrobić lekcje.

Lekcje może jednak odrobić także sama technologia. Wbudowane do niej bufory kompensujące nieoptymalne działania ze strony użytkownika umożliwiają temu ostatniemu zupełnie inną percepcję tej samej sekwencji. W swoim własnym mniemaniu użytkownik miał więcej sukcesów niż porażek, czyli ma podstawy żeby ten konkretny wzorzec działania utrwalić. Co więcej, jego własne wrażenie jest takie, że w miarę wykonywania kolejnych działań w tej sekwencji porażki pojawiają się coraz rzadziej. Sławoj być king, innymi słowy. Sławoj nie odczuwa najmniejszej potrzeby odrabiania jakichkolwiek lekcji.

Wyobraźmy sobie teraz, że rozwijamy technologię, która po każdym eksperymencie tworzy rozwiązania pozwalające kompensować nieoptymalne działania użytkowników. Kolejne generacje samochodowych systemów kontroli trakcji są tutaj idealnym przykładem. Automatyczny termostat w systemach klimatyzacji jest innym przykładem. Taka technologia rozwija się w kierunku zwiększenia różnicy między jej własnym procesem uczenia się a procesem uczenia się jej użytkowników. To jest jeden z najbardziej chyba niepokojących aspektów sztucznej inteligencji: jesteśmy dzisiaj w stanie tworzyć coraz więcej technologii, których stosowanie pozwala nam żyć w błogim przeświadczeniu, że wszystko jest spoko a my jesteśmy panami stworzenia, podczas gdy stajemy się, obiektywnie rzecz biorąc, coraz głupsi funkcjonalnie.

No dobra, to tyle byłoby na dzisiaj tej nauki. Niezła, prawie nowa, mało jeżdżona. Tylko kilka niewielkich wgnieceń, ale to jej nadaje charakteru. Tak mi się wydaje, ale to jest tylko subiektywna opinia uczestnika eksperymentu.