Na randkę z komputerem

Rozmowa z Tomaszem Kandeferem, twórcą polskiego chatterbota Ana

Rozmowa z Tomaszem Kandeferem, twórcą polskiego chatterbota Ana

Jak powstawała Ana?

Pierwowzorem Any był chatterbot Adal (napisany w języku C działał jeszcze pod DOS-em). Wszystkim jego najlepszym rozwiązaniom została nadana postać wirtualnej kobiety, choć są i takie ciekawe cechy, których Ana po protoplaście nie odziedziczyła. Oprogramowanie teraźniejszej wersji Any przygotowano w Delphi.

Co było najtrudniejsze podczas jej tworzenia?

Dużym wyzwaniem, poza kłopotliwymi regułami gramatycznymi języka polskiego, było przewidzenie tzw. wiedzy ogólnej o świecie, czyli tematów, jakie rozmówcy chcieliby poruszyć. Coś, co jest oczywiste dla ludzi żywych, jest obce dla Any, którą rządzą sztywne reguły. Zresztą bot zawsze musi udzielić bardziej lub mniej sensownej odpowiedzi. Jednak żeby użytkownik chciał dalej rozmawiać, może np. szczególnie zainteresować go swoją osobą - ściągnąć na niego swoją uwagę. Dlatego podtrzymując konwersację, należy często stosować różne triki psychologiczne i językowe.

Dlaczego nasz język jest tak trudny w przetwarzaniu?

Język polski jest piękny, ale nie dla komputerów. O ile logiczno-syntaktyczne posługiwanie się zbiorem symboli i związanych z tym reguł jest jeszcze możliwe do wprowadzenia (i to też nie całkowite) w pamięć tak tępej maszyny, jaką jest komputer, to zupełną abstrakcją stanie się wieloznaczność powiązań słów, które ma w bazie, a co za tym idzie - cała semantyka. Poszczególne słówka zależne są przecież od szerszego kontekstu w zdaniu i mogą nieść różne przesłanie. Deklinacja, koniugacja to trudne zadanie do przeprowadzenia w algorytmie. Dlatego najwięcej tego typu programów powstaje w języku angielskim. Wiąże się to z dość dużą prostotą tego języka, a jego szczątkowa fleksja wpływa na łatwość oprogramowania go.

Dlaczego stworzyłeś bota kobietę? Czy nie prościej byłoby skonstruować mężczyznę?

A dlaczego nie bota kobietę? Kobieca osobowość jest bardziej złożona niż męska szczególnie dla mężczyzny, ujecie więc jej w algorytm jest podwójnym wyzwaniem. Taka kobieta wirtualna musi mieć dąsy, humorki, potrafić flirtować z męską publiką, plotkować z kobietami itp. Przygotowanie jej duchowego JA i nauczenie maszynę jak ma to wykonać, to duży problem.

Czy Ana zdałaby test Turinga?

Często przeprowadzałem podobne testy do słynnej „gry w imitację” Turinga przez popularnego chata czy IRC-a. Dochodziło wtedy do zabawnych sytuacji, kiedy to „napalony” chłopak chciał umawiać się na randkę z Aną. Nie mogę jednak powiedzieć, że test był dokładnie taki, jaki przewidział Turing – osoby, które brały w nim udział, nie były poinformowane o fakcie przeprowadzania testu, i nie wiedziały z kim rozmawiają. Dla nich było to oczywiste, że to człowiek, a nie ktoś inny. Widać z tego, że wszystko w dyskursie jest zależne od nastawienia rozmówcy. Jeśli wiedzieli, że to bot, a też i takie próby przeprowadzałem, rozmowa nie przebiegała już tak gładko. Ich podchwytliwe pytania szybciej demaskowały program, były często tak zawiłe, że również normalny człowiek dłużej by się nad nimi zastanawiał. Sądzę, że o prawdziwym zdaniu testu Turinga na obecnym etapie nie może być mowy.

Jaką funkcję będzie spełniać Ana dla portalu YoYo? Jedynie rozrywkową czy będzie także np. przeszukiwać zasoby portalu, reklamować go itd.?

O ile mi wiadomo, jednym z zadań będzie reklamowanie portalu i zbieranie informacji o nim. Wszystko jest jednak jeszcze w przygotowaniu. Oczywiście, jej rozrywkowy charakter (w tym dotychczasowa „wiedza”) pozostanie. Zakładam, że współpraca z portalem YoYo da jej szerszy kontakt z różnymi ludźmi za pośrednictwem sieci, a tym samym zapewni możliwość jej dalszego rozwoju (ciągłe polepszanie konwersacji).

Jakie komercyjne zastosowanie mogą mieć chatterboty?

Wszelkie komercyjne zastosowanie szczególnie w naszych polskich realiach jest trudne do przewidzenia. Dopóki ceny połączeń internetowych będą tak wysokie jak obecnie, a dostęp do Internetu będzie powszechniejszy dla przeciętnego Kowalskiego w pracy czy na uczelni aniżeli w domu, dopóty programy pogawędkowe będą miały trudniejszą drogę do kontaktu z ludźmi, od których przecież mogą się tyle nauczyć. Pozostaną dalej tylko ciekawostką.

Jak dalej będzie się rozwijał projekt?

Z pewnością nigdy nie zostanie całkowicie ukończony. Anę i inne tego typu roboty gadające można rozbudowywać praktycznie w nieskończoność, nieustannie je polepszając, bo przecież do ludzkiej doskonałości im ciągle daleko. Szczególnie rozbudowany zostanie proces nauki, który na razie w dużym stopniu jest uzależniony od człowieka wprowadzającego dane, uaktualniającego je. Ciągle jeszcze boty nie są na tyle „inteligentne”, aby same modyfikowały swoje dane. Jeśli to już robią, jest zbyt dużo błędów gramatyczno-stylistycznych, aby zezwolić im na to.


Zobacz również