SZTUCZNA INTELIGENCJA: SPIS TREŚCI LECTORIUM CALCULEMUS Przejście do pytań
Konspekt do kursu wykładów 2000/2001
Teoria Sztucznej Inteligencji - Część II
© Witold Marciszewski (witmar@calculemus.org)
1.1. Teoria Sztucznej Inteligencji (TSI) ma za cel wytwarzanie, w zakresie oprogramowania i sprzętu, urządzeń (elektronicznych, biologicznych etc) zdolnych do rozwiązywania zagadnień na poziomie wyższych czynności umysłowych (niekiedy wymaga to też naśladowania procesów biologicznych).
1.2. TSI w części stosowanej (wytwarzanie urządzeń) należy do informatyki, a w części podstawowej ma zagadnienia wspólne z tymi naukami, które dotyczą czynności umysłowych i reakcji organizmu. Są to pewne nauki opisowe (biologia, psychologia itp.) i pewne nauki normatywne (logika, teoria gier, teoria decyzji itp). Jest więc TSI teorią leżącą na przecięciu wymienionych dyscyplin.
2.1. Jako dyscyplina dotycząca rozwiązywania problemów, TSI wywodzi się z logiki matematycznej, w której centralnym tematem jest rozwiązywalność czyli rozstrzygalność problemów. Jest to tzw. zagadnienie rozstrzygalności (ZR), w literaturze anglojęzycznej rozważane pod nazwą Entscheidungsproblem (pochodzącą od niemieckiego matematyka Davida Hilberta, który nadał temu zagadnieniu klasyczną postać).
2.2. W sformułowaniu ZR występuje pojęcie algorytmu. Algorytm jest to przepis rozwiązywania problemów z określonej klasy (np. wykonywania określonych działań arytmetycznych, czy oceny poprawności rozumowań), który wskazuje jak w skończonej liczbie kroków dojść do rozwiązania przez operowanie obiektami fizycznymi, w szczególności napisami złożonymi z symboli; przepis ten odwołuje się tylko do kształtu tych napisów i ich położenia w przestrzeni (pomijając np. sens napisów).
Przystępnego wprowadzenia w pojęcie algorytmu dostarcza logika, jako składająca się z (a) rachunku zdań, teorii rozstrzygalnej za pomocą algorytmu zerojedynkowego, oraz (b) rachunku kwantyfikatorów, teorii w której można obserwować ograniczenia metody algorytmicznej i przewagi, jakie miewa nad nią ludzka intuicja (por. niżej 4.1; przewagi te widać przy stosowaniu tabel analitycznych jako metody rozwiązywania problemu, czy rozważana formuła jest prawem logiki).
2.3. Sformułowanie ZR: Czy istnieje algorytm uniwersalny, tj. taki który pozwoliłby o dowolnym problemie roztrzygnąć, czy jest on rozwiązywalny w skończonej liczbie kroków?
2.4. Odpowiedź przecząca na ZR (powstająca z 2.3 przez zastąpienie "czy" przez "nie", a znaku zapytania kropką), zwana twierdzeniem o nierozstrzygalności (zagadnienia z 2.3), została udowodniona przez kilku logików (niezależnie, różnymi metodami). Metodę dowodu za pomocą pojęć informatycznych podał Alan Turing w "Computable numbers, with an application to the Entscheidunsgsproblem" (Liczby obliczalne, z zastosowaniem do zagadnienia rozstrzygalności), 1936. Pojęcia te, wprowadzone po raz pierwszy w tamtym artykule, opisują obiekt matematyczny zwany uniwersalną maszyną Turinga, który jest abstrakcyjnym prototypem komputerów cyfrowych. Składa się nań pamięć, program, urządzenie do odczytywania danych zapisanych w pamięci i urządzenie do zapisywania w pamięci nowych danych.
3.1. Program komputerowy jest to zapis określonego algorytmu w jednym z języków utworzonych w celu nadawania poleceń komputerowi; są one zwane językami programowania (Pascal, Prolog, C etc).
3.2. Twierdzenie Turinga o nierozstrzygalności, zaprzeczając możliwości istnienia uniwersalnego algorytmu, w konsekwencji zaprzecza też możliwości stworzenia uniwersalnego programu -- tzn. takiego, który by służył do rozstrzygania o dowolnym problemie, czy da się on rozwiązać w skończonej liczbie kroków. Stanowi to istotne ograniczenie SI w przypadku tych procesów komputerowych, które naśladują inteligentne czynności umysłu ludzkiego dokonywane za pomocą symboli.
4.1. Sytuacja opisana w 3.2. prowadzi do dwóch pytań, które są kluczowe w badaniach nad SI i stanowią w ich obecnym stanie kwestie otwarte.
- a) Czy umysł ludzki jest zdolny pokonać ograniczenia właściwe maszynie Turinga, skutecznie rozwiązując problemy, np. dochodząc do prawdziwych twierdzeń matematycznych, bez posługiwania się algorytmami i zakładanym przez nie językiem symbolicznym?
Podkreślono słowo "skutecznie", gdyż wiadomo np, że matematycy uznają wiele twierdzeń, do których doszli nie za pomocą algorytmów, lecz tego, co nazywają intuicją . Bywa jednak podnoszona wątpliwość: czy można zawierzać takiej intuicji? Wysuwana jest hipoteza, że można o tyle, o ile da się wykazać, że to, co uchodzi w naszym mniemaniu za intuicję, jest w gruncie rzeczy algorytmem. w którym symbolami byłyby jakieś stany systemu nerwowego. Według innego poglądu (Gödel, Post, Penrose, Searle i in.), intuicja jest procesem skutecznie (co nie oznacza jednak całkowitej niezawodności) rozwiązującym pewne problemy, choć nie mającym charakteru algorytmicznego.
- b) Jeśli możliwe jest jest dla człowieka rozwiązywanie pewnych problemów metodami innymi niż algorytmiczna, to czy tego rodzaju procesy, nie nadające się do naśladowania przez komputery cyfrowe, mogłyby być naśladowane przez wytwory ludzkiej techniki inne niż cyfrowe, np. komputery analogowe czy sieci neuropododobne?
4.2. Odpowiedzi na powyższe pytania dzielą się na dwie klasy (wewnętrznie dalej różnicowane): radykalna TSI (ang. strong AI) oraz umiarkowana TSI (ang. weak AI).
- Teorie radykalne (McCarthy i in.) głoszą, że nastąpi dorównanie (może nawet przewyższenie) inteligencji ludzkiej przez AI; wedle jednej wersji dokona się to metodami wyłącznie algorytmicznymi; jest też wersja, która nie wyklucza uzupełnienia metod algorytmicznych przez inne. Inny podział teorii radykalnych dokonuje się wedle tego, czy dorównanie inteligencji ludzkiej przez AI ma się dokonać przez wytworzenie świadomości (w urządzeniach elektronicznych itp.) czy też z pominięciem świadomości jako czegoś, co nie jest konieczne nawet dla maksymalnie inteligentnego postępowania.
- Teorie umiarkowane nie przewidują tak daleko idących wyników. W ich ujęciu SI jest to zbiór programów mający dalece zwielokrotniać możliwości rozwiązywania problemów przez ludzi, ale nie mający szans na stanie się niezależnym od programowania z zewnątrz podmiotem umysłowym. Wedle jednych tłumaczy się to tym, że podmiot umysłowy nie jest obiektem fizycznym (Gödel). Inni szukają wyjaśnienia w tym, że mózg, będąc obiektem fizycznym, podlegałby pewnym prawom przyrody z poziomu kwantowego (czekającym dopiero na odkrycie), które nie miałyby charakteru algorytmicznego (Penrose).
5.1. Rodzaje urządzeń do przetwarzania informacji. Rozwiązywanie problemów (którego skuteczność i stopień złożoności są miarami inteligencji) jest przetwarzaniem informacji; np. wniosek rozumowania, będący odpowiedzią na postawiony problem, powstaje z przetworzenia zdań pełniących rolę przesłanek. Stąd, urządzenia do przetwarzania informacji są narzędziami SI.
5.2. Istnieją dwie klasyfikacje (inaczej, podziały) takich urządzeń, każda biorąca pod uwagę inną zasadę podziału. Ze względu na sposób zapisu danych dzielą się one na analogowe i cyfrowe. Ze względu na sposób sterowania dzielą się na urządzenia sterowane programem (komputery cyfrowe) i sterowane sygnałami (sieci neuronowe; inaczej, neuropodobne).
5.3. Komputer cyfrowy to urządzenie (realizujące schemat maszyny Turinga), w którym zarówno dane jak i programy (czyli instrukcje przetwarzania danych) są zapisywane w postaci dyskretnej (tj. nieciągłej) jako liczby. Są one kodowane w arytmetycznej notacji binarnej (dwójkowej), tj. takiej, że do zapisania dowolnie wielkiej liczby wystarczają dwie cyfry: "0" i "1". Traktowanie programów jako liczb jest naturalne, sprowadzają sie one bowiem do funkcji matematycznych. Zapisywanie zaś danych jako liczb (gdy chodzi o inne procesy niż rachowanie) zapewnia się np. przez umowne przyporządkowanie liczb literom alfabetu i innym symbolom (jak np. w kodzie ASCII); w przypadku obrazów - przez podawanie współrzędnych liczbowych każdego elementu obrazu, itd. Realizacja sztucznej inteligencji w komputerze cyfrowym jest możliwa na tyle, na ile procesy rozwiązywania różnego typu problemów dają się ująć za pomocą liczb wymiernych; okazuje się jednak, że jest to możliwe w ogromnym zakresie.
5.4. Komputer analogowy to maszyna do wykonywania operacji arytmetycznych na liczbach, gdzie liczby (będące danymi) są reprezentowane przez pewne wielkości fizyczne, które mogą być ciągłe. Maszyny analogowe bywają mechaniczne, elektryczne i in. W elektrycznych do reprezentacji danych wejściowych używa się zwykle napięć, przy czym wielkość napięć odpowiada wielkościom reprezentowanych przez nie danych wejściowych (ze względu na tę analogiczność liczbową przyjęło się określenie "analogowy"). Komputery analogowe zostały zdominowane przez cyfrowe z ważnych względów praktycznych, ale mają one swoiste zalety w pewnych zastosowaniach. W dyskusji o SI dostarczają one alternatywnego modelu systemu nerwowego, który funkcjonuje na zasadzie łączenia trybu pracy cyfrowego z analogowym.
5.5. Sieć neuronowa jest to urządzenie imitujące system nerwowy, w którym przekształczniu informacji polega na przetwarzaniu sygnałów (bodźców) wejściowych na reakcje zachodzące na wyjściu. Zachodzi to w procesie przechodzenia sygnałów przez ułożone warstwami układy jednostek zwanych neuronami. Dokonuje się to nie według zapisanych symbolicznie instrukcji lecz według praw funkcjonowania sieci ustalonych przez jej konstruktora. Oto przykłady zastosowań sieci:
-- rozpoznawanie obrazów (szczególnie "mocna strona" sieci)
-- prognozy giełdowe
-- prognozowanie sprzedaży
-- prognozowanie cen
-- prognozowanie działalności handlowej
-- dobór pracowników
-- dobór surowców
-- planowanie remontów maszyn
-- sterowanie procesami przemysłowymi
-- analiza wyników badań medycznych
-- wybór zadań śledztwa w kryminalistyce.Do tych samych celów można stosować komputery cyfrowe, stąd powyższe wyliczenie ilustruje w ogóle zastosowania SI. Używanie jednak sieci ma w wielu przypadkach zalety praktyczne. Stwierdzono np. że w wykrywaniu obiektów podwodnych techniką sonorową sieć analizowała dane skuteczniej i szybciej, a jej przestrojenie do nowych zadań wymagało kilku godzin, podczas gdy opracowanie do tych zadań nowego programu dla maszyny cyfrowej liczyło się w miesiące.
6. Pola zastosowań SI. Przykłady szczegółowych zastosowań SI podane w 5.5 należy uzupełnić o szersze pola zastosowań. wśród których można - oprócz obliczeń numerycznych - przykładowo wymienić następujące.
- gry, w szczególności szachy (opracowane już w latach 40-tych przez Turinga);
- rozumowania, w postaci systemów dowodzących twierdzeń oraz systemów sprawdzających poprawność rozumowań wykonanych przez człowieka;
- klasyfikowanie obiektów;
- rozpoznawanie obrazów, dźwięków itp;
- podejmowanie decyzji;
- wyszukiwanie informacji w bazach danych;
- rozumienie i przetwarzanie języka naturalnego (np. w celach przekładu)
- systemy eksperckie (połączenie wyszukiwania informacji z przetwarzaniem języka i wnioskowaniem, w celu diagnozowania, prognozowania itp);
- wykonywanie prac przez roboty;
- uczenie się na podstawie doświadczenia;
- programowanie automatyczne i sprawdzanie poprawności programów;
- wykrywanie defektów irządzeń i materiał, schorzeń organizmu itp;
- komponowanie utworów muzycznych, plastycznych itp;
- posługiwanie się agentami, tj, zindywidualizowanymi programami reprezentujących wiedzę, zainteresowania, interesy, preferencje konkretnego uczestnika pewnego procesu, np. wyszukiwania informacji w bazach danych czy prowadzenia negocjacji z jakimś partnerem (który może być też reprezentowany przez agenta).
- posługiwanie się programami agentowymi typu ,,virtual assistents'' do selekcji informacji napływających z sieci, dokonywanej na podstawie rozpoznania potrzeb i preferencji użytkownika (zob.\ www.GWForecast.gwu.edu, strona George Washington University).
- Nowy projekt "electronic virtual assistant" -- Eva -- z ludzką postacią, głosem i charakterem, dobrana do gustów użytkownika. Prowadząc z nim konwersacje Eva pozna inteligencję, wiedzę, upodobania i pod tym kątem prowadzić będzie nasłuch informacji.
Uzasadnienie potrzeby selekcji: we wrześniu 2000 było w sieci ok. 550 miliardów dokumentów, a z każdym dniem ich liczba powieksza się o 7 milionów. Z tego miliard jest zindeksowany i możliwy do odszukania przez przeglądarki.
6.1 Infocywilizacja jest to cywilizacja właściwa społeczeństwu epoki informacyjnej, która następuje po rolniczej i przemysłowej (określenie epoki informacyjnej podane jest niżej, 6.4, w kontekście uprzedniej charakterystyki okresów poprzedzających).
6.2 Epoka rolnicza: źródło (podstawowe) utrzymania i dochodu - ziemia; źródło energii - siła ludzi i zwierząt; najszybszy sposób transferu pieniędzy - konno; sposób prowadzenia wojny - walka wręcz.
6.3 Epoka przemysłowa: źródło utrzymania i dochodu - produkcja przemysłowa za pomocą obrabiarek; źródło energii - silniki (parowe, elektryczne etc.); najszybszy sposób transferu pieniędzy - telegraficzne polecenie przekazu; sposób prowadzenia wojny - przy pomocy maszyn (armaty etc.)
6.4 Epoka informacyjna czyli infocywilizacja: źródło utrzymania i dochodu - produkcja i usługi realizowane z wszechobecnym zastosowaniem SI, oraz wiedza naukowa i fachowa nabywana w wyniku intensywnej edukacji; źródło energii - j.w. oraz źródła niekonwencjonalne, osiągalne dzięki postępowi wiedzy; najszybszy sposób transferu pieniędzy - przez Internet, karty elektroniczne itp; sposób prowadzenia wojny - broń "inteligentna" (Internet i broń "inteligentna" należą do SI).
6.5 Nową jakość w w/w dziedzinach stanowi globalizacja zaistniała dzięki osiągnięciom telekomunikacji i globalnej sieci komputerowej (Internet), a więc dzięki także SI, mającej wkład do Internetu np. w procesach wyszukiwania informacji, automatycznego przekładu i in. Globalizacja redukuje czas i przestrzeń, co wymaga nowych sprawności, np. gdy idzie o niezbędną szybkość podejmowanie decyzji przez menedżerów.
7.1. Jak widać z 6.4, warunki działania menedżerskiego w infocywilizacji wymagają wiedzy o SI, z dwóch powodów: (a) dla rozumienia społeczeństwa, w którym się działa, w szczególności procesów globalizacji (por. wyżej 6.5); (b) dla podejmowania decyzji menedżerskich, gdyż najczęściej będą się one wiązały z jakimś zastosowaniem SI.
7.2. Przykłady problemów decyzyjnych menedżera w firmie przyszłości (niedalekiej), wymagających wiedzy o SI:
- organizacja firmy z wykorzystaniem inteligentnych systemów zarządzania, jak systemy wyszukiwania informacji, doboru personelu, prognozowania rozwoju firmy itd;
- optymalizacja produkcji;
- decyzje dotyczące zachowań na rynku, podejmowane przy użyciu systemów eksperckich do prognozowania (cen, sytuacji na giełdzie itp) oraz przy użyciu agentów (por. wyżej 5.5 i 6).
7.3. Wiedza praktyczna, o której mowa w 7.2, zakłada ogólniejsze przygotowanie teoretyczne w zakresie SI, niezbędne fo tego, żeby menedżer potrafił sformułować problemy, w których musi się konsultować ze specjalistami od SI: czy zainstalować systemy cyfrowe czy neuronowe, czy opłaca sie zakupić system typu agent, czy ekonomiczniej wykonac coś z użyciem SI czy inteligencji ludzkiej itp.
7.4. Coraz więcej produktów przemysłowych, gdy idzie o decyzję podjęcia ich produkcji, będzie wymagać wysoce teoretycznej wiedzy o SI, obejmującej oszacowanie szans, jak daleko zdoła posunąć się SI w naśladowaniu i uzupełnianiu inteligencji ludzkiej; uzupełnianie będzie, w szczególności, obejmować implanty pamięci i innych zdolności intelektualnych.
8.1. W perspektywie procesów, o których mowa w 7.4 pojawiło się nowe pojęcie menedżera, które bywa wyrażane terminem menedżer intelektualny. Jest to ktoś, u kogo kompetencje menedżerskie są wspomagane sprawnościami podobnymi do dyspozycji naukowca. Naukowiec to człowiek umiejący myśleć abstrakcyjnie, korzystać z teorii naukowych, wybierać między konkurencyjnymi teoriami, samodzielnie stawiać problemy, wysuwać odpowiedzi (własne teorie), sprawdzać te odpowiedzi logicznie i doświadczalnie oraz konstruować w miarę potrzeby nowe pojęcia (nabyciu tych dyspozycji sprzyja studiowanie logiki z metodologią nauk).
8.2. Gdy idzie o treść pojęć i teorii, z którymi mieć będzie do czynienia menedżer intelektualny, w przeważającej mierze będzie się ona wiązać z SI, zarówno w aspekcie zarządzania firmą, jak i w aspekcie udziału w grze rynkowej (por. wyżej 7.3 i 7.4). W przypadku decyzji strategicznych i podejmowanych na długi dystans, trzeba będzie sięgać do podstawowych rozważań teoretycznych (por. 4.1 i 4.2 w zestawieniu z 7.4).