1 Metody zapisu wiedzy
2 Logika Logika jest formalnym językiem reprezentacji informacji takim, w którym mogą być wyciągane wnioski Syntaktyka definiuje zdania w języku Semantyka definiuje "znaczenie" zdań; tzn. definiuje prawdziwość zdań w opisywanym świecie Np. język arytmetyki x + 2 > y jest zdaniem; x2 + y > nie jest zdaniem x + 2 >= y jest prawdziwe wtw x + 2 jest nie mniejsze niż liczba y x + 2 > y jest prawdziwe w świecie, gdzie x = 7, y = 1 x + 2 > y jest nieprawdziwe w świecie, gdzie x = 0, y = 6
3 Logiczna konsekwencja Logiczna konsekwencja oznacza, że jeden fakt wynika z innego: KB |= α jest logiczną konsekwencją bazy wiedzy KB wtedy i tylko wtedy gdy jest prawdziwe we wszystkich światach, w których KB jest prawdziwe Np. logiczną konsekwencją bazy wiedzy KB zawierającej „Pies jest studentem" i „Kot jest studentem" jest zdanie „Kot jest studentem i Pies jest studentem„ natomiast nie jest konsekwencją fakt „Słoń jest studentem” Np. 4 = x + y jest logiczną konsekwencją x + y = 4 Logiczna konsekwencja jest relacją pomiędzy zdaniami (syntaktyka) która opiera się na semantyce Uwaga: umysł analizuje syntaktykę (pewnego rodzaju)
4 Modele Logicy myślą zazwyczaj w terminach modeli, które formalnie są ustrukturalnionymi światami względem których można wyznaczać prawdziwość Mówimy, ze m jest modelem zdania α jeśli α jest prawdziwe w m M( ) jest zbiorem wszystkich modeli Wtedy KB |= α wtw M(KB) zawiera się w M(α) Np. KB = Pies jest studentem i Kot jest studentem α = Pies jest studentem
5 Wnioskowanie KB |= i α zdanie α może być wyprowadzone z KB procedurą i Poprawność: i jest poprawne, jeśli zawsze kiedy KB |= i α, to też KB |= α Pełność: i jest pełne jeśli zawsze kiedy KB |= α, to też KB |= i α Cel: zdefiniować logikę, w której można wyrazić możliwie jak najwięcej i dla której istnieje poprawna i pełna procedura dowodzenia. Tzn. ta procedura odpowie na każde pytanie, które wynika z tego, co wiadomo w bazie wiedzy KB.
6 Cechy charakteryzujące system logiczny poprawność zupełność niesprzeczność rozstrzygalność
7 Poprawność Pojęcie poprawności odnosi się do relacji pomiędzy składnią a semantyką systemu logicznego System jest poprawny jeśli każda konkluzja posiadająca dowód w sensie składniowym jest prawdziwa w sensie semantycznym W systemie poprawnym każda formuła, którą potrafimy dowieść manipulując na symbolach i wykorzystując aksjomaty teorii jest prawdą w sensie semantycznym, tj. nie można wskazać takiej interpretacji, że formuła jest fałszywa
8 System niepoprawny Załóżmy, że w pewnym systemie logicznym przyjmiemy aksjomat: Wówczas za poprawne musielibyśmy uznać sformułowanie: Ponieważ nieprawdą jest to, że Jan jest mężczyzną i jest studentem to prawdą jest, że nie jest mężczyzną lub jest studentem
9 Zupełność Pojęcie zupełności również odnosi się do relacji pomiędzy składnią a semantyką System logiczny jest zupełny, jeśli każda konkluzja prawdziwa w sensie semantycznym może być dowiedziona na gruncie składniowym W systemie zupełnym nie może istnieć formuła prawdziwa w sensie semantycznym i nie posiadająca dowodu w sensie składniowym
10 System niezupełny Załóżmy, że usuwamy z pewnego systemu prawo podwójnego przeczenia Wówczas niemoglibyśmy dowieś stwierdzenia: Jeżeli Jan jest studentem to nieprawdą jest, że nie jest studentem
11 Niesprzeczność Pojęcie niesprzeczności dotyczy już wyłącznie syntaktyki i zbioru aksjomatów System jest niesprzeczny jeśli nie istnieje taka formuła, że w sensie składniowym można dowieść, iż jest ona zarówno prawdziwa jak i fałszywa
12 Rozstrzygalność Pojęcie rozstrzygalności dotyczy również tylko syntaktyki i zbioru aksjomatów System jest rozstrzygalny, jeśli dla każdej formuły można dowieść w sensie składniowym, czy jest prawdziwa czy fałszywa
13 Kryteria doboru języka Efektywność, której miarą może być liczba symboli potrzebnych do reprezentacji wiedzy Siła ekspresji wyrażana w bogactwie operatorów logicznych oraz w poziomie szczegółowości Adekwatność rozumiana jako dopasowanie środków wyrazu, czyli siły ekspresji do poziomu złożoności wiedzy
14 Metody zapisu wiedzy Klasyczna logika zdań Logika predykatów pierwszego rzędu Logika atrybutowa Logika opisowa Język Rebit
15 reguły pakiet wiedzy pakiet funkcji zbiory reguł siatki decyzyjne tabele decyzyjne przesłanki konkluzje termy funkcje zmienne stałe typy danych
16 Rebit - Organizacja bazy wiedzy
17 Definicja typów danych, stałych, zmiennych oraz funkcji Baza wiedzy w systemie REBIT zawiera elementy, które przechowują lub przetwarzają dane: jednowartościowe (single) wielowartościowe (multiple) Do pełnej charakterystyki danych wielowartościowych konieczne jest określenie relacji porządku: uporządkowane (ordered) nieuporządkowane (unordered) Dane wielowartościowe nieuporządkowane posiadają wszelkie cechy by nazywać je zbiorami. Dane wielowartościowe uporządkowane są zbliżone w sensie matematycznym do pojęcia ciągu, a w ujęciu programistycznym odpowiadają koncepcji listy lub tablicy.
18 Typy danych Pojęcie typu (lub dziedziny) odnosi sie do elementów bazy wiedzy, które przechowują lub przetwarzają dane. Do tego rodzaju elementów należą stałe, zmienne oraz funkcje. Typ określa przestrzeń możliwych wartości, jakie może przyjmować element. W systemie REBIT istnieją dwie główne kategorie typów: typy podstawowe (basic types) typy okrojone (constrained types) W obecnej wersji dopuszczalne są następujące typy podstawowe: liczby całkowite (integer) liczby rzeczywiste (real) tekstowy (string) logiczny (boolean)
19 Typy danych System REBIT dopuszcza dwie kategorie typów okrojonych: typy wyliczeniowe (enum type) typy interwałowe (range type) Typy wyliczeniowe definiuje się ekstensjonalnie poprzez specyfikację wszystkich możliwych elementów. Elementy typu wyliczeniowego mogą przyjmować wartości należące do jednego z trzech typów podstawowych: rzeczywisty, całkowity i tekstowy. Typy interwałowe definiuje się poprzez podanie lewego i prawego końca przedziału oraz opcjonalne dodatniego kroku (step > 0). Typ interwałowy bez kroku reprezentuje wszystkie liczby rzeczywiste leżące w zadanym przedziale. Typ interwałowy z ustalonym krokiem reprezentuje wybrane liczby rzeczywiste (a w szczególnych przypadkach całkowite) z podanego przedziału.
20 Zmienne Zmienne służą do przechowywania danych, które w trakcie procesu wnioskowania mogą podlegać zmianom. Zmienne są elementami języka, które wymagają definicji. Definicja musi zawierać nazwę zmiennej oraz typ (dziedzinę) danych przechowywanych przez zmienną. Nazwa zmiennej musi być unikalna w obrębie całej bazy wiedzy. Typem danych przechowywanych przez zmienną może być jeden z typów podstawowych albo jeden z typów okrojonych. Jako że zmienne są elementami, który przechowują dane, definicja zmiennej wymaga podania krotności (multiplicity) oraz porządku (ordering).
21 Funkcje Funkcje służą do specyfikacji operacji na danych. Każda funkcja musi zwracać pewne dane. Funkcje, podobnie jak zmienne, są elementami języka, które muszą być definiowane. Definicja funkcji wymaga podania nazwy funkcji, typu (dziedziny) danych zwracanych przez funkcję oraz typu parametrów funkcji Definicja funkcji wymaga podania krotności (multiplicity) oraz porządku (ordering) dla wszystkich parametrów funkcji oraz dla danych zwracanych przez funkcje Definicja funkcji zawiera jedynie informacje o danych wejściowych i wyjściowych, i w żaden sposób nie precyzuje wewnętrznych szczegółów algorytmu realizowanego przez funkcje
22 Stałe Stałe są najprostszym elementem języka, przeznaczonym do przechowywania danych, które nie podlegają zmianom. W odróżnieniu od zmiennych i funkcji stałe nie wymagają odrębnej sekcji definiującej. Są definiowane doraźnie w momencie pojawienia się w regule.
23 Termy Term reprezentuje każdorazowe wystąpienie stałej, zmiennej lub funkcji w przesłance lub konkluzji reguły. Termy będące wystąpieniami stałych noszą nazwę termów stałych, termy będące wystąpieniami zmiennych nazywa się termami zmiennymi i przez analogie na termy reprezentujące wystąpienie funkcji używa się określenia termy funkcyjne. O ile termy stałe i zmienne są stosunkowo prostymi konstrukcjami, o tyle termy funkcyjne, ze względu na obecność argumentów, już takimi konstrukcjami nie są. Argumentem termu funkcyjnego może term stały lub zmienny. Dopuszcza się również, by argumentem termu funkcyjnego mogła być inny term funkcyjny, co w efekcie prowadzi do struktury o charakterze drzewa. Nie nakłada się ograniczeń na liczbę poziomów zagnieżdżania w strukturze termów.
24 Termy Mając na uwadze stopień złożoności termów, wynikający z możliwości zagnieżdżania, rozróżnia się: termy proste termy złożone Do termów prostych zalicza się termy stałe oraz zmienne. Termy złożone to termy składające się z innych termów. Jedynym przedstawicielem termu złożonego jest term funkcyjny. Ponieważ term jest elementem przechowującym dane, stosują się do niego wszystkie atrybuty dla tego rodzaju elementów, a w szczególności typ, czyli dziedzina wartości oraz krotność i porządek. W przypadku termów zmiennych i funkcyjnych wartość tych atrybutów jest określona poprzez zmienną i funkcję, której są wystąpieniami. Term stały w odróżnieniu od pozostałych jest jednocześnie definicją stałej. W związku z tym wymagana jest specyfikacja typu, krotność oraz porządku. Funkcja jest specyfikacją operacji możliwej do wykonania. Używając terminologii programistycznej, funkcja jest w istocie deklaracją pewnej operacji. Dopiero term funkcyjny wyraża fakt użycia zadeklarowanej wcześniej funkcji. Związek o identycznym charakterze występuje pomiędzy zmienną a termem zmiennym.
25 Termy - przykłady Przykład 2.1. Termy stałe 2 – term prosty reprezentujący stałą jednowartościową {„angielski”, „niemiecki”, ”francuski”} – term prosty reprezentujący stałą wielowartościową nieuporządkowaną [3, 6, 1, 2]– term prosty reprezentujący stałą wielowartościową uporządkowaną Przykład 2.2. Termy zmienne Podatek – term prosty reprezentujący zmienną o nazwie Podatek We wszystkich poniższych przykładach wykorzystano nawiasy kwadratowe „[” i „]”do oznaczenia danych wielowartościowych uporządkowanych oraz nawiasy klamrowe „{” i „}”do oznaczenia danych wielowartościowych nieuporządkowanych.
26 Termy - przykłady Przykład 2.3. Termy funkcyjne. add(X, 2)– term złożony reprezentujący funkcję dodawania; argumentami są term zmienny X i term stały 2 ln(Y) – term złożony reprezentujący funkcję do obliczania logarytmu naturalnego; argumentem jest term zmienny Y max([3, 7, 1, 10]) – term złożony reprezentujący funkcję do znajdowania maksimum; argumentem termu funkcyjnego jest term stały, wielowartościowy, uporządkowany multiply(ln(Y), 3)– term złożony, zagnieżdżony reprezentujący funkcję mnożenia (term nadrzędny) oraz funkcję do obliczania logarytmu naturalnego (term podrzędny)
27 Formuły atomowe są elementarnymi wyrażeniami logicznymi, przyjmującymi wartości prawdy lub fałszu. Na formułę atomową składa się term lewostronny, term prawostronny oraz operator relacyjny. W notacji Backusa-Naura formułę atomową zapisuje się następująco: gdzie: – term lewostronny – term prawostronny – operator relacji
28 Dostępność operatorów w zależności od rodzaju termu
29 Formuły atomowe z termami stałymi MultipleUnordered- MultipleUnordered. {1, 2, 3} {1, 2, 3, 4} – prawda {1, 2, 3, 4} {1, 2, 3} – prawda {1, 2, 3} {2, 3, 4} – fałsz {1, 2, 3} {0, 3}– prawda
30 Formuły atomowe z termami stałymi MultipleOrdered- MultipleOrdered [1, 5, 3] [1, 5, 3, 0]– prawda [1, 2, 3] [1, 2, 3, 4]– prawda [1, 2, 3] [2, 3, 4, 5]– fałsz [1, 2, 3] [3, 2, 1]– fałsz [1, 2, 3] [1, 2, 3]– fałsz [1, 2, 3] [4, 5, 6]– prawda [1, 2, 3] [1, 2, 4]– prawda [1, 2, 3] [3, 2, 1]– prawda
31 Formuły atomowe ze zmiennymi, stałymi i funkcjami X = 2 Przychód > Koszty Stawka [20, 30, 40] add(X, 2) ln(Y)
32 Reguły RULE r: IF THEN gdzie: r – identyfikator reguły – przesłanka reguły – konkluzja reguły
33 Przesłanki Przesłanki reguły mają postać koniunkcji formuł atomowych: and and... and gdzie : – i-ta formuła atomowa and – operator koniunkcji
34 Konkluzje Konkluzja reguły zawiera jedną formułę atomową z dodatkowymi ograniczeniami. Ograniczenia odnoszą się do termu występującego po lewej stronie formuły oraz dopuszczalnych operatorów. Term lewostronny musi być termem zmiennym, a jedynym dopuszczalnym operatorem jest operator „=”, interpretowany w tym przypadku jako podstawienie wartości termu z prawej strony pod zmienną występującą po lewej stronie. = gdzie: – zmienna – term
35 Reguły - przykłady RULE 1: IF (X > 2) and (Y = 2) THEN Z = „dobry” RULE 2: IF GatunekStali = „St32” THEN ZamiennikGatunku = {„St32”, „S235”, „DC01”}
36 Dialekty Dialekty języka REBIT związane są z poziomem ekspresji wynikającym z rodzaju dopuszczalnych termów. Ze względu na rodzaj termu rozróżnia się dwa dialekty: Basic Complex W dialekcie o nazwie Basic dopuszczalne są jedynie termy stałe i zmienne. Reguły w dialekcie Complex mogą zawierać wszystkie rodzaje termów.
37 Tabele decyzyjne
38 Siatki decyzyjne
39 Przykład – cennik blach stalowych Producent blach stalowych w kręgach uzależnia cenę produktów od następujących parametrów: –wymiary blachy (grubość, szerokość), –gatunek stali –masa kręgów, –wartość zamówienia, –dodatkowe wymagania, –ocena klienta itp.
40 Kręgi stali
41 Cena bazowa (zł/tonę) grubość/ szerokość 700-9991000-11491150-12991300-14491450-1550 0,40- 0,4930000000 0,50-0,5929002850000 0,60-0,6928002750270000 0,70-0,7427802720268026000 0,75-2,5027002670265026002580
42 Dopłaty za gatunek stali (zł/tonę) Gatunek staliDopłata DC01, DC020 DC03, DC04100 St37-2G, St37-3G50 H260LA, H300LA200 H340LA250 DC01 EK220
43 Dopłata za masę kręgów i dodatkowe wymagania (zł/tonę) Dopłata za masę kręgu poniżej 15 ton – 50 zł Dopłata za masę kręgu poniżej 7,5 tony – 100 zł Dopłata za dodatkowe zabezpieczenie powierzchni – 100 zł Dopłata z specjalne opakowanie kręgów – 150 zł
44 Ocena handlowa Wartość zamówieniaOcena klientaUpust < 50 000nieznany0 < 50 000trudny0 < 50 000premium5% > 50 000nieznany2% > 50 000trudny3% > 50 000premium8%
45 Przykład zamówienia Wymiar blachy gr. 0,65 mm szerokość 1050 mm Gatunek DC03 Kręgi 12 ton Wymagane specjalne zabezpieczenie Masa zamówienia 24 tony Klient premium
46 Kalkulacja Cena bazowa: 2 750 zł/tonę Dopłata za gatunek : 100 zł/tonę, cena: 2 850 zł/tonę Dopłata za masę kręgu 50 zł, cena: 2 900 zł/tonę Dopłata za specjalne zabezpieczenie 100 zł, cena: 3 000 zł/tonę Wartość zamówienia 72 000 zł Upust 8% Koszt zamówienia: 66 240 zł
47 Budujemy siatkę decyzyjną
48 Definiujemy siatkę
49 Tworzymy siatkę
50 Tworzymy reguły
51 Reguły można edytować
52 Po umieszczeniu bazy w repozytorium możemy ją zweryfikować
53 Uruchamiamy wnioskowanie wprzód
54 Wprowadzamy znane fakty
55 Uzyskujemy wynik
56 Tworzymy zbiór reguł dla dopłat
57 Tworzymy zmienne
58 W tym zmienne wielokrotne
59 Wszystkie niezbędne zmienne
60 Reguły
61 Testujemy reguły – wnioskując wprzód
62 Wybieramy zmienne, których wartość znamy
63 Wprowadzamy wartość
64 Uzyskujemy odpowiedź
65 Reguły dotyczące dopłat za masę kręgu
66 Wnioskowanie wprzód
67 Wprowadzamy dane
68 Wynik
69 Reguły dotyczące specjalnych zabezpieczeń
70 Testowe wnioskowanie wprzód
71 Wprowadzanie danych
72 Wynik
73 Dodajemy zmienne
74 Dodajemy reguły
75 Wybieramy dane do testu
76 Wprowadzamy dane
77 Uzyskujemy wynik
78 I historię
79 Tworzymy tabelę decyzyjną
80 Tworzymy typ enumerowany
81 Projektujemy tabelę
82 Wpisujemy dane
83 Generujemy reguły
84 Reguły
85 Testujemy tabelę
86 Wprowadzamy dane
87 I uzyskujemy wynik
88 Integrujemy reguły do zbioru „Cennik”
89 Importujemy zmienne
90 Importujemy reguły
91 Dodajemy zmienną finalną - WartoscOstateczna
92 I dodajmy reguły
93 Wybieramy zmienne wejściowe do wnioskowania wprzód
94 Wprowadzamy dane
95 Uzyskujemy wynik
96 Wprowadzamy nową zmienną
97 Modyfikujemy reguły
98 Wprowadzamy nowe dane
99 I uzyskujemy wynik
100 Wybieramy inny sposób wnioskowania (mieszane)
101 Kolejno wprowadzamy dane …
102 ….
103 I uzyskujemy wynik