1 Sterowanie ze sprzężeniem od stanu – metoda alokacji biegunówUżycie obserwatorów pełnych Zastosowanie sprzężenia zwrotnego od stanu wymaga dostępu do wektora stanu w przypadku systemu ciągłego lub w przypadku systemu dyskretnego Nie zawsze jest to możliwe – konieczna staje się rekonstrukcja stanu w oparciu o wszystko, co jest dostępne Dwa punkty widzenia zasługują na rozważenie 1. Czysto deterministyczny 2. Stochastyczny
2 1. Deterministyczne podejścieRozważa się dwa przypadki Przypadek ciągły Przypadek dyskretny Dlaczego np. nie wyznaczyć wektora z równania wyjścia bo oraz są dostępne? Powody: 1. Odwracalność 2. Istnienie szumów pomiarowych
3 Sformułowanie problemu:Korzystając z posiadanej wiedzy o systemie, konkretnie z znajomości parametrów systemu lub znaleźć system liniowy, który w oparciu o znane wartości i będzie dostarczał przybliżoną (aproksymowaną) wartość , estymatę stanu System taki nazywany jest rekonstruktorem stanu lub obserwatorem
4 2. Stochastyczne podejściePrzyjmujemy, że system podlega działaniu szumów pomiarowych oraz przypadkowych zakłóceń Rozważa się dwa przypadki Przypadek ciągły Przypadek dyskretny gdzie, wektor przypadkowych zakłóceń wpływających na zmienne stanu, a wektor przypadkowych szumów wpływających na pomiary Stan systemu i wyjście systemu stają się procesami stochastycznymi lub sekwencjami stochastycznymi wskutek występowania odpowiednio w równaniach stanu i wyjścia składników przypadkowych Notacja: duże pogrubione litery odnoszące się do sygnałów takie jaki oznaczają zmienne przypadkowe, małe pogubione litery odnoszące się do sygnałów takie jak oznaczają szczególne deterministyczne ich realizacje
5 Problem rekonstrukcji stanu w tym podejściu nazywany jest problemem filtracji liniowejSformułowanie problemu: Korzystając z posiadanej wiedzy o systemie, konkretnie z znajomości parametrów systemu lub oraz danych statystycznych szumach i zakłóceniach (rozkłady prawdopodobieństwa, średnie, wariancje) i znaleźć system liniowy o wejściach i , który na wyjściu da estymatę tak bliską jak to możliwe nieznanemu stanowi System taki nazywany jest filtrem. Optymalne rozwiązanie tak sformułowanego problemu w sensie minimalnej wariancji błędu estymacji jest nazywane filtrem Kalman’a
6 Pełny lub n-tego rzędu obserwator (Luenberger’a)Idea pełnego obserwatora Będziemy zakładali, jak poprzednio Przypadek ciągły Podstawowa idea obserwatora Luenberger’a polega na dołączeniu do rozważanego stacjonarnego systemu liniowego, innego stacjonarnego systemu liniowego na który podawane są sygnały oraz i który musi dostarczać na swoim wyjściu przybliżoną wartość stanu Przyjmuje się następującą postać obserwatora gdzie, macierz wzmocnień obserwatora o wymiarach
7 Zadaniem składnika błędu jest powodować zdążanie estymaty stanudo jej rzeczywistej wartości Nie ma powodu, aby wymagać, że w chwili stan początkowy obserwatora był równy stanowi początkowemu obserwowanego systemu, czyli Wymagać należy, aby Zdefiniujemy błąd estymacji Wielkość będzie dobrą estymatą jeżeli Dla oceny wpływu tego wymagania na wybór macierzy , o wymiarze (nxq) , obserwatora tworzymy równanie dynamiki błędu estymacji
8 Warunek generuje wymaganie asymptotycznej stabilności dla systemu błęduestymacji Równanie dynamiki błędu estymacji możemy zapisać gdzie, Rozwiązanie równania dynamiki błędu estymacji Jeżeli wartości własne macierzy leżą w lewej półpłaszczyźnie płaszczyzny zespolonej, to i przybliżona wartość zdąża asymptotycznie do wartości rzeczywistej Tak skonstruowany obserwator nosi nazwę obserwatora Luenberger’a (ciągłego)
9 Schemat blokowy systemu i jego obserwatora
10 Przypadek dyskretny Dla systemu Przyjmuje się następującą postać obserwatora gdzie, macierz wzmocnień obserwatora o wymiarach Zdefiniujemy błąd estymacji oraz równanie dynamiki błędu estymacji
11 Równanie dynamiki błędu estymacji możemy zapisaćgdzie, Rozwiązanie równani dynamiki błędu estymacji Jeżeli wartości własne macierzy leżą w okręgu jednostkowym płaszczyzny zespolonej, to i przybliżona wartość zdąża asymptotycznie do wartości rzeczywistej Tak skonstruowany obserwator nosi nazwę obserwatora Luenberger’a (dyskretnego)
12 Synteza pełnego obserwatoraProjekt obserwatora obejmuje dwa kroki 1. Wartości własne macierzy są wybierane: a. dla przypadku ciągłego w lewej półpłaszczyźnie płaszczyzny zespolonej; ogólnie na lewo od tych jakie zostały wybrane przy projektowaniu sterowania ze sprzężeniem zwrotnym od stanu, czyli na lewo od wartości własnych , aby zapewnić szybsze zanikanie procesów przejściowych obserwatora niż systemu zamkniętego; wybrane wartości własne nie powinny jednak dawać zbyt szybkich procesów przejściowych, gdyż wówczas obserwator będzie miał tendencję wzmacniania wysokoczęstotliwościowych szumów b. dla przypadku dyskretnego w wewnątrz okręgu jednostkowego płaszczyzny zespolonej; ogólnie bliżej początku układu współrzędnych niż te jakie zostały wybrane przy projektowaniu sterowania ze sprzężeniem zwrotnym od stanu, czyli bliżej od wartości własnych , aby zapewnić szybsze zanikanie procesów przejściowych obserwatora niż systemu zamkniętego; wybrane wartości własne nie powinny jednak dawać zbyt szybkich procesów przejściowych, gdyż wówczas obserwator będzie miał tendencję wzmacniania wysokoczęstotliwościowych szumów
13 2. Macierz jest tak wyznaczana, aby rzeczywiściea. dla przypadku ciągłego macierz b. dla przypadku dyskretnego macierz miała wartości własne wybrane w kroku 1 Niech wielomian a. dla przypadku ciągłego: b. dla przypadku dyskretnego: będzie wielomianem charakterystycznym tej macierzy mającym takie wartości własne Dalej dla skrócenia będziemy kontynuować rozważanie tylko przypadku ciągłego
14 Synteza sterowania ze sprzężeniem zwrotnym od stanuMusimy zatem wyznaczyć macierz tak, aby a zatem Ponieważ dla dowolnej macierzy zachodzi możemy napisać Wyznaczanie macierzy L Podobieństwo z problemem wyznaczania macierzy wzmocnień sprzężenia zwrotnego od stanu Synteza sterowania ze sprzężeniem zwrotnym od stanu Synteza obserwatora
15 Korzystając z tego podobieństwaPonieważ dla dowolnej macierzy zachodzi możemy napisać co dokładnie oznacza:
16 Możemy podać warunki istnienia macierzy wzmocnień obserwatoraSynteza sterowania ze sprzężeniem zwrotnym od stanu Synteza obserwatora Macierz wzmocnień Macierz wzmocnień istnieje, jeżeli system istnieje, jeżeli system jest sterowalny jest obserwowalny Problem syntezy obserwatora jest problemem dualnym do problemu syntezy sterowania ze sprzężeniem zwrotnym od stanu
17 Sterowanie ze sprzężeniem od stanu – metoda alokacji biegunówUżycie obserwatorów zredukowanych Pełny lub n-tego rzędu obserwator (Luenberger’a) – redundancja informacyjna Pewna liczba zmiennych stanu dostępna poprzez zakładany pomiar wyjść Będziemy zakładali, jak poprzednio Przypadek ciągły
18 Wyprowadzenie I Zakładamy: q mierzonych wyjść są liniowo niezależne – macierz C ma rząd q Zakładamy też: macierz C o wymiarze qxn ma postać lub można ją sprowadzić do postaci (przez przekształcenie podobieństwa – zmianę bazy)
19 Dekompozycja Biorąc pod uwagę postać macierzy C można napisać równanie stanu w postaci
20 lub Równanie wyjścia staje się oczywiście tożsamością (tautologią) Przy czym pamiętamy Wystarczy teraz estymować tylko v (n-q – elementów)
21 jest dostępne pomiarowo, to równieżIdea rekonstrukcji Ponieważ jest dostępne pomiarowo, to również Wartość jest mierzalna Podane równania możemy tratować jako równania stanu i równania pomiarów, w których - wektor stanu - wektor wejścia - wektor wyjścia (pomiaru) Równanie stanu i pomiaru zredukowanego systemu piszemy w postaci Odpowiada to równaniom:
22 Budujemy pełny obserwator Luenbergera, ale rzędu n-q, który nazywamy obserwatorem zredukowanymOznaczymy macierz wzmocnień obserwatora zredukowanego o wymiarze (n-q)xq Równanie stanu obserwatora zredukowanego przyjmujemy: Wyprowadzenie szczegółowej postaci obserwatora zredukowanego Bezpośrednio mierzy się y, występowanie pochodnej jest niekorzystne – wprowadza się zmienną
23 Podstawiając do ostatniego wynikuotrzymamy nowe równanie obserwatora zredukowanego lub
24 Odpowiada im schemat blokowy obserwatora zredukowanegoPonieważ v ma wymiar (n-q), więc również z ma wymiar (n-q) i jest dobrze określonym obserwatorem zredukowanym tego rzędu
25 Warunki dla obliczenia macierzy wzmocnień obserwatora zredukowanegoJak poprzednio definiujemy błąd rekonstrukcji obserwatora (błąd estymacji) Warunek dobrego estymatora Weźmy zredukowane równanie stanu systemu i początkowe równanie obserwatora zredukowanego Równanie dynamiki błędu obserwatora zredukowanego
26 Macierz stanu jednorodnego równania dynamiki błędu obserwatoraWymagana obserwowalność pary Lemat. Jeżeli para , to para też jest obserwowalna Twierdzenie. Mając dany liniowy stacjonarny system rzędu n, który posiada q liniowo niezależnych wyjść (pomiarów wyjść) i jest obserwowalny, można skonstruować obserwator rzędu (n-q) mający dowolne wartości własne
27 Przeprowadzona konstrukcja wyznacza jeden obserwator tego typu, który posiadajako macierz systemu
28 Sterowalność - osiągalnośćSterowalność określa możliwości wpływania na stan (lub wyjście) systemu odpowiednim ukształtowaniem wejścia Ogólnie wyróżnia się dwa określenia sterowalności: 1. Sterowalność do początku (controllability-to-the-origin), nazywana krócej sterowalnością (controllability) 2. Sterowalność od początku (controllability-from-the-origin), nazywana krócej osiągalnością (reachability)
29 Systemy ciągłe Sterowalność stanu Stan sterowalny Stan systemu liniowego jest sterowalny, jeżeli można system przeprowadzić z tego stanu do stanu za pomocą odpowiedniego sterowania w skończonym czasie Jeżeli każdy stan jest sterowalny, mówimy, że system jest całkowicie sterowalny lub krócej sterowalny
30 Sterowalność systemu System sterowalny System liniowy jest sterowalny w skończonym przedziale czasu , jeżeli istnieje wejście , które przeprowadzi system z dowolnego stanu do stanu zerowego Jeżeli istnieje chociaż jeden stan systemu na który nie można oddziaływać przez jakiekolwiek wejście systemu, wówczas system jest niesterowalny
31 Sterowalność systemu ciągłego liniowego stacjonarnego - testSystem liniowy stacjonarny jest sterowalny wtedy i tylko wtedy, gdy macierz sterowalności, nazywana macierzą sterowalności Kalmana ma rząd n, tzn. rząd systemu Wymiar macierzy sterowalności: nxnp; n – wymiar stanu, p – wymiar wejścia Dla p=1 macierz sterowalności jest macierzą kwadratową i dla sprawdzenia sterowalności wystarczy sprawdzić nieosobliwość macierzy sterowalności
32 Sterowalność a przekształcenia podobieństwaSterowalność zostaje zachowana podczas transformacji podobieństwa
33 Osiągalność stanu Stan osiągalny Stan systemu liniowego jest osiągalny, jeżeli można system przeprowadzić do tego stanu ze stanu za pomocą odpowiedniego sterowania w skończonym czasie Jeżeli każdy stan jest osiągalny, mówimy, że system jest całkowicie osiągalny lub krócej osiągalny
34 Osiągalność systemu System osiągalny System liniowy Jest osiągalny w skończonym przedziale czasu , jeżeli istnieje wejście , które przeprowadzi system do dowolnego stanu ze stanu zerowego Jeżeli istnieje chociaż jeden stan systemu, który nie jest osiągalny, wówczas system jest nieosiągalny
35 Dla systemów ciągłych sterowalność i osiągalność są równoważneOsiągalność systemu ciągłego liniowego stacjonarnego System liniowy stacjonarny jest osiągalny wtedy i tylko wtedy, gdy macierz osiągalności, nazywana macierzą osiągalności Kalmana ma rząd n, tzn. rząd systemu
36 System dyskretny sterowalny system dyskretny osiągalnySystemy dyskretne Można wskazać systemy dyskretne posiadające cechę sterowalności, ale nie posiadające cechy osiągalności Uzasadnione jest zatem w odniesieniu do systemów dyskretnych stwierdzać posiadanie cechy osiągalności W ogólności zatem System dyskretny sterowalny system dyskretny osiągalny Implikacja ta zachodzi dla przypadków, gdy AD jest osobliwa, w przeciwnym przypadku podobnie jak dla systemów ciągłych: System dyskretny sterowalny system dyskretny osiągalny
37 Osiągalność stanu Stan osiągalny Stan systemu liniowego jest osiągalny, jeżeli można system przeprowadzić do tego stanu ze stanu za pomocą odpowiedniego sterowania w skończonym czasie Jeżeli każdy stan jest osiągalny, mówimy, że system jest całkowicie osiągalny lub krócej osiągalny
38 Osiągalność systemu dyskretnego liniowego stacjonarnegoTwierdzenie: System liniowy stacjonarny jest osiągalny wtedy i tylko wtedy, gdy macierz osiągalności, nazywana macierzą osiągalności Kalmana ma rząd n, tzn. rząd systemu Wymiar macierzy osiągalności: nxnp; n – wymiar stanu, p – wymiar wejścia Dla p=1 macierz osiągalności jest macierzą kwadratową i dla sprawdzenia osiągalności wystarczy sprawdzić nieosobliwość macierzy osiągalności
39 Dla systemów dyskretnych sterowalność i osiągalność nie są równoważneSterowalność systemu dyskretnego liniowego stacjonarnego Twierdzenie: System liniowy stacjonarny jest sterowalny wtedy, gdy macierz sterowalności, nazywana macierzą sterowalności Kalmana ma rząd n, tzn. rząd systemu
40 Obserwowalność i odtwarzalnośćSystem ciągły System dyskretny Obserwowalność/odtwarzalność określa możliwość jednoznacznego określenia stanu systemu w oparciu pomiary przez skończony przedział czasu sygnałów wejścia i wyjścia Znaczenie: znajomość stanu początkowego i wejścia systemu pozwala zrekonstruować całą trajektorię stanu w oparciu o równania stanu
41 Systemy ciągłe Obserwowalność stanu Stan obserwowalny Stan systemu liniowego jest obserwowalny jeżeli można go określić znając wyjście dla chwil ze skończonego przedziału, Jeżeli każdy stan jest obserwowalny, mówimy, że system jest całkowicie obserwowalny lub krócej obserwowalny
42 Obserwowalność systemu ciągłego liniowego stacjonarnegoTwierdzenie: System liniowy stacjonarny jest obserwowalny wtedy i tylko wtedy, gdy macierz obserwowalności, nazywana macierzą obserwowalności Kalmana ma rząd n, tzn. rząd systemu
43 Wymiar macierzy obserwowalnośći: nqxn; n – wymiar stanu, q – wymiar wyjściaDla q=1 macierz obserwowalności jest macierzą kwadratową i dla sprawdzenia obserwowalności wystarczy sprawdzić nieosobliwość macierzy obserwowalności
44 Obserwowalność a przekształcenia podobieństwaObserwowalność zostaje zachowana podczas transformacji podobieństwa
45 Odtwarzalność stanu Stan odtwarzalny Stan systemu liniowego jest odtwarzalny jeżeli można go określić znając wyjście dla chwil ze skończonego przedziału, Jeżeli każdy stan jest odtwarzalny, mówimy, że system jest całkowicie odtwarzalny lub krócej odtwarzalny
46 Dla systemów ciągłych obserwowalność i odtwarzalność są równoważneOdtwarzalność systemu ciągłego liniowego stacjonarnego Twierdzenie: System liniowy stacjonarny jest odtwarzalny wtedy i tylko wtedy, gdy macierz odtwarzalnośći, nazywana macierzą odtwarzalności Kalmana ma rząd n, tzn. rząd systemu
47 Systemy dyskretne Obserwowalność stanu Stan obserwowalny Stan systemu liniowego jest obserwowalny jeżeli można go określić znając wyjście dla chwil ze skończonego przedziału, Jeżeli każdy stan jest obserwowalny, mówimy, że system jest całkowicie obserwowalny lub krócej obserwowalny
48 Obserwowalność systemu dyskretnego liniowego stacjonarnegoTwierdzenie: System liniowy stacjonarny jest obserwowalny wtedy i tylko wtedy, gdy macierz obserwowalności, nazywana macierzą obserwowalności Kalmana ma rząd n, tzn. rząd systemu
49 Dla systemów dyskretnych obserwowalność i odtwarzalność nie są równoważneOdtwarzalność systemu dyskretnego liniowego stacjonarnego Twierdzenie: System liniowy stacjonarny jest odtwarzalny wtedy, gdy macierz odtwarzalności, nazywana macierzą odtwarzalności Kalmana ma rząd n, tzn. rząd systemu
50 Dekompozycja Kalmana systemów niesterowalnych i nieobserwowalnychPrzykład 1 Mamy system Liniowy, stacjonarny, 1 – wejście, 1 - wyjście
51 Transmitancja Zera i bieguny transmitancji Transmitancja po redukcji
52 Schemat blokowy modelu w nowej przestrzeni stanuTransformacja do postaci diagonalnej Schemat blokowy modelu w nowej przestrzeni stanu
53 Cztery różne statusy zmiennych stanu:- v1 można na niego wpływać sterowaniem u i można go obserwować z wyjścia y - v2 nie można na niego wpływać sterowaniem u, ale można go obserwować z wyjścia y - v3 można na niego wpływać sterowaniem u, ale nie można go obserwować z wyjścia y - v4 nie można na niego wpływać sterowaniem u, ani nie można go obserwować z wyjścia y
54 Można wyróżnić cztery podsystemy:- związany ze zmienną stanu v1 sterowalny i obserwowalny - związany ze zmienną stanu v2 niesterowalny, ale obserwowalny - związany ze zmienną stanu v3 sterowalny, ale nieobserwowalny - związany ze zmienną stanu v4 niesterowalny i nieobserwowalny Stany niesterowalne i nieobserwowalne mogą być alb stabilne, albo niestabilne System, którego wszystkie stany niesterowalne są stabilne jest nazywany stabilizowalnym System, którego wszystkie stany nieobserwowalne są stabilne jest nazywany wykrywalnym
55 Dekompozycja na podprzestrzenie sterowalne/osiągalneDekompozycja na podprzestrzenie obserwowalne/odtwarzalne
56 Dziękuję za uczestnictwo w wykładzie i uwagę