Architektura komputerów

1 Architektura komputerówWykład nr 11: Komputery o zreduk...
Author: Bolesław Gros
0 downloads 1 Views

1 Architektura komputerówWykład nr 11: Komputery o zredukowanej liście rozkazów Piotr Bilski

2 Charakterystyka architektury o zredukowanej liście rozkazówProcesor zawiera dużą liczbę rejestrów roboczych Kompilatory RISC stosują procedury optymalizacji wykorzystania rejestrów Liczba rozkazów jest niewielka w stosunku do CISC Rozkazy maja prostą postać Optymalizacja potoku rozkazów

3 Porównanie wybranych procesorówParametr IBM 370 VAX 11 80486 SPARC MIPS R4000 PowerPC Ultra Sparc Rok prod. 1973 1978 1989 1987 1991 1993 1996 Liczba rozkazów 208 303 235 69 94 225 206 (V9) Rozmiar rozkazu 2-6 B 2-57 B 1-11 B 4 B Tryby adr. 4 22 11 1 2 Liczba rejestrów 16 8 40-520 32 Rozmiar cache 64 kB 8 kB 32 kB 128 kB 16/32 kB

4 RISC a języki programowaniaJęzyki wysokiego poziomu – ułatwienie dla programisty, wiele szczegółów ukrytych Konieczność tłumaczenia języka wysokiego poziomu na język maszynowy Małe programy wysokiego poziomu  duże programy maszynowe Zwiększenie efektywności wymaga konstrukcji złożonych kompilatorów

5 Właściwości wykonywania rozkazówRodzaje rozkazów – rodzaje operacji wykonywanych przez procesor Rodzaje i liczba argumentów w rozkazach Szeregowanie rozkazów – przetwarzanie potokowe

6 Analiza częstotliwości wykonywania rozkazów w programieJęzyk Pascal Fortran C SAL Zadanie Naukowe Studenckie systemowe Przypisanie 73 67 45 38 42 Pętle 4 3 5 Wywołanie 1 15 12 If 20 11 29 43 36 Goto 2 9 inne 7 6

7 Analiza częstotliwości wykonywania rozkazów w programie (c.d.)Występowanie dynamiczne Ważona wg rozkazów maszynowych Ważona wg odniesień do pamięci Język Pascal C ASSIGN 45% 38% 13% 14% 15% LOOP 5% 3% 42% 32% 33% 26% CALL 12% 31% 44% IF 29% 43% 11% 21% 7% GOTO inne 6% 1% 2%

8 Rodzaje danych przetwarzane przez rozkazyPascal C Średnia Stałe całkowite 16 % 23 % 20 % Zmienne skalarne 58 % 53 % 55 % Tablice/ struktury 26 % 24 % 25 %

9 Wykorzystanie argumentów w wywołaniach procedurUdział programów zawierających: Kompilator, interpreter Małe programy nienumeryczne 3-4 argumenty 0-7 % 0-5 % 5-7 argumentów 0-3 % 0 % 8-11 argumentów 1-20 % 0-6 % 12 i więcej argumentów 1-6 %

10 Tablice rejestrów konieczność optymalizacji licznych operacji przypisania – rejestry zmienne lokalne powinny być przechowywane w jednym bloku rejestrów problem przekazywania argumentów do funkcji i zwracania wartości zagnieżdżone wywoływanie funkcji a liczba rejestrów

11 Okna rejestrów ponieważ funkcje wykorzystują zwykle małą liczbę zmiennych lokalnych, każda funkcja potrzebuje małej liczby rejestrów każdej funkcji przypisany jest odrębny zestaw rejestrów (tzw. okno) sąsiednie okna nakładają się, co umożliwia przekazywanie argumentów między funkcjami

12 Okna rejestrów - organizacjarejestry parametrów rejestry lokalne rejestry tymczasowe poziom I wywołanie/powrót rejestry parametrów rejestry lokalne rejestry tymczasowe poziom I+1

13 Okna rejestrów - przykładwskaźnik obecnego okna (CWP) wskaźnik zapisanego okna (SWP)

14 Zmienne globalne obsługiwane przez zestaw rejestrów globalnychproblem adresowania rejestrów globalnych i okna – jednolity sposób adresowania decyzja o przypisaniu zmiennych do rejestru zależy od kompilatora

15 Tablica rejestrów a pamięć podręcznaDuża tablica rejestrów Pamięć podręczna wszystkie skalary lokalne ostatnio używane skalary lokalne pojedyncze zmienne bloki pamięci zmienne globalne wskazane przez kompilator ostatnio używane zmienne globalne zmienne przechowywane w zależności od zagnieżdżenia funkcji zmienne przechowywane w zależności od algorytmu wymiany adresowanie rejestrów adresowanie pamięci

16 Tablica rejestrów a pamięć podręczna (c.d.)Rozkaz Dane R Numer wiersza Dekoder b) Rozkaz A Dane Znaczniki Dane porównanie

17 Optymalizacja rejestrów za pomocą kompilatoragdy liczba rejestrów jest za mała, potrzebna jest decyzja, które zmienne do nich wpisać tworzona jest nieograniczona liczba rejestrów symbolicznych, które odwzorowywane są na rejestry rzeczywiste przypisanie to jest problemem kolorowania grafu

18 Przykład kolorowania grafu2 3 1 4 interferencja rejestrów 5 6 wierzchołki to rejestry symboliczne kolory to rejestry rzeczywiste

19 Problemy projektowania kompilatoraczy krótszy program przekłada się na krótszy program maszynowy? czy programy zawierające bardziej złożone procedury są szybsze? proc. 1 proc. 2 proc. 3 RISC I 1,0 VAX 11 0,8 0,67 M68000 0,9

20 Własności rozkazów RISCjeden rozkaz wykonywany w ciągu cyklu operacje przenoszenia danych typu „z rejestru do rejestru” wyłącznie proste tryby adresowania proste formaty rozkazów

21 Rozkaz maszynowy RISC jeden rozkaz w czasie jednego cyklu maszynowegocykl maszynowy to czas wymagany do pobrania dwóch argumentów z rejestru, wykonania operacji przez ALU i zapisania wyniku w rejestrze brak mikrokodu, wykonanie rozkazu sprzętowe!

22 Przesyłanie danych rejestr-rejestrwszystkie dane powinny być w rejestrach wyjątek to nieliczne odwołania do pamięci (LOAD, STORE) lista rozkazów krótsza, jednostka sterująca prostsza Dodaj B C A Odejmij D Dodaj rA rB rC Odejmij rD Rozmiar rozkazów = 168 B Rozmiar rozkazów = 60 B

23 Proste formaty rozkazudługość wszystkich rozkazów jest stała! proste rozkazy łatwiej optymalizować na etapie kompilacji ALU dla prostszych rozkazów jest prostsze i szybsze przetwarzanie potokowe jest bardziej efektywne łatwiejsza obsługa przerwań najczęściej wykonywane rozkazy mogą być implementowane sprzętowo

24 CISC a RISC - porównanieProcesor Rodzaj Rozmiar rozkazu Adresowanie pośrednie Liczba argumentów R2000 RISC 4 B nie 1 SPARC IBM RS/6000 Intel i860 80486 CISC 12 B 2 M68040 22 B tak VAX 56 B 6

25 Przetwarzanie potokoweprzetwarzanie rejestr-rejestr pobranie rozkazu (F) wykonanie rozkazu (E) ładowanie z pamięci i zapis do niej operacja na pamięci (M)

26 Wykonywanie sekwencyjne a potokF E M F E M F E M F E M F E M F E M F E M

27 Przetwarzanie potokowe2-etapowe – jeden dostęp do pamięci 3-etapowe – dwa dostępy do pamięci 4-etapowe F E M F E M F E M F E M F E F E M F E1 E2 M F E1 E2 M

28 Przetwarzanie potokowe ze skokiemProgram: LOAD X,A ADD ,A JUMP 105 ADD A,B SUB C,B STORE A,Z F E M F E F E F F E M

29 Wstawienie rozkazu pustegoProgram: LOAD X,A ADD ,A JUMP 106 NOOP 106 STORE A,Z F E M F E F E F E F E M

30 Odwrócona kolejność rozkazówProgram: LOAD X,A JUMP 105 ADD ,A 105 STORE A,Z F E M F E F E F E M

31 Przykład RISC – MIPS R4000 procesor o architekturze 64-bitowej (taka długość rejestrów i magistrali ALU) w układzie R4000 znajduje się procesor oraz jednostka zarządzania pamięcią – MMU 32 rejestry robocze, do 128 kB pamięci podręcznej (po połowie na rozkazy i dane) stały format rozkazów – 4 bajty brak kodów warunkowych trzy formaty rozkazów

32 Formaty rozkazów MIPS R4000 akcja na argumencie natychmiastowym akcja skoku adresowanie rejestrowe Operacja rs rt Natychmiastowy Operacja Cel Operacja rs rt rd przes. funkcja

33 Przykład RISC – Sun SPARCprocesor wykorzystuje okna rejestrów (od 2 do 32 okien po 24 rejestry) osiem rejestrów globalnych (0-7) rejestry wyjściowe (wywoływane wraz z procedurą wywoływaną, 8-15) rejestry wejściowe (używane z procedurą wywołującą, 24-31) rejestry lokalne, o numerach 16-23 wszystkie rozkazy 32-bitowe

34 Formaty rozkazów SPARC Op względne przesunięcie licznika rozkazów wywołanie skok SETHI format zmiennopoz. format ogólny Op a War op2 wgl. przes. licznika rozkazów Op Cel op Stała natychmiastowa Op Cel Op Src FP-op Src-2 Op Cel Op Src pomiń Src-2 Op Cel Op Src Stała natychm