1 Analizator morfologicznyMORFEUSZ Analizator morfologiczny Milena Ćmil Katarzyna Kopania
2 Czym jest Morfeusz? Program Morfeusz wykonuje analizę morfologiczną dla języka polskiego. Nie zawiera modułu zgadującego nieznane słowa (można więc powiedzieć, że jest słownikiem morfologicznym).
3 Autorzy Prof. Zygmunt Saloni: Uniwersytet Warszawski; Wydział Lingwistyki Stosowanej; Instytut Lingwistyki Stosowanej Prof. Włodzimierz Gruszczyński: Uniwersytet Warszawski; Wydział Dziennikarstwa i Nauk Politycznych; Instytut Dziennikarstwa Dr Marcin Woliński: Instytut Podstaw Informatyki Polskiej Akademii Nauk; Zakład Sztucznej Inteligencji; Zespół Inżynierii Lingwistycznej Dr Robert Wołosz
4 Warianty programu Morfeusz SIaT (najstarszy); Morfeusz SGJPMorfeusz Polimorf
5 Morfeusz SIaT Przygotowany poprzez skonfrontowanie danych „Schematycznego indeksu a tergo polskich form wyrazowych” (SIaT) Jana Tokarskiego i Zygmunta Saloniego z listą haseł słownika Doroszewskiego; wersja SIaT programu została w zasadzie zarzucona.
6 Morfeusz SGJP Korzysta z danych „Słownika gramatycznego języka polskiego” — SGJP; Morfeusz SGJP odpowiada w miarę dokładnie zawartości SGJP, przez co jest użyteczny dla twórców SGJP; ma postać biblioteki dynamicznej (skompilowanej dla systemu Linux 32/64bit, Windows i Mac OS X/Intel32).
7 SGJP SGJP podaje przede wszystkim formy fleksyjne opisywanych wyrazów (ok. 4,5 miliona). Uwzględnia jednak także wiele innych cech gramatycznych (zwłaszcza składniowych) leksemów, m. in. rodzaj rzeczownika, rekcję przyimków i liczebników, aspekt czasowników. Program umożliwia szybkie wyszukiwanie informacji o leksemie zarówno na podstawie jego formy słownikowej, jak i na podstawie dowolnej formy fleksyjnej. Pozwala na ograniczenie zakresu wyszukiwania do wybranej części mowy (klasy leksemów), a także szybką weryfikację hipotez dotyczących odmiany wyrazów nieuwzględnionych w słowniku.
8 SGJP - historia w latach 80-tych: analiza informacji gramatycznej w Słowniku języka polskiego Doroszewskiego, W. Gruszczyński, Fleksja rzeczowników pospolitych we współczesnej polszczyźnie pisanej, 1989 Wrocław, J. Tokarski, Schematyczny indeks a tergo polskich form wyrazowych, w opracowaniu Z. Saloniego, 1993 Warszawa, Robert Wołosz przygotował elektroniczna postać listy haseł SJPDor uzupełnionej o informacje gramatyczna, Z. Saloni Czasownik polski, 2001 Warszawa.
9
10 Morfeusz Polimorf Otwarty słownik morfologiczny;wykorzystuje słownik fleksyjny Polimorf stanowiący połączenie danych SGJP z danymi tworzonymi społecznościowo (Morfologik);
11 Zastosowanie Narzędzie pracy w badaniu języka polskiego;wykorzystywany w analizie morfologicznej korpusów, np. w NKJP; stosowany w procesie tagowania;
12 Zestaw znaczników morfosyntaktycznych
13 Przykłady analizy
14 Różnice między SIaT a Polimorf
15
16 Warunki licencjonowaniaAutorami i właścicielami praw autorskich programu Morfeusz SGJP są: w zakresie danych językowych: Zygmunt Saloni, Włodzimierz Gruszczyński, Marcin Woliński, Robert Wołosz, w zakresie kodu programu: Marcin Woliński. Redystrybucja i używanie, czy to w formie kodu źródłowego, czy w formie kodu wykonawczego, są dozwolone pod warunkiem spełnienia poniższych warunków: Redystrybucja kodu źródłowego musi zawierać powyższą notę copyrightową, niniejszą listę warunków oraz poniższe oświadczenie o wyłączeniu odpowiedzialności. Redystrybucja kodu wykonawczego musi zawierać powyższą notę copyrightową, niniejszą listę warunków oraz poniższe oświadczenie o wyłączeniu odpowiedzialności w dokumentacji i/lub w innych materiałach dostarczanych wraz z kopią oprogramowania.
17 Bibliografia [Morfeusz] Marcin Woliński, Analizator morfologiczny Morfeusz, strona internetowa Marcn Woliński, Morfeusz — a Practical Tool for the Morphological Analysis of Polish https://docs.google.com/viewer?a=v&q=cache:nGTQDPztndoJ:www.info.univ-tours.fr/~savary/Polonium/Papers/iipwm06-morfeusz.pdf+&hl=en&gl=pl&pid=bl&srcid=ADGEESgMTZw7lDAhSpYNExOoSwzZrqRAnTtzNMzLebFECtbjrgaDHUTQS_ZuUlXPyd9X4Ap697HT43FXEBbIGPLNiLW7zc7pPBa9TJCOF0I9B23oaRvLMbHMcfVErijOdGBsEcZYcJ0I&sig=AHIEtbR7yQla8kGsHXHT5qpJ2RtGTOsjyw, Łukasz Degórski, Wykorzystanie analizy morfologicznej do obsługi korpusów, Radomir Mastalerz, Tager maksimum entropii dla jezyka polskiego,