1 P LAGIATY Mid-Point presentation
2 O RGANIZACJA PRACY SCRUM w wersji studenckiej Weekly Scrum + Assembla Sprinty Podział pracy na małe zadania Wspólne szacowanie czasu wykonania Samodzielny wybór zadań przez członków zespoł
3 O RGANIZACJA PRACY – PRAKTYKI INNE Osoby, a odpowiedzialności Extreme programming i algorytmiczne burze mózgów Ciągły kontakt i bieżące rozwiązywanie problemów Test Driven Development
4 U LUBIONE NARZĘDZIA SVN Messages, Files, Dashboard Mail / Telefon / GG
5 N ARZĘDZIA - NIEWYPAŁ Stand – Up Google Wave
6 N APOTKANE PROBLEM - RYZYKA Brak czasu Problemy współpracy Problemy z szacowaniem
7 O BSERWACJE - WNIOSKI Krótkie zadania vs. duże odpowiedzialności Spotkania face-to-face vs. Assembla Ograniczenie formalności do minimum Problem ze sztywnymi ramami czasowymi
8 P LAGIATY – DOTYCHCZASOWE OSIĄGNIĘCIA Zapewnienie natywności aplikacji – instalatory Wstępna wersja GUI Algorytm porównywania dwóch plików Słowa kluczowe Opracowanie bazy prac
9 P LAGIATY – A PLIKACJA NATYWNA, INSTALACJA JAVY Instalacja krok po kroku
10 P LAGIATY – INSTALACJA ZAKOŃCZONA SUKCESEM
11 P LAGIATY – PORÓWNYWANIE DWÓCH PLIKÓW Podział tekstu na porównywalne fragmenty Zapewnienie podobnej struktury i długości tekstu Minimalizacja wpływu podziału na ocenę podobieństwa Ustalenie podobieństwa fragmentów Odległość levenshteina Odległość levenshteina w programach Sprowadzenie nazw zmiennych do jednej formy Usunięcie komentarzy
12 P ORÓWNYWANIE DWÓCH PLIKÓW - PRZYKŁAD Tekst oryginalny Fryderyk Nietzsche urodził się w 1844 roku, żył do 1900 roku, wychowywał się w saksońskim mieście Rocken, jego ojciec był pastorem, tak więc Nietzsche został wychowany w atmosferze religijnej opartej zapewne na autorytecie ojca. Plagiat Fryderyk Nietzsche (1844 - 1900), filozof, filolog klasyczny, pisarz i poeta. Wychowywal się w saksońskim miescie Rocken. Jego ojciec był pastorem, toteż Nietzsche zostal wychowawny w atmosferze religijnej, opartej zapewne na autorytecie ojca. Wynik 74%
13 S ŁOWA KLUCZOWE Wstępna obróbka dokumentu: Stop-lista – usunięcie zbędnych wyrazów Stemming – sprowadzenie do formy podstawowej Thesaurius – nadrzędność treści nad formą Dwa algorytmy wyboru słów kluczowych Wersja podstawowa: słowa kluczowe wg. ilości wystąpień wyrazów w dokumencie Wersja zaawansowana: słowa kluczowe wg. ilości wystąpień wyrazów w dokumencie oraz ich rankingu
14 R ANKING WYRAZÓW Mniej popularne słowa – łatwiej rozpoznawalne Ranking słów na podstawie dokumentów w Internecie: Pająk zbierający dokumenty Wstępna obróbka dokumentu Zliczanie wystąpień wyrazów Tworzenie bazy – rankingu słów Efekt – ignorowanie słów często powtarzalnych oraz popularnych, większa waga słów charakterystycznych Słowa kluczowe: słowa ważne wg. rankingu i możliwie często występujące w dokumencie
15 W YSZUKIWANIE ŹRÓDEŁ POTENCJALNEGO PLAGIATU Mniej popularne słowa – łatwiej rozpoznawalne Ranking słów na podstawie dokumentów w Internecie: Pająk zbierający dokumenty Wstępna obróbka dokumentu Zliczanie wystąpień wyrazów Tworzenie bazy – rankingu słów Efekt – ignorowanie słów często powtarzalnych oraz popularnych, większa waga słów charakterystycznych Słowa kluczowe: słowa ważne wg. rankingu i możliwie często występujące w dokumencie
16 P LAGIATY – B AZA PRAC Struktura bazy
17 P LAGIATY – BAZA PRAC Opis bazy Plik database.xml: Nazwa pliku Data dodania Ścieżka Słowa kluczowe Rozszerzenie Długość
18 P LAGIATY – BAZA PRAC Interfejs Klasa DatabaseSearcher: Tworzenie obiektów na podstawie database.xml Interfejs do komunikacji z bazą: Dodawanie dokumentów Przeszukiwanie bazy Wyciąganie zawartości dokumentów