Tweetomat

Opis projektu zaliczeniowego z Baz danych 2013/2014.

Cel projektu

Celem projektu jest stworzenie prostej aplikacji bazodanowej wspomagającej wykreowanie osobowości twitterowej. Na potrzeby projektu sukces osobowości mierzymy na podstawie liczby osob śledzących jej tweety, łącznej liczby zebranych retweetów oraz ich dsytrybucji względem tweetów (n punktów, jeśli wyprodukowała n tweetów, z których każdy zebrał n retweetów). Aplikacja musi realizować jasno opisaną strategię. Strategia może być inspirowana jednym z pomysłów opisanych poniżej, ale mile widziane są własne idee.


Etapy realizacji projektu i kryteria zaliczenia

Etap Efekt Termin
Planowanie strategii Dokument opisujący strategię (plik .pdf, max 1 strona) 13.12.2013
Modelowanie danych Diagram ER wraz z krótkim odniesieniem do opisu strategii (plik .pdf, max 1 strona) 20.12.2013
Projekt bazy danych Definicja bazy w DDL (plik .sql) 10.01.2014
Projekt aplikacji Dokument opisujący sposób w jaki aplikacja realizuje strategię (plik .pdf, max 1 strona) 17.01.2014
Implementacja aplikacji Działająca aplikacja. 2.02.2014

Pierwszym etapem pracy jest zaplanowanie strategii dzialania aplikacji w porozumieniu z prowadzącym zajęcia. Ten etap pracy nie jest oceniany, liczy się jedynie to, żeby w przewidzianym terminie powstał dokument zatwierdzony przez prowadzącego zajęcia. Należy o tym myśleć tak, że w pierwszym etapie negocjowany jest kontrakt, który potem będzie musiał zostać zrealizowany. Negocjacji podlega wszystko, co nie jest sprecyzowane w niniejszym opisie. Zaliczenie kolejnych etapów zależy od tego, czy realizują kontrakt i czy są zakończone zgodnie z harmonogramem: Zaliczenie nie zależy od tego, czy aplikacja odniesie sukces, tzn. czy faktycznie skutecznie wykreuje osobowość twitterową.

Przykładowe pomocnicze strategie, które mogą pomóc w kreowaniu osobowości

Kopiuj najlepszych
Zbieranie statystyk o sukcesach innych i retweetowanie tweetów pochodzących od skutecznych osobowości. Program musi zarówno archiwizować tweety jak i zawierać mechanizm podpowiadania skutecznych tweetów.
Tweet lokalny
Zbieranie informacji o miejscach, w których planujemy być i tweetowanie ich gdy faktycznie się w nich znajdziemy (przy użyciu urządzeń mobilnych). Program musi archiwizować tweety z lokalizacji w Polsce i zawierać mechanizm filtrowania nieodpowiednich tweetów według preferencji użytkownika. Program musi się uruchamiać na urządzeniu mobilnym. Uwaga. Dysponujemy ograniczoną liczbą telefonów z systemem operacyjnym Android. Będziemy je udostępniać według kolejności zgłoszeń. Telefony będzie można użytkować w laboratorium. Dopuszczalna jest realizacja projektu na własnym urządzeniu mobilnym.
Klasteryzacja ciekawych tagów
Grupowanie tagów, które mają wspolne cechy, na przykład dobrze wpływają na lajki i retweety. W projekcie muszą zostać zdefiniowane klarowne kryteria klasteryzacji. Program musi zbudować bazę tweetów stanowiących podstawę do klasteryzacji. W projekcie można zdecydować się na podejście szerokie, na przykład grupowanie wszystkich tagów związanych z polityką lub edukacją, albo też grupowanie według kryterium podanego przez użytkownika.
Weryfikacja newsów
Segregacja i automatyczna weryfikacja wiadomości na Twitterze: wiadomość przechodzi od fazy "plotka" do faz "cześciowo potwierdzona" i "potwierdzona". W projekcie muszą zostać podane kryteria, na podstawie których kwalifikuje się dany tweet jako wiadomość (news), a następnie podać metodę przesuwania wiadomości między trzema wyżej wspomnianymi kategoriami. W ramach projektu musi zostać skonstruowana baza tweetów, która będzie służyć do oceny skuteczności programu.
Weryfikacja tożsamości
Znaczna liczba kont zarejestrowanych na Twitterze to tweetomaty; w tym projekcie chodziłoby o identyfikowanie na podstawie postów, czy mamy do czynienia z tweetomatem, czy z żywą osobą. W ramach projektu muszą zostać sformułowane i zaprogramowane kryteria klasyfikowania ludzi i tweetomatów, a także musi zostać stworzona baza osobowości twitterowych, która będzie użyta do zweryfikowania skuteczności algorytmu klasyfikującego.

Konkurs

Konkurs będzie obejmował trzy kategorie: Nagrodą za zajęcie pierwszego miejsca w każdej z tych kategorii będzie 5 punktów doliczone do wyników egzaminu (efektywnie: co najmniej pół oceny w górę, aż do "Celujący", czyli 5!).
Henryk Michalewski i Filip Murlak 29-11-2013