Next: Tworzenie tablicy
Up: Opis danych
Previous: Opis danych
Podstawą do stworzenia zbioru atrybutów wykorzystywanych w dalszej analizie i
uczeniu są cechy wydobywane ze zdjęć tarczy Słońca za pomocą technik analizy
obrazu. Cechy te są jednak wyrażone w sposób dość prymitywny, opisujący jedynie
podstawowe kształty i własności pikseli w pojedynczych plamach. Nie są tu
uwzględniane sąsiedztwa między plamami w grupie i wzajemne położenie plam.
Dla uzupełnienia tej informacji możemy liczyć ile plam leży w obszarze o
określonym promieniu i centrum w aktualnie rozważanej plamie, lub identyfikować
najbliższych sąsiadów dla rozpatrywanej plamy. I tak na przykład plama
znajdująca się wewnątrz grupy typu F powinna mieć wielu sąsiadów, podczas gdy
plama z grupy typu H raczej nie będzie miała bezpośrednich towarzyszy.
Ponadto w każdej z grup typu B,C,D,E,F wyróżnić można dwie najważniejsze plamy
(bieguny). Przechodząc od grupy B do F te dominujące plamy stają się coraz
większe. Stąd przypuszczenie, że jeśli dla danej plamy zbadamy liczbę i
rozmiar sąsiadów w pewnym promieniu, to będziemy mogli dobrze określić do
jakiego typu grupy (A-H) ta plama przynależy.
Dla wyznaczenia atrybutów związanych z sąsiedztwem niezbędne jest policzenie
odległości pomiędzy plamami występującymi w tym samym obrazie. Wartości
promienia ustawiane są pod kontem zgodności z wykorzystywanym przez nas
schematem z Zurichu. Wyróżniamy 9 wartości promienia między 60000 a 180000 km,
po przeskalowaniu i zamianie na odległość w pikselach na obrazku.
Wyekstrahowanie zostały następujące atrybuty warunkowe:
- PictureID Nazwa pliku ze zdjęciem. Zawiera informacje o
dacie.
- Cluster Identyfikator grupy do której zaliczona jest plama w
odpowiednim ARMap.
- MZ Klasyfikacja grupy według skali z Zurichu, nasza
decyzja.
- McI Klasyfikacja grupy według skali McIntosh'a.
- X - współrzędna x środka plamy
- Y - współrzędna y środka plamy
- Area - rozmiar plamy w pikselach (kwadratowych)
- Perimeter - długość zewnętrznego obwodu
wybranego regionu
- Angle - kąt tworzony z główną osią
- Aspect Ratio - stosunek długości do szerokości
- Compactness -
, gdzie rozp.=rozpiętość oznacza
rozmiar plamy liczony wzdłuż dłuższej osi.
- Roundness -
- Form Factor -
- Feret's Diameter Największa odległość między
dwoma punktami na brzegu obszaru plamy.
- Circularity -
- Radii - R1,...,R9 - liczba plam znajdujących się
w kole o promieniach odpowiednio R1,...,R9 i środku
wyznaczonym przez X,Y
Dodatkowo pewne wątpliwości może wyjaśnić list od autora danych:
http://www.mimuw.edu.pl/~szczuka/DM/list.txt
Next: Tworzenie tablicy
Up: Opis danych
Previous: Opis danych
Marcin Szczuka
2007-04-19