next up previous
Next: Tworzenie tablicy Up: Opis danych Previous: Opis danych

Zagadnienia związane z przygotowaniem atrybutów

Podstawą do stworzenia zbioru atrybutów wykorzystywanych w dalszej analizie i uczeniu są cechy wydobywane ze zdjęć tarczy Słońca za pomocą technik analizy obrazu. Cechy te są jednak wyrażone w sposób dość prymitywny, opisujący jedynie podstawowe kształty i własności pikseli w pojedynczych plamach. Nie są tu uwzględniane sąsiedztwa między plamami w grupie i wzajemne położenie plam.

Dla uzupełnienia tej informacji możemy liczyć ile plam leży w obszarze o określonym promieniu i centrum w aktualnie rozważanej plamie, lub identyfikować najbliższych sąsiadów dla rozpatrywanej plamy. I tak na przykład plama znajdująca się wewnątrz grupy typu F powinna mieć wielu sąsiadów, podczas gdy plama z grupy typu H raczej nie będzie miała bezpośrednich towarzyszy.

Ponadto w każdej z grup typu B,C,D,E,F wyróżnić można dwie najważniejsze plamy (bieguny). Przechodząc od grupy B do F te dominujące plamy stają się coraz większe. Stąd przypuszczenie, że jeśli dla danej plamy zbadamy liczbę i rozmiar sąsiadów w pewnym promieniu, to będziemy mogli dobrze określić do jakiego typu grupy (A-H) ta plama przynależy.

Dla wyznaczenia atrybutów związanych z sąsiedztwem niezbędne jest policzenie odległości pomiędzy plamami występującymi w tym samym obrazie. Wartości promienia ustawiane są pod kontem zgodności z wykorzystywanym przez nas schematem z Zurichu. Wyróżniamy 9 wartości promienia między 60000 a 180000 km, po przeskalowaniu i zamianie na odległość w pikselach na obrazku.

Wyekstrahowanie zostały następujące atrybuty warunkowe:

  1. PictureID Nazwa pliku ze zdjęciem. Zawiera informacje o dacie.
  2. Cluster Identyfikator grupy do której zaliczona jest plama w odpowiednim ARMap.
  3. MZ Klasyfikacja grupy według skali z Zurichu, nasza decyzja.
  4. McI Klasyfikacja grupy według skali McIntosh'a.
  5. X - współrzędna x środka plamy
  6. Y - współrzędna y środka plamy
  7. Area - rozmiar plamy w pikselach (kwadratowych)
  8. Perimeter - długość zewnętrznego obwodu wybranego regionu
  9. Angle - kąt tworzony z główną osią
  10. Aspect Ratio - stosunek długości do szerokości
  11. Compactness - $\sqrt{ \frac{4\pi \times
}{rozp.}}$, gdzie rozp.=rozpiętość oznacza rozmiar plamy liczony wzdłuż dłuższej osi.
  12. Roundness - $\frac{4\times
\mathbf{Area}}{\pi \times {rozp.}^2}$
  13. Form Factor - $\frac{4\pi \times
\mathbf{Area}}{{\mathbf{Perimeter}}^2}$
  14. Feret's Diameter Największa odległość między dwoma punktami na brzegu obszaru plamy.
  15. Circularity - $4\pi \times \frac{
\mathbf{Area}}{{\mathbf{Perimeter}}^2}$
  16. Radii - R1,...,R9 - liczba plam znajdujących się w kole o promieniach odpowiednio R1,...,R9 i środku wyznaczonym przez X,Y

Dodatkowo pewne wątpliwości może wyjaśnić list od autora danych:
http://www.mimuw.edu.pl/~szczuka/DM/list.txt


next up previous
Next: Tworzenie tablicy Up: Opis danych Previous: Opis danych
Marcin Szczuka 2007-04-19