vol. 3 1/2014 Inżynier i Fizyk Medyczny
26
diagnostyka obrazowa
\
medical diagnosis
artykuł naukowy
\
scientific paper
Poniżej przedstawiono przegląd konkretnych już realizacji
metod rozumienia obrazów.
Rozumienie jako interpretacja
rozpoznanych wzorców
J. Kulikowski [11] definiuje pojęcie rozumienia zawartości (tre-
ści) obrazów jako zdolność: a) interpretacji obrazów w kate-
goriach założonego modelu świata zewnętrznego, odbitego
w obrazie (czyli przyjętego modelu wiedzy dziedzinowej), b) for-
mułowania odpowiedzi na zapytania dotyczące samego obrazu,
jak też zawartych w nim obiektów, ich właściwości, relacji defi-
niowanych pomiędzy obiektami oraz w odniesieniu do innych,
nieobserwowanych obiektów.
W myśl tej definicji rozumienie staje się synonimem racjonal-
nej interpretacji obrazów i silnie zależy od wiedzy podstawowej
w dziedzinie zastosowań, tj. od możliwie wyczerpującego, wia-
rygodnego i precyzyjnego opisu obrazowanej rzeczywistości.
Testem na rozumienie nie jest wniknięcie w sam proces rozpo-
znania i wyjaśniania treści, ocena roli świadomości itp., ale we-
ryfikacja poprzez zadawanie pytań i ocenę poprawności odpo-
wiedzi. Skuteczność interpretacji oznacza udzielenie poprawnej
odpowiedzi, dopasowanej do potrzeb użytkownika.
Istotną rolę odgrywa tutaj sposób formalizacji wiedzy dziedzi-
nowej, przede wszystkim według koncepcji ontologii jako specyfi-
kacji wspólnej warstwy pojęciowej z zakresu anatomii, diagnostyki
mammograficznej czy neurodiagnostyki itp. Konstruowane mode-
le wiedzy dziedzinowej bazują na wieloaspektowym rozumieniu
informacji obrazowej. Wyróżnia się zwykle pięć warstw organizacji
informacji obrazowej (na podstawie [11]): fizyczną (funkcja jasności,
spektrumbarw), syntaktyczną (statyczna, morfologiczna czy struk-
turalna), semantyczną (znaczenie wydzielonych struktur, obiek-
tów), pragmatyczną (odnoszącą się do specyfiki zastosowania, po-
ziomu abstrakcji stosowanego przez użytkownika) oraz systemową
(odnoszącą się do szerszej, zewnętrznej wiedzy warunkującej
używanie obrazów, np. do reguł prawnych, przyjętych formularzy
ocen, kategorii podejmowanych decyzji).
Koncepcja ta wymaga uzupełnienia o, wydaje się, istotny element
rozpoznania relacji, ekstrakcji niewidocznych obiektów czy też in-
nych właściwości obrazu mogących mieć znaczenie w interpretacji
scen, a następnie ustalenie pewnego rodzaju interfejsu pomiędzy
numerycznymobrazemobiektów, relacji i cech, a kategoriami pojęć,
obiektami, cechami i relacjami formalnego opisu wiedzy.
Przykładem wykorzystania modeli ontologicznych do wspoma-
gania diagnostyki są CADS [12], czyli systemy komputerowo wspo-
maganych decyzji (
Computer-Aided Decision Systems
), traktowanych
niekiedy jako dostosowanie systemów eksperckich do koncepcji
CAD. Są one traktowane jako nowa generacja systemów eksperto-
wych, którego szczególnym wyróżnikiem jest interaktywny inter-
fejs pomiędzy komputerem a użytkownikiem. CADS wykorzystują
obok diagnostycznej ontologii, także bazę obserwacji klinicznych
oraz model statystyczny do formułowania opinii diagnostycznych
techniką eksploracji danych (
data mining
), bazując np. na drzewach
informacji obrazowej, warunkując proces jej interpretacji. Geony
zdefiniowano jako wyróżniki rozpoznania, sprowadzając rozu-
mienie obrazów do rozpoznania geometrycznych komponentów
(geonów), opisujących strukturalne reprezentacje obiektów. Per-
cepcyjne rozpoznanie jest procesem segmentacji – wydzielenia
regionów wklęsłych (wygiętych) jako kompozycji bloków, cylin-
drów, klinów i stożków (czyli geonów). Geony są formowane na
bazie łatwo wykrywanych właściwości krawędzi obrazów, takich
jak: krzywizna, współliniowość, równoległość i zakończenia połą-
czeń; są niezmiennicze względem warunków obserwacji (punkt
widzenia, szumy wizyjne, oświetlenie), silnie rozróżnialne. Zostały
skonstruowane jako geometryczne niezmienniki postrzegania
i rozpoznawania percepcyjnego obiektów według zdolności HVS.
Koncepcja geonów dobrze sprawdza się w opisie poznawczym
naturalnych, prostych obiektów znanych z codziennego doświad-
czenia. W bardziej złożonych zastosowaniach, jak np. rozpoznanie
cech indywidualnych twarzy czy obiektów ze słabo określonymi
krawędziami, jej skuteczność jest ograniczona. W kontekście roz-
poznawania cech patologii trudno niewątpliwie odwołać się do
codziennych nawyków. Pozostaje jednak platońska nadzieja, że
myśl, wiedzy poprzedza postrzeganie, albo konieczny jest dosko-
nalszy model opisu medycznych zmian obrazowych.
Inne, bardziej subtelne i różnorodne sposoby opisu obrazów
wykorzystują atomy przestrzeni czas-częstotliwość łączące
geometryczne właściwości modelowanych obiektów z elastycz-
nością modelowania funkcjonalnego za pomocą podprzestrzeni
– niezwyklewygodnej wmodelu świata – przestrzeni Hilberta. Ze-
stawy atomów tworzą bazy, ramy czy szerzej słowniki generujące
takie przestrzenie modelowania obiektów, cech czy komponen-
tów obrazowych. Efektem jest przekształcona, rzadka reprezen-
tacja obrazów, łatwiejsza w opisie, ekstrakcji cech, rozpoznaniu,
selekcji czy formowaniu modeli treści istotnej, dającej efektywne
rozumienie obrazów, czyli trafniejszą ich interpretację. Kompre-
sowalność obrazów, czyli możliwość odwracalnego przekształce-
nia obrazów do postaci rzadkiej (
sparse
) stała się podstawą wielu
istotnych zastosowań obrazowych. Tak zwany
Sparse-Land
stał się
wiodącą koncepcją w odszumianiu, rekonstrukcji, odzyskiwaniu,
ekstrakcji cech selekcji źródeł informacji czy kompresji obrazów.
Okazał się też użyteczny w komputerowym rozumieniu obrazów.
Rys. 2
Przykład geometrycznych figur – geonów, łatwo rozpoznawalnych nawet
w warunkach ograniczonej percepcji obrazów [10] (po lewej); po prawej – składanie
samolotu z kolejnych atomów rodzi pytanie: w którym kroku jesteśmy w stanie roz-
poznać kształt samolotu?