/img alt="Imagem da capa" class="recordcover" src="""/>
Tese
Exploring Transfer Learning via Convolutional Neural Networks for Image Classification and Super-Resolution
Diese Arbeit pr¨asentiert meine Forschung hinsichtlich der Verwendung von ”Transfer-Learning” (TL) in Kombination mit Convolutional Neural Networks (CNNs), um dadurch die Klassifikation von Dickdarmpolypen und die Qualit¨at von Iris Bildern (”Iris-Super-Resolution”) zu verbessern. Herk¨ommlicher...
Autor principal: | Ribeiro, Eduardo Ferreira |
---|---|
Grau: | Tese |
Idioma: | en_US |
Publicado em: |
Universidade de Salzburg
2018
|
Assuntos: | |
Acesso em linha: |
http://hdl.handle.net/11612/1009 |
Resumo: |
---|
Diese Arbeit pr¨asentiert meine Forschung hinsichtlich der Verwendung von ”Transfer-Learning”
(TL) in Kombination mit Convolutional Neural Networks (CNNs), um dadurch die Klassifikation
von Dickdarmpolypen und die Qualit¨at von Iris Bildern (”Iris-Super-Resolution”) zu
verbessern.
Herk¨ommlicherweise verwenden Verfahren des maschinellen Lernens den gleichen Merkmalsraum
und die gleiche Verteilung zum Trainieren und Testen der abgewendeten Methoden.
Mehrere Probleme k¨onnen bei diesem Ansatz jedoch auftreten. Zum Beispiel ist es
m¨ oglich, dass die Anzahl der zu trainierenden Daten (insbesondere in einem ”supervised training”
Szenario) begrenzt ist. Im Speziellen im medizinischen Anwendungsfall ist man regelm¨aßig
mit dem angesprochenen Problem konfrontiert, da die Zusammenstellung einer Datenbank,
welche ¨ uber eine geeignete Anzahl an verwendbaren Daten verf ¨ ugt, entweder sehr kostspielig
ist und/oder sich als ¨ uber die Maßen zeitaufw¨andig herausstellt. Ein anderes Problem betrifft
die Verteilung von Strukturmerkmalen in einer Bilddatenbank, die zu groß sein kann, wie es
im Fall der Verwendung von Texturmustern der menschlichen Iris auftritt. Dies kann zu dem
Umstand f ¨ uhren, dass eine einzelne und sehr spezifische Trainingsdatenbank m¨oglicherweise
nicht ausreichend verallgemeinert wird, um sie auf die gesamte betrachtete Dom¨ane anzuwenden.
In dieser Arbeit wird die Verwendung von TL auf diverse Texturen untersucht, um die
zuvor angesprochenen Probleme f ¨ ur zwei Anwendungen zu ¨ uberwinden: in der Klassifikation
von Dickdarmpolypen und in Iris Super-Resolution.
Die Hauptursache f ¨ ur Todesf¨alle im Zusammenhang mit dem Darmtrakt ist die Entwicklung
von Krebszellen (Polypen) in vielen unterschiedlichen Auspr¨agungen. Eine Fr ¨uherkennung
kann das Mortalit¨atsrisiko bei Patienten verringern, wenn sich der Krebs noch in einem fr ¨uhen
Stadium befindet. Genauer gesagt, Dickdarmpolypen (gutartige Tumore oder Wucherungen,
die an der inneren Dickdarmoberfl¨ache entstehen) haben ein hohes Vorkommen und sind bekanntermaßen
Vorl¨aufer von Darmkrebsentwicklung. Mehrere Studien haben gezeigt, dass die automatische
Erkennung und Klassifizierung von Bildregionen, die Polypen innerhalb des Dickdarms
m¨oglicherweise enthalten, verwendet werden k¨onnen, um Spezialisten zu helfen, die
Fehlerrate bei Polypen zu verringern.
Die Klassifizierung kann sich jedoch aufgrund mehrerer Faktoren als eine schwierige Aufgabe
herausstellen. ZumBeispiel kann das Fehlen oder ein U¨ bermaß an Beleuchtung zu starken
Problemen hinsichtlich der Kontrastinformation der Bilder f ¨ uhren, wohingegen Unsch¨arfe aufgrund
von Bewegung/Wassereinspritzung die Qualit¨at des Bildmaterials ebenfalls verschlechtert.
Daten, welche ein unterschiedlich starkes Auftreten von Polypen repr¨asentieren, bieten auch
dieM¨oglichkeit zu einer Reduktion der Klassifizierungsgenauigkeit. Weiters ist es sehr schwierig,
einen robusten und vor allem globalen Feature-Extraktor zu finden, der all die notwendigen
Pit-Pattern-Strukturen in einem einzigen Vektor zusammenfasst und darstellt. Um mit diesen
Problemen ad¨aquat umzugehen, kann die Anwendung von CNNs eine gute Alternative bieten.
Eines der Ziele dieser Arbeit ist es, die Wirksamkeit von CNNs, die von Grund auf f ¨ ur
die Klassifikation von Dickdarmpolypen konstruiert wurden, zu zeigen. Des Weiteren soll
die Anwendung von TL unter der Verwendung vorgefertigter CNNs f ¨ ur die Klassifikation
von Dickdarmpolypen untersucht werden. Hierbei wird zus¨atzliche Information von nichtmedizinischen
Bildern hinzugezogen und mit den verwendeten medizinischen Daten verbunden:
Information wird also transferiert - TL entsteht. Auch in diesem Fall projiziert das CNN
iii
die Zieldatenbank (die Polypenbilder) in einen vorher trainierten Vektorraum, in dem die zu
separierenden Klassen dann eher trennbar sind, daWissen aus den nicht-medizinischen Bildern
einfließt.
Der zweite Teil dieser Arbeit widmet sich dem TL hinsichtlich der Verbesserung der Bildqualit¨at
von Iris Bilder - ”Iris- Super-Resolution”. Das Hauptziel von Super-Resolution (SR) ist es, aus
einem oder mehreren Bildern gleichzeitig ein Bild mit einer h¨oheren Aufl¨osung (mit mehr
Pixeln) zu erzeugen, welches dadurch zu einem detaillierteren und somit realistischeren Bild
wird, wobei der visuelle Bildinhalt unver¨andert bleibt. Gegenw¨artig fordern die meisten Iris-
Erkennungssysteme, dass der Benutzer seine Iris f ¨ ur den Sensor in geringer Entfernung pr¨asentiert.
Jedoch ist es ein Anliegen der Industrie die bisher notwendigen Bedingungen - kurzer
Abstand zwischen Sensor und Iris, sowie Verwendung von sehr teuren hochqualitativen Sensoren
- zu ver¨andern. Diese Ver¨anderung betrifft einerseits die Verwendung von billigeren
Sensoren und andererseits die Vergr¨oßerung des Abstandes zwischen Iris und Sensor. Beide
Anpassungen f ¨ uhren zu Reduktion der Bildqualit¨at, was sich direkt auf die Erkennungsgenauigkeit
der aktuell verwendeten Iris- erkennungssysteme auswirkt. In dieser Arbeit zeigen
wir, dass die Verwendung von CNNs und TL f ¨ ur die ”Single Image Super-Resolution”, die bei
der Iriserkennung angewendet wird, eine Alternative f ¨ ur die Iriserkennung von Bildern mit
niedriger Aufl¨osung sein kann. Zu diesem Zweck untersuchen wir, ob die Art der Bilder sowie
das Muster der Iris das CNN-TL beeinflusst und folglich die Ergebnisse im Erkennungsprozess
ver¨andern kann. |