Η Αυτόματη Ανάκτηση Εικόνων (ΑΑΕ) (αγγλ.: Content-based image retrieval (CBIR)) είναι η εφαρμογή τεχνικών υπολογιστικής όρασης με σκοπό την επίλυση του προβλήματος της ανάκτησης εικόνων, δηλαδή την αναζήτηση ψηφιακών εικόνων σε μεγάλες βάσεις δεδομένων.
Η πρώτη χρήση του όρου Αυτόματη Ανάκτηση Εικόνων έγινε από τον Kato [1992] για να περιγράψει τα πειράματά του πάνω στην αυτόματη ανάκτηση εικόνων βάσει χρώματος και σχήματος από μία βάση δεδομένων. Ο όρος χρησιμοποιείται ευρέως από τότε για να περιγράψει τη διαδικασία της ανάκτησης επιθυμητών εικόνων από μία μεγάλη συλλογή βάσει συγκεκριμένων χαρακτηριστικών τα οποία εξάγονται αυτόματα από τις ίδιες τις εικόνες[1].
Υπάρχει ένα αυξανόμενο ενδιαφέρον στην ΑΑΕ εξαιτίας των περιορισμών που ενυπάρχουν σε συστήματα που βασίζονται σε μεταδεδομένα καθώς και στο μεγάλο εύρος πιθανών χρήσεων στην αποτελεσματική ανάκτηση εικόνων. Πληροφορίες σε κείμενο μπορούν εύκολα να αναζητηθούν με την υπάρχουσα τεχνολογία, αλλά απαιτούν ανθρώπινη παρέμβαση για την περιγραφή κάθε εικόνας στη συλλογή. Αυτό δεν είναι πρακτικό σε πολύ μεγάλες βάσεις δεδομένων ή σε εικόνες που έχουν παραχθεί αυτόματα π.χ. από κάμερες παρακολούθησης. Επίσης, είναι δυνατόν να αγνοηθούν εικόνες που χρησιμοποιούν διαφορετικά συνώνυμα στην περιγραφή τους. Τα συστήματα που βασίζονται στην κατηγοριοποίηση των εικόνων σε σημασιολογικές κλάσεις όπως «cat» σαν υποκλάση του «animal» δεν παρουσιάζουν αυτό το πρόβλημα αλλά συνεχίζουν να μην είναι πρακτικά όσο μεγαλώνει η βάση δεδομένων.
Πιθανές εφαρμογές της ΑΑΕ περιλαμβάνουν:
Παρότι έχει αναπτυχθεί μεγάλος αριθμός συστημάτων ΑΑΕ, το πρόβλημα της ανάκτησης εικόνας βάσει του περιεχομένου της παραμένει. Παρακάτω αναφέρονται οι κύριες τεχνικές που τα συστήματα ΑΑΕ χρησιμοποιούν.
Αναζήτηση εικόνων σε συστήματα ΑΑΕ παραδοσιακά πραγματοποιείται χρησιμοποιώντας μία εικόνα ως δείγμα. Σκοπός τότε του συστήματος είναι να καθορίσει ποιες εικόνες ταιριάζουν περισσότερο στο δείγμα. Αυτή η προσέγγιση γενικά είναι γνωστή ως "αναζήτηση βάση παραδείγματος"[12].
Οι άνθρωποι τείνουν να χρησιμοποιούν υψηλού επιπέδου χαρακτηριστικά ή έννοιες όπως λέξεις κλειδιά, κείμενα περιγραφής για να περιγράψουν εικόνες και να μετρήσουν την ομοιότητα μεταξύ τους. Από την άλλη μεριά τα χαρακτηριστικά που εξάγονται αυτόματα με τη χρήση τεχνικών υπολογιστικής όρασης είναι κυρίως χαμηλού επιπέδου (χρώμα, υφή, σχήμα κ.α.). Γενικά δεν υπάρχει απευθείας σύνδεση μεταξύ των υψηλού επιπέδου εννοιών και των χαμηλού επιπέδου χαρακτηριστικών. Τα σημερινά συστήματα ΑΑΕ χρησιμοποιούν κυρίως χαμηλού επιπέδου χαρακτηριστικά αν και υπάρχουν συστήματα που είναι εξειδικευμένα π.χ. για αναγνώριση προσώπου[13].
Όταν προσπαθούμε να συγκρίνουμε μία εικόνα από τη βάση δεδομένων με μία εικόνα που χρησιμοποιείται ως δείγμα, χρησιμοποιούμε διάφορα χαρακτηριστικά των εικόνων για τον υπολογισμό μίας απόστασης μεταξύ τους. Μία απόσταση κοντά στο 0 υποδεικνύει μεγάλη ομοιότητα μεταξύ των εικόνων όσων αφορά τα χαρακτηριστικά που επιλέχθηκαν. Όσο απομακρυνόμαστε από το 0 τόσο η ομοιότητα μειώνεται.
Η πιο απλή μέτρηση της απόστασης βάσει του χρώματος αφορά τον υπολογισμό του ποσοστού των pixel μίας εικόνας που έχουν ένα συγκεκριμένο χρώμα. Αυτό γίνεται με τη βοήθεια του χρωματικού ιστογράμματος της εικόνας. Αυτή η μέθοδος βέβαια δεν λαμβάνει υπόψη τη θέση των pixel αυτών στην εικόνα. Είναι αυτονόητο ότι δύο εικόνες μπορεί να μοιάζουν βάσει χρωματικού ιστογράμματος αλλά να έχουν τελείως διαφορετική κατανομή των χρωμάτων και να πρόκειται τελικά για δύο τελείως διαφορετικές εικόνες. Σύγχρονη έρευνα προσπαθεί να χωρίσει την εικόνα σε περιοχές και να συγκρίνει επιμέρους ιστογράμματα. Η σύγκριση βάσει χρώματος πάντως είναι από τις πιο διαδεδομένες τεχνικές γιατί δεν εξαρτάται από το μέγεθος ή τον προσανατολισμό της εικόνας.
Η έννοια της υφής αναφέρεται σε ιδιότητες που αναπαριστούν την επιφάνεια ή την δομή ενός αντικειμένου. Η υφή αποτελείται από στοιχεία ή αρχέγονα υφής, τα οποία αναφέρονται και ως texels. Οι μέθοδοι που συγκρίνουν δύο εικόνες βάσει της υφής, αναζητούν οπτικά πρότυπα καθώς και το που βρίσκονται στο χώρο. Για την περιγραφή τις υφής υπάρχουν δύο κυρίαρχες προσεγγίσεις, η στατιστική και η συντακτική. Οι στατιστικές μέθοδοι υπολογίζουν διάφορες ιδιότητες και είναι κατάλληλες για τις περιπτώσεις που τα μεγέθη των στοιχείων υφής είναι συγκρίσιμα με το μέγεθος των pixel. Οι συντακτικές αλλά και οι υβριδικές μέθοδοι (συνδυασμός στατιστικών και συντακτικών), είναι περισσότερο κατάλληλες για υφές στις οποίες τα στοιχεία τους μπορούν να χαρακτηριστούν από μια ετικέτα, που είναι ο τύπος του στοιχείου. Αυτό σημαίνει ότι τα στοιχεία μπορεί να περιγραφούν με μια μεγαλύτερη ποικιλία ιδιοτήτων από απλώς μόνο τις τονικές ιδιότητες, όπως για παράδειγμα την περιγραφή σχήματος[14].
Η χρήση του σχήματος των αντικειμένων είναι ένα από τα πιο δύσκολα προβλήματα στην δημιουργία αποτελεσματικών συστημάτων ΑΑΕ. Το σχήμα του αντικειμένου παίζει ένα πολύ σημαντικό ρόλο στην αναζήτηση παρόμοιων αντικειμένων όπως π.χ. στόχοι αντικείμενα σε αεροφωτογραφίες η δορυφορικές φωτογραφίες. Η περιγραφή των αντικειμένων αυτών πρέπει να είναι ανεξάρτητη από τη μεγέθυνση ή τον προσανατολισμό του αντικειμένου. Η εκμετάλλευση των σχημάτων δεν είναι τόσο ανεπτυγμένη όσο του χρώματος και της υφής στα συστήματα ΑΑΕ εξαιτίας της εγγενούς πολυπλοκότητας στην αναπαράσταση των σχημάτων. Συγκεκριμένα, οι περιοχές μίας εικόνας που καταλαμβάνονται από το σχήμα πρέπει να βρεθούν και στη συνέχεια πρέπει να εφαρμοστεί μία μέθοδος κατάτμησης ή εντοπισμού ακμών[15].