La Consulta de imágenes mediante ejemplo (Content-based Image Retrieval) es un sistema de búsqueda para recuperar imágenes basándose en su contenido, refiriéndose en su contexto a colores,figuras , texturas o cualquier otra información que pueda derivarse de la propia imagen.
CBIR está basado en los sistemas de consulta mediante ejemplo (Query by Example) y también son conocidos como QBIC, ya que es la tecnología más utilizada hoy en día para la búsqueda de imágenes en grandes bases de datos.
Los sistemas CBIR surgieron a comienzos de la década de los ’90 para solucionar los problemas de la indexación manual, que consistente en la asociación de términos a las imágenes. Estos problemas eran, y siguen siendo, una gran inversión en tiempo debido a la inconsistencia entre indicadores humanos, así como la dificultad de expresar mediante palabras las cualidades gráficas y las sensaciones estéticas que proporciona la percepción de una representación visual.
El uso de búsquedas automáticas a través de un conjunto de imágenes sobre su base de forma, tono, color, textura o ubicación espacial ha sido durante largo tiempo y sigue siendo un área de investigación floreciente, donde cada año, aparecen documentos en foros científicos y técnicos.
Hay un creciente interés en CBIR debido a las limitaciones inherentes a los sistemas basados en metadatos, así como la amplia gama de posibles usos para la recuperación de la imagen de forma eficiente. La información textual acerca de las imágenes puede ser buscado fácilmente utilizando la tecnología existente, pero requiere de personal para describir cada imagen en la base de datos. Esto es poco práctico para bases de datos muy grandes, o para imágenes que se generan de forma automática, por ejemplo, de las cámaras de vigilancia. También es posible perder imágenes que utilizan sinónimos diferentes en sus descripciones. Los sistemas basados en la clasificación de las imágenes de forma semántica, como "gato" como una subclase de "animales" evitan este problema, pero todavía se enfrentan a los problemas a gran escala.
Las características visuales más extensamente manejadas por estos sistemas se refieren al Color, Textura, y Formas genéricas, aunque en ocasiones también se trabaja con la posición espacial de un determinado objeto en una imagen o las diferencias tonales. Dichos atributos se extraen y se representan automáticamente a través de estructuras de datos numéricas, de modo que no necesitamos expresar nuestra búsqueda mediante términos sino empleando, por ejemplo, paletas de colores, dibujando o seleccionando imágenes a partir de las cuales el sistema devolverá otras visualmente similares. No obstante, los sistemas CBIR de carácter mixto suelen combinar estas opciones de consulta también con la tradicional expresión lingüística de lo que buscamos.
Muchos son los sistemas CBIR desarrollados, pero el problema de la recuperación de las imágenes en base al contenido de sus píxeles sigue, en gran medida, sin resolver.
Distintas implementaciones de CBIR hacen uso de diferentes tipos de consultas de los usuarios.
La consulta por ejemplo (Query by example) es una técnica de consulta que implica dotar al sistema CBIR con una imagen de ejemplo, donde ésta servirá para realizar la búsqueda. Los algoritmos de búsqueda subyacente pueden variar dependiendo de la aplicación, pero las imágenes resultado comparten elementos comunes con el ejemplo proporcionado.
Las opciones para proporcionar imágenes de ejemplo al sistema incluyen:
Esta técnica de consulta elimina las dificultades que pueden surgir cuando se trata de describir las imágenes con las palabras.
(Véase también Sistemas de consulta por ejemplo)
El sistema CBIR ideal, desde la perspectiva del usuario, implicaría lo que se conoce como recuperación semántica, donde el usuario hace una petición como "encontrar fotos de perros" o incluso "encontrar fotos de Abraham Lincoln". Este tipo de composición abierta, es una tarea tediosa para ser llevado a cabo por los ordenadores. Los sistemas CBIR actuales, generalmente, hacen uso de funciones de menor nivel como la textura, color y forma, aunque algunos sistemas se aprovechen de características comunes de alto nivel como pueden ser las caras (véase el sistema de reconocimiento facial).
Por otro lado, no todos los sistemas CBIR son genéricos. Algunos sistemas están diseñados para un dominio específico, por ejemplo, la búsqueda por forma se puede utilizar para encontrar las piezas dentro de una base de datos de CAD-CAM.
Otros métodos de consulta incluyen la navegación por imágenes de ejemplo, navegación personalizada o categorías jerárquicas, consulta por regiones de la imagen (en lugar de toda la imagen), por múltiples imágenes de ejemplo, por esbozo, consulta directa por especificación de las características de la imagen y las consultas multimodal (por ejemplo, la combinación de tacto, voz, etc.).
Los sistemas CBIR también pueden hacer uso de la retroalimentación pertinente, donde el usuario refina progresivamente los resultados de búsqueda mediante el marcado de las imágenes en los resultados como "relevante", "no relevante" o "neutral" a la consulta de búsqueda, luego repetir la búsqueda con la nueva información.
La recuperación de imágenes basada en la similitud de color se consigue mediante el cálculo de un histograma de color para cada imagen que identifica la proporción de píxeles de una imagen que contienen valores específicos en este caso, colores. Las investigaciones actuales están tratando de dividir segmentos de color por región y por la relación espacial entre dos regiones de colores diferentes.
Examinar imágenes basándose en los colores que contienen es una de las técnicas más ampliamente usadas porque no depende del tamaño de la imagen o de su orientación. La búsqueda basada en el color se ejecuta comúnmente comparando los histogramas de color de las imágenes.
La medida de las texturas busca patrones visuales en las imágenes y trata de encontrar la manera en que se define el espacio. La textura se representa mediante texels que luego se colocan en una serie de conjuntos dependiendo en cuantas texturas se han detectado en la imagen. Estos conjuntos no sólo definen las texturas, sino también cuándo en esa imagen (en qué punto) se encuentra esa textura.
La forma no se refiere a la forma de una imagen sino a la forma de una región en particular. Las formas a menudo se determinan aplicando primero segmentación o detección de bordes a la imagen. En algunos casos, una detección precisa de las formas requiere intervención humana porque los métodos tales como la segmentación son muy difíciles como para automatizarlos completamente.
Para la determinación de la relevancia de las imágenes los sistemas CBIR constan de: