La consulta d'imatges mitjançant exemple (content-based Image retrieval, CBIR) és un sistema de recerca per recuperar imatges que es basa en el seu contingut, i que es refereix en el seu context a colors, formes, textures o qualsevol altra informació que pugui derivar-se de la imatge mateixa.
CBIR és una especificitat de consulta mitjançant exemple (Query by Example) i també són coneguts com a QBIC, ja que és la tecnologia més utilitzada avui dia per a la cerca d'imatges en grans bases de dades. Entre les variants de consultes mitjançant exemple però, també hi trobem diferents especificitats com ara els sistemes de cerca amb àudio com per exemple el cercador de veu o la cerca amb text.
Els sistemes CBIR van sorgir al començament de la dècada dels noranta per solucionar els problemes de la indexació manual, que consisteix en la descripció de les imatges amb paraules. Aquests problemes eren, i segueixen sent, una gran inversió en temps a causa de la inconsistència del llenguatge natural, així com la dificultat d'expressar amb paraules les qualitats gràfiques i les sensacions estètiques que proporciona la percepció d'una representació visual.
L'ús de cerques automàtiques a través d'un conjunt d'imatges sobre la seva base de forma, to, color, textura o ubicació espacial ha estat durant molt de temps i continua sent una àrea de recerca florent, on cada any, apareixen documents en fòrums científics i tècnics.
Hi ha un creixent interès en CBIR a causa de les limitacions inherents als sistemes basats en metadades, així com l'àmplia gamma de possibles usos per a la recuperació de la imatge de forma eficient. La informació textual sobre les imatges pot ser buscat fàcilment utilitzant la tecnologia existent, però requereix personal per a descriure cada imatge a la base de dades. Això és poc pràctic per a bases de dades molt grans, o per a imatges que es generen de forma automàtica, per exemple, de les càmeres de vigilància. També és possible perdre imatges que utilitzen sinònims diferents en les seves descripcions. Els sistemes basats en la classificació de les imatges de forma semàntica, com "gat" com una subclasse de "mamífers" eviten aquest problema, però encara s'enfronten als problemes a gran escala.
Les característiques visuals més extensament manejades per aquests sistemes es refereixen al color, textura i formes genèriques, encara que a vegades també es treballa amb la posició espacial d'un determinat objecte en una imatge o les diferències tonals. Aquests atributs s'extreuen i es representen automàticament a través d'estructures de dades numèriques, de manera que no necessitem expressar la nostra cerca mitjançant termes sinó emprant, per exemple, paletes de colors, dibuixant o seleccionant imatges a partir de les quals el sistema retornarà altres visualment similars. No obstant això, els sistemes CBIR de caràcter mixt solen combinar aquestes opcions de consulta també amb la tradicional expressió lingüística del que busquem.
Molts són els sistemes CBIR desenvolupats, però el problema de la recuperació de les imatges a partir del seu contingut encara és en gran manera de píxels sense resoldre.
Diferents implementacions de CBIR fan ús de diferents tipus de consultes dels usuaris.
Les opcions per proporcionar imatges d'exemple al sistema inclouen:
El sistema CBIR ideal, des de la perspectiva de l'usuari, implicaria el que es coneix com a recuperació semàntica, on l'usuari fa una petició com a "trobar fotos de gossos" o fins i tot "trobar fotos d'Abraham Lincoln". Aquest tipus de composició oberta, és una tasca tediosa per ser portat a terme pels ordinadors. Els sistemes CBIR actuals, generalment fan ús de funcions de menor nivell com la textura, color i forma, encara que alguns sistemes s'aprofitin de característiques comunes d'alt nivell com poden ser les cares (vegeu el sistema de reconeixement facial).
D'altra banda, no tots els sistemes CBIR són genèric. Alguns sistemes estan dissenyats per a un domini específic, per exemple, la cerca per forma es pot utilitzar per trobar les peces dins d'una base de dades de CAD-CAM.
Altres mètodes de consulta inclouen la navegació per imatges d'exemple, navegació personalitzada o categories jeràrquiques, consulta per regions de la imatge (en lloc de tota la imatge), per múltiples imatges d'exemple, per esbós, consulta directa per especificació de les característiques de la imatge, i les consultes multimodal (per exemple, la combinació de tacte, veu, etc.).
Els sistemes CBIR també poden fer ús de la retroalimentació pertinent, on l'usuari refina progressivament els resultats de cerca mitjançant el marcatge de les imatges en els resultats com "rellevant", "no rellevant" o "neutral" a la consulta de cerca, després repetir la cerca amb la nova informació.
La recuperació d'imatges basada en la semblança de color, s'aconsegueix mitjançant el càlcul d'un histograma de color per a cada imatge que identifica la proporció de píxels d'una imatge que contenen valors específics en aquest cas, colors. Les recerques actuals estan tractant de dividir segments de color per regió i per la relació espacial entre dues regions de colors diferents.
Mostra imatges basant-se en els colors que contenen és una de les tècniques més àmpliament usades perquè no depèn de la mida de la imatge o de la seva orientació. La cerca basada en el color s'executa comunament comparant els histogrames de color de les imatges.
La mesura de les textures cerca patrons visuals en les imatges i tracta de trobar la manera en què es defineix l'espai. La textura es representa mitjançant Texels que després es col·loquen en una sèrie de conjunts depenent en totes les textures s'han detectat a la imatge. Aquests conjunts no només defineixen les textures, sinó també quan en aquesta imatge (en quin punt) es troba aquesta textura.
La forma no es refereix a la forma d'una imatge com a la forma d'una regió en particular. Les formes sovint són determinades aplicant primer el mètode de segmentació (segmentation) o la detecció de les vores (edge detection) d'una imatge. En alguns casos una acurada detecció de les formes requereix intervenció humana perquè els mètodes com la segmentació són molt difícils per automatitzar.
Per a la determinació de la rellevància de les imatges dels sistemes CBIR consten de: