De acuerdo a la norma ISO 5963 (1985) la indización es el proceso de describir o representar el contenido temático de un recurso de información. Este proceso da como resultado un índice de términos de indización que será utilizado como herramienta de búsqueda y acceso al contenido de recursos en sistemas de recuperación de información.
La indización es una actividad técnica-intelectual integrada por procedimientos dirigidos a desglosar, descifrar, analizar y resumir el contenido de los documentos, todo esto con el objetivo de hacer posible el almacenamiento, recuperación, acceso y difusión de la información, facilitando su recuperación, ya sea en forma directa por los usuarios o a través de índices, catálogos, base de datos, etc., y se cumple en forma controlada y normalizada a través de un proceso conformado por cuatro etapas:
Esta concepción de la indización, cuyos elementos centrales son la determinación humana del tema y la asignación de términos desde un vocabulario controlado, la distingue de la indización automática y la indización libre.
La indización automática es una indización por extracción. Se extraen palabras-clave del título, del resumen o del texto completo de un recurso, y se usan para representar su contenido, sin ser sometidas a ningún tipo de control terminológico. Los artículos, las conjunciones, pronombres, preposiciones, interjecciones, numerales y algunos verbos y adverbios son palabras vacías. Son palabras no vacías los nombres, los adjetivos y algunos verbos y adverbios.
La indización libre es aquella que no utiliza, en la representación de temas, términos de un vocabulario controlado sino que emplea términos extraídos del propio recurso o de la mente del indizador.
Por política de indización entendemos tanto la forma de realizar la indización de una determinada institución como el esfuerzo por concretar, sistematizar y plasmar en guías o manuales los procesos seguidos en la indización.
Ejemplo de política de indización general para una biblioteca:
Los vocabularios controlados pueden definirse como
La forma en que los términos se ordenan o disponen en el vocabulario es el criterio para establecer una tipología de vocabularios controlados:
El ordenamiento principal de los términos es alfabético. Los términos relacionados se conectan a través de referencias o relaciones (vínculos de equivalencia, jerarquía y asociación semántica) como por ejemplo las Listas de Encabezamientos de materia.
Los términos aparecen agrupados en clases o categorías, por lo general temáticas. Establecen entre sí una relación jerárquica como un Tesauro.
El uso de vocabularios controlados además de facilitar la recuperación de los documentos en una unidad o sistema de información, evita las ambigüedades en la descripción y clasificación de los mismos.