Комп'ютерне стереобачення це метод виділення інформації про тривимірні об'єкти із цифрових зображень, отриманими цифровими камерами такими як CCD камера. Порівнюючи інформацію про сцену із двох точок спостереження, 3D інформацію можна обчислити аналізуючи відносні позиції об'єктів на двох площинах. Цей спосіб обчислення є схожим на біологічний стереоскопічний ефект.
У звичайному стереобаченні, дві камери, зміщені одна від одного по горизонталі використовуються для отримання зображення сцени з різних точок зору, аналогічно як це відбувається в бінокулярному зорі людини. Порівнюючи ці два зображення, відносна інформація про глибину може отримуватися у вигляді мапи бінокулярної невідповідності, яка кодує різницю в горизонтальних координатах відповідних точок зображення. Значення в цій мапі невідповідності обернено пропорційні за значенням до глибини сцени в для заданої позиції пікселя.
Аби людський мозок міг здійснювати таке порівняння двох зображень, вони повинні зіставлятися за допомогою стереоскопічного пристрою, так що зображення правої камери буде показане для правого ока, а лівої для лівого ока.
В системі комп'ютерного зору, потрібно виконати кілька кроків попередньої обробки.[1]
Активне стерео бачення це різновид стереобачення, який активно використовує джерела світлових променів, таких як лазер або структурованого світла[en] аби спростити задачу стерео співставлення. Протилежним терміном тоді буде пасивне стерео бачення.
Піксель записує колір в даній позиції. Позиція задається координатами на сітці точок (x, y) і глибиною до пікселя z.
Стереоскопічний зір дає отримати два зображення однієї сцени із різних точок зору. На діаграмі світло від точки A передається через точки вхідного окуляра камери стенопу в точках B і D, на екрани зображення в точках E і H.
На приведеній діаграмі відстань між центрами двох лінз камер становить BD = BC + CD. Наступні трикутники є подібними,
Таким чином пропустивши що камери знаходяться на одному рівні, а площини зображень є плоскими на одній площині, зміщення по осі y одного пікселя на двох зображеннях становить,
Де k це множник який задає відношення відстані між двома камерами і відстані від лінзи до зображення.
Компоненти глибини в двох зображеннях і , задаються наступний чином,