Free Viewpoint Television (FTV, Televisión de punto de vista libre) es un sistema de información en 3D que engloba adquisición, procesado y reproducción de imágenes. Ha sido diseñado por Masayuki Tanimoto de la Universidad de Nagoya (Japón).
FTV pretende crear una nueva época en la historia de la televisión porque permite ver libremente un mundo real (de 3D) únicamente cambiando el punto de vista tal y como se haría estando presente en la escena adquirida. Se trata de un sistema en el que el usuario elige qué es lo que quiere ver de una escena.
Una escena es captada por decenas de cámaras conectadas a un servidor. Por otro lado está el usuario que tiene frente a él un monitor en el que podrá observar las imágenes adquiridas, y una cámara que detectará el movimiento de este usuario. La información extraída de la cámara sobre el movimiento del usuario será la que ordene al servidor qué imagen es la que se debe reproducir por pantalla. De esta forma se produce un efecto ventana. Si el usuario se desplaza hacia la derecha, podrá ver lo que hay a la izquierda de la escena y viceversa.
Así, no solo generara imágenes de punto de vista libre sino que también transporta el espacio. FTV es una plataforma de la información espacial 3D. FTV se puede aplicar a amplias áreas tales como el entretenimiento, la observación de la naturaleza, el turismo, el arte, los museos, la educación, la medicina, la seguridad, etcétera.
Se ha desarrollado el FTV basándose en la teoría del rayo-espacio. En la teoría del rayo-espacio, un rayo en el espacio real 3D es representado por un punto en el espacio del rayo. El espacio del rayo está compuesto por muchas imágenes de la visión. Una sección representativa del espacio del rayo da una imagen de la visión. La información visual del espacio 3D se representa como "rayos". Los datos del rayo tienen toda la información de las escenas vistas de cualquier punto de vista en el espacio 3D. Una imagen de la visión es subespacio del rayo-espacio y podemos generar imágenes foto-realistas de la visión simplemente muestreando el rayo-espacio. El rayo-espacio tiene estructuras especiales debido al hecho de que el rayo va recto. El rayo-espacio tiene 5 dimensiones.
Si colocamos cámaras en una línea o un círculo, tenemos solamente una porción de datos del rayo-espacio. En tales casos, definimos dos clases de rayo-espacio más pequeños: coordenadas ortogonales y coordenadas esféricas. El rayo-espacio ortogonal se utiliza para los sistemas paralelos de la visión y el rayo-espacio esférico se utiliza para los sistemas convergentes de la visión.
Las partes más diferenciadas del FTV son la adquisición, la interpolación, la compresión y el visionado.
La adquisición de la señal se consigue mediante una serie de cámaras conectadas a un servidor colocadas a la misma altura frente a la escena que se desea captar. Así se consigue el rayo-espacio de 5 dimensiones. Hay diferentes tipos de colocación de las cámaras dependiendo de cuan libremente queremos que se vea la escena, pero las disposiciones más estandarizadas son: lineal y semicircular.
Por ejemplo, si deseamos ver la escena a partir de un lado solamente, las cámaras se colocan en una línea. Si deseamos ver la parte posterior de la escena, se colocan en un círculo. Si deseamos ver la parte superior de la escena, se colocan en una bóveda semiesférica. A mayor número de cámaras, mayor densidad del rayo-espacio. En el caso de la disposición lineal de cámaras, las imágenes de éstas se ponen verticalmente en paralelo en el rayo-espacio, formando la señal de FTV según lo demostrado en las siguientes imágenes.
El rayo-espacio es originalmente 4-dimensional y el parámetro tiempo nos aporta la quinta dimensión. Si colocamos cámaras en una región limitada tal como una línea o un círculo, el rayo obtenido es limitado y el rayo-espacio construido de estos rayos es un subespacio del rayo-espacio.
La calidad de las vistas generadas depende principalmente de la interpolación realizada, puesto que no es posible tener infinidad de cámaras. Si el usuario se coloca de tal forma que una cámara no puede captar la escena deseada, FTV interpola las imágenes de las dos cámaras situadas más cercanas al punto determinado. Así, un rayo-espacio poco denso (número deficiente de cámaras) puede compensarse mediante la interpolación. Esta interpolación puede hacerse tanto en el transmisor como en el receptor, dependiendo de la aplicación.
La compresión de la señal de FTV es muy importante porque el número de cámaras es grande. La manera más simple es aplicar el MPEG convencional que cifra cada señal de la cámara independientemente. Sin embargo, la señal de FTV se puede comprimir con más eficacia considerando la señal entera de FTV y la estructura del rayo-espacio porque hay una gran correlación entre las señales de las cámaras.
FTV ofrece un alto grado de detalle y definición, incluso en complicadas escenas tenemos resultados óptimos. Cuando el usuario da su punto de vista al sistema, la imagen de la visión se obtiene simplemente como imagen de la sección del rayo-espacio. La imagen de la visión se puede exhibir en 2D o 3D. Dos o varias secciones transversales se hacen para 3D o la exhibición de la multi-vista.
Dependiendo de la posición del espectador el sistema es capaz de actualizar la información mostrada para tener en cuenta la perspectiva visual que se tendría en la realidad. Cuando el espectador se ha desplazado a la izquierda, lo que el sistema muestra es la esquina izquierda del elemento reproducido en 3D y no la parte frontal (y viceversa). Así se puede decir que el punto de vista mostrado por el sistema varía en función de la posición del espectador.
La mayoría de los monitores free-viewing producen un limitado número de vistas (como mínimo dos). En este caso, la única forma de dar una sensación 3D consiste en hacer una distribución espacial de las distintas vistas. Algunos de los métodos más destacados son:
FTV puede adquirir, almacenar y transmitir toda la información visual del espacio 3D. Así, la función de FTV es generar no solo imágenes de punto de vista libre sino también transportar el espacio de la representación visual 3D. El siguiente cuadro recoge algunas de las aplicaciones actuales del sistema FTV.
Este sistema ha sido desarrollado para poder capturar escenas más grandes. Consiste en un servidor y 100 clientes (llamados nodos) equipados con cámaras PULNiX TM-1400CL. El servidor genera una señal de sincronismo y la distribuye a todos los nodos. Este sistema no solo es capaz de capturar video de alta resolución con 30 imágenes por segundo, sino que además puede capturar señal analógica de hasta 96 kHz.