COMPRESIÓN DE IMAGEN


INDICE

0.- INTRODUCCIÓN

1.- FUNDAMENTOS SOBRE IMAGEN  

1.1.- Tipos de redundancia

1.1.1.- Redundancia de código

1.1.2.- Redundancia entre píxeles

1.1.3.- Redundancia psicovisual

1.2.- Parámetros de medida de calidad

1.3.- Teoría de la información

1.4.- Codificación del color

1.5.- Conceptos sobre imagen digital

2.- TÉCNICAS DE COMPRESIÓN DE IMAGEN

2.1.- COMPRESIÓN REVERSIBLE

2.1.1.- Codificación predictiva sin pérdidas

2.1.2.- Interpolación jerárquica (HINT)

2.1.3.- Pirámide de diferencias (DP)

2.1.4.- Codificación de planos de bits (BPE)

2.1.5.- Autorregresión multiplicativa (MAR)

2.1.6.- Codificación de longitud variable: código Huffman

2.1.7.- Codificación de línea (Run-length)

2.1.8.- Codificación de área

2.2.- COMPRESIÓN IRREVERSIBLE

2.2.1.- Compresión mediante transformadas

2.2.1.1.- Introducción

2.2.1.2.- Selección del tamaño de la subimagen

2.2.1.3.- Asignación de bit (‘bit allocation’)

2.2.1.4.- Tipos de transformadas

2.2.1.4.1.- Transformación de Karhunen-Loeve

2.2.1.4.2.- Transformada Discreta del Coseno (DCT)

2.2.1.4.3.- Transformada de Wavelet

2.2.1.4.4.- Otras transformadas

2.2.1.4.5.- Comparación DCT / WAVELET

2.2.2.- Cuantificación umbral

2.2.3.- Codificación predictiva con pérdidas: DPCM

2.2.4.- LOT (Lapped Orthogonal Transform)

2.2.5.- Codificación en subbandas

2.2.6.- Cuantificación vectorial (VQ)

2.2.7.- Quadtrees

2.2.8.- Compresión mediante fractales

2.2.8.1.- Introducción

2.2.8.2.- Una breve introducción histórica

2.2.8.3.- Fractales

2.2.8.4.- Consideraciones

2.2.8.4.1.- Escalado y resolución

2.2.8.4.2.- El problema de la velocidad

2.2.8.4.3.- Relaciones de compresión

2.2.8.5.- Comparación fractales/DCT

2.2.8.6.- Una implementación mediante adaptación/búsqueda heurística

2.2.9.- Compresión mediante redes neuronales

2.2.9.1.- Introducción

2.2.9.2.- Compresión de imágenes mediante redes neuronales

2.2.10.- Comparativa de algunos métodos de compresión con pérdidas

 

3.- ESTÁNDARES DE COMPRESIÓN

3.1.- Estándares de compresión de imagen estática

3.1.1.- JPEG, Joint Picture Experts Group

3.1.1.1.- Introducción

3.1.1.2.- Tipos de JPEG

3.1.1.3.- JPEG: Sistema básico de codificación con pérdidas

3.1.1.3.1.- Espacio de color

3.1.1.3.2.- Proceso de compresión

3.1.1.3.3.- Proceso de descompresión

3.1.1.4.- Peculiaridades del sistema JPEG

3.1.2.- Grupos Fax 3 & 4

3.1.2.1.- Compresión en 1 dimensión

3.1.2.2.- Compresión en 2 dimensiones

3.1.3.- DDES, Digital Data Exchange Specifications

3.1.4.- Código de transformación fractal

3.1.5.- BMP, Bitmap

3.1.6.- GIF, Graphic Interchange Format

3.1.7.- IPI-IIF, Image Processing and Interchange: Image Interchange Facility

3.1.8.- JBIG, Joint Bilevel Image Group

3.1.9.- ODA RGCA, ODA Raster Graphics Content Architecture

3.1.10.- Photo CD, Photo Compact Disk

3.1.11.- PNG, Portable Network Graphics

3.1.12.- TIFF, Tag Image File Format

3.1.13.- TIFF/IT, Transport Independent File Format for Image Technology

3.1.14.- Otros formatos específicos  

3.2.- Estándares de compresión de vídeo

3.2.1.- MPEG

3.2.1.1.- Introducción

3.2.1.2.- Trama del sistema

3.2.1.2.1.- Trama del sistema MPEG-1

3.2.1.2.2.- Trama del sistema MPEG-2

3.2.1.3.- Trama de vídeo

3.2.1.3.1.- Trama de vídeo en MPEG-1

3.2.1.3.2.- Trama de vídeo MPEG-2

3.2.1.4.- Trama de Audio

Características básicas

Trama de audio MPEG-2

3.2.1.5.- Modelo de control de tasa de bits de MPEG-2

3.2.1.6.- Conclusiones

3.2.1.7.- MPEG-3

3.2.1.8.- MPEG-4

3.2.2.- Norma H.261

3.2.3.- Otros estándares de vídeo

 

4.- CONCLUSIONES

5.- COMENTARIOS

6.- PRESUPUESTO

7.- BIBLIOGRAFÍA



  

0.- INTRODUCCIÓN

 

El presente trabajo titulado "Compresión de imágenes" se realiza a petición de D. José Manuel López Alemany para la asignatura de Proyectos de 5º de Ingeniería de Telecomunicación.

Partimos del hecho de que nos encontramos en la llamada "sociedad de la información" rodeados de medios como redes de comunicaciones, multimedia, ordenadores, fax, televisión, sistemas de teleconferencia... De todas las informaciones que circulan las que más capacidad exigen son las imágenes y el vídeo, por lo que la gran tarea que se ha acometido ha sido mejorar la eficiencia de la transmisión de datos a través de redes y reducir el coste de almacenamiento. Consecuencia de ello ha sido la aparición de la compresión de datos y entre las distintas técnicas de compresión de datos disponibles en la actualidad, la de imágenes ha jugado un papel fundamental en el desarrollo de las superautopistas de la información.

Las imágenes en un principio se codificaban en un formato muy simple en el que para cada pixel se leía/escribía el índice correspondiente a su color dentro de la paleta que se codificaba en la cabecera. Estos ficheros de imágenes eran fáciles de codificar y de decodificar y por tanto eran procesos muy rápidos pero poco eficientes. En la actualidad muchos formatos mantienen este mapa de colores (‘bitmap’) almacenado de esta forma.

Pero conforme las imágenes fueron siendo de mayor tamaño (mayor resolución) y de mayor profundidad de color, los ficheros que almacenaban imágenes crecían de tamaño de manera geométrica. Así que, por fin, alguien se fijó en que había mucha información repetitiva en la mayoría de las imágenes (por ejemplo, grandes áreas donde el color de los píxeles era el mismo que el de sus vecinos), un alto grado de redundancia espacial, y una alta correlación entre los valores de los píxeles.. Entonces se empezó a trabajar en el tema de la compresión, tan importante en la actualidad:

‘‘Compresión es la supresión de información redundante’’

La compresión de las imágenes trata de aprovecharse de esta redundancia para reducir el número de bits necesarios para representar la imagen, consiguiendo de esta forma ahorrar recursos tanto de almacenamiento como de transmisión.

 

Una imagen digital es una matriz M x N formada por enteros no negativos f(x,y), donde 1 £ x £ M y 1£ y £ N son las coordenadas de la imagen. El segmento de la imagen formada por los coordenadas (x,y) se llama elemento de la imagen o pixel, y a f(x,y) se le llama valor funcional o nivel de gris.

Una imagen 2- D posee unas dimensiones M x N x K, donde 2 k se corresponde con el rango de niveles de gris.

 

Hay dos técnicas de compresión de imágenes: Reversibles (‘lossless’ o ‘noiseless’) e Irreversibles (‘lossy’ o ‘noisy’).

La compresión reversible quiere decir ‘sin pérdida’ y se refiere a que cuando se comprime una imagen y se almacena, cuando la recupero, la imagen obtenida coincide exactamente con la original hasta en el más pequeño detalle. En otras palabras, no se pierde información utilizando esta técnica de compresión.

La compresión irreversible quiere decir ‘con pérdida’ y se refiere a que se puede suprimir cierta información de la imagen para hacerla más pequeña y sin que el ojo note la diferencia o permitiendo perder pequeños detalles no significativos. Es decir, al volver a descomprimir la imagen voy a recuperarla con alguna pequeña diferencia respecto a la original.

Las pérdidas de los sistemas irreversibles son acumulativas, por lo que para estar trabajando con una imagen se recomienda hacer uso de métodos de compresión sin pérdidas y, una vez finalizado el trabajo, ya se puede hacer uso de sistemas irreversibles para evitar pérdida de información durante el proceso intermedio. De este modo los sistemas con pérdidas obtienen factores de compresión muy superiores a los de sin pérdidas.

Los factores de compresión logrados con técnicas ‘lossless’ están alrededor de 1:2 mientras que con técnicas ‘lossy’ logramos tener factores de 1:10, 1:50 o mayores. Esta mayor compresión se logra mediante una degradación de la imagen. Así la calidad de la imagen dependerá del grado de compresión.

 

Un logro de la compresión de imagen es la transmisión progresiva, que transmite los datos en pasos donde, en cada paso, se reconstruye en el receptor, proporcionando cada vez una aproximación mejor a la imagen original. La compresión más elevada puede servir de guía en el proceso inicial ahorrando tiempo y ancho de banda. Esta técnica de la transmisión progresiva encuentra aplicaciones en análisis clínicos e Internet.

 

Dentro de estas técnicas de compresión de imagen existen infinidad de algoritmos y formatos estandarizados, tanto de imagen estática como de vídeo, y que se irán presentando a lo largo del presente trabajo. Se ha intentado dar una visión general, ocupándose tanto de algoritmos clásicos (codificación diferencial, de planos de bits...) como los más actuales (wavelets, redes neuronales...) sin olvidar los estándares tanto de imagen estática (JPEG, PNG, TIFF...) como de vídeo (MPEG-1 y 2, AVI, QuickTime ...). Para ello se comienza sentando unos fundamentos de la compresión, a lo que siguen diferentes técnicas de compresión de imagen tanto en lo referente a modelos de compresión sin pérdidas al principio como a modelos de compresión con pérdidas después. Tras ello se describen diferentes estándares tanto de compresión de imagen estática como de vídeo.


7.- BIBLIOGRAFÍA

[ 1] C.K. Li y H. Yuen, "A high performance image compression technique for multimedia applications", IEEE Transactions on Consumer Electronics, Vol.42, Num.2, 239-43

[ 2] Olivier Egger, Wei Li y Murat Kunt, "High compression image coding using an adaptive morphological subband decomposition", Proceedings of the IEEE, Vol.83, Num.2, p.272-87

[ 3] Robert D. Dony y Simon Haykin, "Neuronal network approaches to image compression", Proceedings of the IEEE, Vol.83, Num.2, p.288-291

[ 4] Lester Thomas y Farzin Deravi, "Region-based fractal image compression using heuristic search", IEEE Transactions on image processing, Vol.4, Num.6, p.832-8

[ 5] John D. Villasenor, Benjamin Belzer y Judy Liao, "Wavelet filter evaluation for image compression", IEEE Transactions on image processing, Vol.4, Num.8, p.1053-9

[ 6] Xiaonong Ran y Nariman Farvardin, "A perceptually motivated three-component image model - Part II: Applications to image compression", IEEE Transactions on image processing, Vol.4, Num.4, p.430-46

[ 7] Veyis Nuri y Roberto H. Bamberger, "Size-limited filter banks for subband image compression", IEEE Transactions on image processing, Vol.4, Num.9, p.1317-23

[ 8] Péter L. Venetianer, Frank Werblin, Tamás Roska y Leon O.Chua, "Analogic CNN algorithms for some image compression and restoration tasks", IEEE Transactions on Circuits and Systems - I: Fundamental Theory and Applications, Vol.42, Num.5, p.278-83

[ 9] Jayant, "Signal compression based on models of human perception", Proceedings of the IEEE, Vol.81, Num.10, p.1383-1418

[ 10] Armando Manduca, "Compression images with wavelet/subband coding", IEEE Engineering in Medicine and Biology, Vol.14, Num.3, p.639-46

[ 11] A. Ramaswamy y W.B. Mikhael, "A mixed transform approach for efficient compression of medical images", IEEE Transactions on Medical Imaging, Vol.15, Num.3, p.343-52

[ 12] Philippe Salembier, Patrick Brigger, Josep R. Casas y Montse Pardas, "Morphological operators for image and video compression", IEEE Transactions on Image Processing, Vol.5, Num.6, p.881-96

[ 13] Pedro José Zufiria y Narciso García, "Compresión de imágenes mediante codificación de transformadas", Mundo Electrónico, Num.176, 1987, p.119-33

[ 14] Rafael C. Gonzalez y Richard E. Woods, "Digital Image Processing", Addison-Wesley Publishing Company, Capítulo 6

[ 15] Ralf Schäfer, "The Status of HDTV in Europe", IEEE Communications Magazine, Junio 1996, p.120-5

[ 16] Enrique Cimadevilla y Jesús Macías, "Codificación multimedia avanzada", Mundo Electrónico, Junio-Julio 1995, Num.258, p.38-43

[ 17] Richard A Quinnell, "Image compression Part 1", EDN, Vol.38, Num.2, p.62-71 Enero 1993.

[ 18] Richard A Quinnell, "Image compression Part 2", EDN, Vol.38, Num.5, p.120-6 Marzo 1993

[ 19] Richard A Quinnell, "Image compression Part 3", EDN, Vol.38, Num.10, p.114-18 Mayo 1993

[ 20] Dr John Mason, "The unsolved problem of image compression", Image Processing, Vol.7, Num.5, 1995, p.38-40

[ 21] Memon N.D., Sayood K, "Lossless image compression: a comparative study", Proceedings of the SPIE, Vol.2418, pags.8-20, año 1995.

[ 22] Amir Asif and José M. F. Moura, "Image Codec Noncausal Prediction, Residual Mean Removal, and Cascaded VQ", Transactions on Circuits and Systems for Video Technology, Vol.6, Num.1, Febrero 1996

[ 23] Ying Wang, "A set of Transformations for Lossless Image Compression", Transactions on Image Processing, Vol.4, Num.5, Mayo 1995

[ 24] Stephen Wong, Loren Zaremba, David Gooden, and H. K. Huang, "Radiologic Image Compression - A Review", Proceedings of the IEEE, Vol.83, Num.2, Febrero 1995

[ 25] Jiebo Luo, Chang Wen Chen, Kevin J. Parker and Thomas S. Huang "Artifact Reduction in Low Bit Rate DCT-Based Image Compression", Transactions on Image Processing, Vol.5, Num.9, Septiembre 1996

[ 26] Panos Nasiopoulos and Rabab K. Ward, "A High-Quality Fixed-Length Compression Scheme for Color Images", Transactions on Communications, Vol.43, Num.11, Noviembre 1995

[ 27] Nicolaos B. Karayiannis and Pin-I Pai,"Fuzzy Vector Quantization Algorithms and Their Application in Image Compression", Transactions on Image Processing, Vol.4, Num.9, Septiembre 1995

[ 28] Wenhua Li and Ezzatollah Salari, "A Fast Vector Quantization Encoding Method for Image Compression", Transactions on Circuits and Systems for Video Technology, Vol.5, Num.2, Abril 1995

[ 29] Mohammad A. Ghafourian and Chien-Min Huang, "Comparison Between Several Adaptive Search Vector Quantization Schemes and JPEG Standard for Image Compression", Transactions on Communications, Vol.43, Num.2/3/4, Febrero, Marzo, Abril 1995

[ 30] Sherif A. Mohamed and Moustafa M. Fahmy, "Image Compression Using VQ-BTC", Transactions on Communications, Vol.43, Num.7, Julio 1995

DIRECCIONES INTERNET

http://ltswww.epfl.ch/ Swiss Federal Institute of Technology -- Signal Processing Laboratory

http://www.jpg.com Página de una empresa dedicada a procesado de imagen: Pegasus

http://www.bk.isy.liu.se/~davoine/ Davoine, Franck. Compresión mediante fractales.

http://fas.sfu.ca/ensc/people/Faculty/vaisey/ Vaisey, Jacques. Compresión de imagen y vídeo.

http://www.c3.lanl.gov/~brislawn Brislawn, Christopher M.. Wavelets, codificación de imagen y estándar de compresión de imagen del FBI para huellas digitales. http://www.mi.net/act/act.html Comparación de formatos.

http://www.cadcam.nus.sg/~ele22091/Proj.html Wavelet: programas e imágenes de demostración.

http://sipi.usc.edu/~yyoo Yoo, Youngjun. Compresión de imagen y vídeo. Cuantificación adaptativa.

http://www.best.com/~bhaskara Bhaskaran, Vasudev. Compresión de imagen y vídeo.

http://etro.vub.ac.be/chchrist.html Christopoulos, Charilaos. Compresión de imagen y vídeo.

http://www.ee.duke.edu/~cec/still.html Redes neuronales.

http://www.bk.isy.liu.se/~davoine/ Davoine, Franck. Coodificación fractal.

http://inls.ucsd.edu/y/Fractals/ Fisher, Yuval. Compresión de imagen.

http://www.ece.ucsb.edu/faculty/gersho/default.html Gersho, Allen. Vector Quantisation, Compresión de imagen.

http://www-plateau.cs.berkeley.edu/people/smoot Smoot, Steve. MPEG.

http://www.cis.ohio-state.edu/hypertext/faq/usenet/jpeg-faq/faq.html Preguntas frecuentes sobre JPEG.

http://www.crs4.it/HTML/LUIGI/MPEG/mpegfaq.html Preguntas frecuentes sobre MPEG.

http://www.mi.net/act/act.html Sumario de archivos test de compresión.

http://www.wco.com/~png/ Formato PNG. ü ftp://nic.funet.fi/pub/graphics/misc/test-images/ Imágenes de prueba del CCITT (Lena etc.) Formato 'Sun raster'.

http://www-isl.stanford.edu/~gray/compression.html Grupo de compresión; ISL,EE,Stanford.

http://ipl.rpi.edu/SPIHT/ SPIHT - Compresión Wavelet.

http://www.creative.net/~tristan/MPEG Recursos y punteros de MPEG.

http://inls.ucsd.edu/y/Fractals/ Compresión fractal.

http://www.dmsun4.bath.ac.uk Información sobre DCT, fractales y wavelet.

http://www.internz.com/compression-pointers.html Enlaces sobre compresión.

http://www2.echo.lu/oii/en/compress.html Técnicas de compresión en el OII.

http://ltswww.epfl.ch/research/ Proyectos de investigación actuales sobre compresión.

http://www.igd.fhg.de/icib/it/iso/is_10918-1/pvrg-descript/doc.html ISO IS-10918 - Para entender el estándar de compresión JPEG.


Este proyecto fue realizado por:


Como el proyecto es muy largo, solo hemos puesto la introducción y la bibliografía, la cual contiene enlaces a páginas que hemos utilizado en la elaboración del proyecto. Si deseas el resto del mismo, así como los algoritmos de compresión implementados con MATLAB, puedes ponerte en contacto con nosotros.


Volver a la página de Patxi