Procesamiento Digital de Texto

Procesamiento digital de im á ge ne s y te x t o Procesamiento digital d e i má ge ne s y te xto Autores: José Luis V

Views 127 Downloads 2 File size 4MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

procesamiento digital

96 59 568KB Read more

Procesamiento Digital de Imagenes

47 0 2MB Read more

Sistema de Procesamiento Digital

6 0 990KB Read more

Procesamiento digital de imagenes

46 0 1MB Read more

Procesamiento Digital de Imagenes.pdf

39 0 194KB Read more

Procesamiento Digital de Imagenes

34 0 2MB Read more

Procesamiento Digital de Imagenes

55 57 6MB Read more

Procesamiento Digital en MATLAB

50 1 1MB Read more

Procesamiento Digital Tarea 2

3 0 1MB Read more

Procesamiento Digital Senales

14 2 191KB Read more

Author / Uploaded
yony_pastrana

Citation preview

Procesamiento digital de im á ge ne s y te x t o

Procesamiento digital d e i má ge ne s y te xto

Autores: José Luis Villarreal Benítez Rafael Montante López Lizbeth Heras Lara

ÍNDICE 1. Procesamiento digital de texto .....................................................................................1 1.1 Introducción ............................................................................................................1 1.2 Procesamiento electrónico de texto ........................................................................2 1.2.1 Captura digital de texto...................................................................................3 1.2.1.1 Captura tradicional .................................................................................3 1.2.1.2 Medios ópticos ........................................................................................3 1.2.1.3 Reconocimiento óptico de caracteres.....................................................5 1.2.1.4 Medios sonoros ......................................................................................6 1.2.2 Editores de texto plano....................................................................................7 1.2.3 Visualizadores de texto ...................................................................................8 1.2.4 Despliegue gráfico de caracteres ....................................................................9 1.2.5 Metafiles........................................................................................................11 1.3 Manipulación y acceso electrónico del texto........................................................11 1.4 Arquitectura de la información..............................................................................12 1.5 Cifrado (Encriptamiento y firmas digitales.............................................................13 1.6 Análisis de información textual.............................................................................14 2. Procesamiento digital de imágenes ............................................................................15 2.1 Introducción ..........................................................................................................15 2.2 Componentes de un sistema de procesamiento de imágenes................................17 2.2.1 Sensores ........................................................................................................17 2.2.2 Almacenamiento...........................................................................................18 2.2.3 Aplicaciones científicas y comerciales.........................................................18 2.3 Color......................................................................................................................18 2.3.1 El modelo RGB..............................................................................................19

2.3.2 El modelo HLS ..............................................................................................20 2.3.3 Paletas de colores .........................................................................................20 2.4 Dithering ....................................................................................................................20 2.5 Texturas ......................................................................................................................20 2.6 Formatos de archivos de imagen................................................................................21 2.7 Compresión de imágenes ...........................................................................................23 2.8 Síntesis y análisis de imágenes ...................................................................................23 2.9 Procesamiento digital de la imagen............................................................................23 2.10 Identificaión y protección de información multimedia ............................................34 2.11 La oficina del futuro .................................................................................................34

Procesamiento digital de imágenes y texto

1. PROCESAMIENTO DIGITAL DE TEXTO

1.1 Introducción En un mundo donde cada vez se vuelven más accesibles las tecnologías en multimedios, muchas de las decisiones diarias de los individuos, involucran el uso de software y hardware computacionales, pues éstos ofrecen vías alternativas para acceder y desplegar información presentada generalmente mediante texto e imágenes. La información puede mostrarse de dos maneras: a través de sistemas de acceso no lineales (o no secuenciales), como el hipertexto (acceso en orden no secuencial, similar a los procesos cognitivos humanos, Bush, 1945; Shneiderman, 1989); o de forma secuencial, la cual es la forma tradicional en la que se han manejado los textos. De igual forma, la información se presenta principalmente como datos textuales o datos pictóricos. La diferencia fundamental radica en el proceso de interpretación, es decir en la semántica o significado de la información que está codificada (representada) visualmente o textualmente. Los datos textuales incorporan elementos discretos o unidades fácilmente discernibles y entendibles (como letras, palabras, enunciados); mientras que los datos no estructurados como las imágenes, requieren de cierta interpretación o análisis (una obra pictórica de algún pintor famoso). Por ejemplo en la imagen de la figura 1, se puede observar que en la zona del texto es comprensible la información, en cambio donde se encuentran las imágenes con jeroglíficos y el cuadro de Picasso, no resulta tan sencillo determinar lo que se trata de expresar.

Figura 1. Interpretación e información de las imágenes.

1

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Como el texto es básicamente un medio secuencial, cada frase es fácilmente reconocible y secuencialmente espaciada; no obstante en las imágenes estas unidades semánticas no son fácilmente reconocidas, además de que no están estructuradas y separadas de forma inmediata; por lo tanto la unidad semántica es la imagen en sí. Sin embargo, es esta característica la que permite a las personas reconocerlas y entenderlas más rápido que al texto. Actualmente, en las computadoras se producen documentos con texto, imágenes, sonido o video; lo que en cómputo es conocido como multimedios. Las computadoras personales cuentan con herramientas que permiten generar y organizar la información de forma simple, con resultados similares a los de un trabajo profesional. La única limitante es su creatividad y el buen manejo de la información que se desea poner disponible para medios digitales. En este manual se explicarán las ideas más relevantes sobre el uso de texto e imagen en medios electrónicos, además de las herramientas disponibles en una computadora de escritorio convencional. En principio se estudiará el proceso para introducir y presentar información a través de texto, después se analizará lo que se puede realizar con las imágenes, con objeto de presentar las herramientas conceptuales y técnicas utilizadas en la producción de documentos que combinen texto e imagen.

1.2 Procesamiento electrónico de texto El procesamiento electrónico de texto implica cuatro pasos básicos que son realizados de forma transparente para el usuario en algunos paquetes; no obstante vale la pena distinguirlos con objeto de entenderlos a un nivel más técnico, éstos son los siguientes: 1. Captura del texto y edición del contenido. El texto se introduce en la computadora para guardarlo y posteriormente realizar las tareas de corrección, borrado y ampliación de éste. 2. Al texto capturado se le aplica formato, en líneas de igual longitud y páginas de cierto tamaño. 3. El texto generado es desplegado sobre el monitor de la computadora. 4. Se accede a la información con la finalidad de elegir la salida final de ésta, ya sea a un dispositivo de producción como la impresora (papel, acetatos), Web, archivos en disco y microfichas, por mencionar algunos. Para un mejor entendimiento se abordan estos cuatro pasos y se presentan las herramientas tanto conceptuales como técnicas, comunes para el trabajo en las computadoras personales. Así mismo, se cubren otros aspectos importantes, que no pueden dejar de considerarse cuando se trabaja con medios electrónicos; como son la seguridad en Internet y la organización de las grandes cantidades de información manejadas en los medios electrónicos hoy en día.

2

Procesamiento digital de imágenes y texto

1.2.1 Captura digital de texto 1.2.1.1 Captura tradicional El uso del teclado constituye todavía la forma habitual de generar documentos, para ello se emplea software que captura el alfabeto y los símbolos básicos de la comunicación verbal. Estos caracteres son codificados mediante el código ASCII1; además estas herramientas de software al ser muy sencillas le permiten al usuario capturar la secuencia de caracteres para formar palabras, frases, párrafos, etcétera, y poder modificarlos en sus estructuras básicas; siempre a través del teclado y de forma directa (borrando caracteres, escribiéndolos y copiándolos dentro del documento, entre otras funciones básicas). 1.2.1.2 Medios ópticos Una herramienta utilizada cada vez con mayor frecuencia y que de hecho es muy eficiente para generar documentos impresos en papel, es la de capturar la información como una imagen por medio de un escáner. Este dispositivo interpretará el documento como una imagen, a la cual tratará de reconocer estructuras del documento (secciones de texto, imágenes, regiones de texto agrupadas por columnas), al tiempo de identificar los diferentes caracteres y convertirlos a código ASCII para su manipulación posterior. El escáner es un dispositivo que usa un equipo especializado para sensar o “detectar” la luz reflejada por un documento, cuando éste es explorado o “escaneado”. Después de realizar el sensado, el patrón de luz se traslada a una señal digital que es manipulada por software especializado. Como se sabe, los escáners son periféricos populares para las computadoras pues permiten tomar cualquier imagen o texto de un papel, para posteriormente colocarlo en un archivo donde puede ser transformado por aplicaciones de manipulación de imágenes o dentro de un procesador de palabras. El escáner tradicional es el de cama plana y funciona como una fotocopiadora (figura 2). Los modelos típicos que poseen un espacio de captura mayor al de una hoja tamaño carta, logran imágenes con resoluciones de alrededor de 600 puntos por pulgada (dpi), aunque ya son comunes los escáners de 1200 dpi.

1

ASCII son las siglas de

“American

Standar Code for Information Interchange ” o Código Estándar Americano para

Intercambio de Información.

3

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Figura 2. Esquema de un escáner de cama plana.

Otro de los tipos de escáner más comunes es aquél que contiene un dispositivo alimentador de hojas; en éste, el papel es alimentado dentro del dispositivo a través de un rodillo mecánico (figura 3). Estos escáners son generalmente pequeños y están limitados a un grosor específico de la hoja, soportada por el rodillo.

Figura 3. Escáner con alimentador de hojas.

No obstante las anteriores precisiones, se sugiere tomar en cuenta las siguientes recomendaciones al elegir un escáner: • Para imágenes y trabajo en Web es deseable un escáner a colores, pero para altos volúmenes de reconocimiento de caracteres, resultan bastante adecuados los que manejan tonos de grises o blanco y negro. • Las resoluciones típicas abarcan desde los 200 dpi, 300 dpi, 400 dpi y hasta los 600 dpi; pero si requiere trabajos de alta calidad de impresión en color, lo ideal son 600 dpi, en adelante. Para páginas Web, se necesitan 200, 300 o 400 dpi; mientras que para procesar documentos por medio de un OCR (Reconocedor Óptico de Caracteres) es indispensable tener al menos 300 dpi.

4

Procesamiento digital de imágenes y texto

• Para volúmenes de captura grandes, son fundamentales los puertos de comunicación rápidos; de preferencia un SCSI2, aunque el puerto paralelo es suficiente para la mayoría de las aplicaciones; no obstante, es importante contar con el software adecuado para las plataformas correspondientes. • Para trabajos continuos, se deben usar de preferencia alimentadores automáticos de hojas. 1.2.1.3 Reconocimiento óptico de caracteres Las imágenes digitales con letras o caracteres se dibujan a través de la iluminación de pixeles dentro de una imagen, por lo tanto, no son elementos aislados y predefinidos que puedan ser utilizados como letras. En ese sentido, para que una computadora los interprete como letras, se necesita un reconocedor óptico de caracteres OCR, por sus siglas en inglés, (Optical Character Recognition). En una aplicación que utiliza OCR, primero se debe capturar el texto como una imagen digital. En la figura 4 se muestra un ejemplo de la captura de texto como una imagen.

Figura 4. Ejemplo de captura de texto, mediante un OCR.

2

SCSI, son las siglas de “Small Computer System Interface ”, un estándar de dispositivos, caracterizado porque su hardware

se comunica a altas velocidades.

5

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Posteriormente en la figura 5, se observa la salida del texto a partir de una imagen, mediante el uso del OCR. En esta figura se aprecia como el texto que aparece dentro del marco punteado en la figura 4, es reconocido por el OCR.

Figura 5. Ejemplo de reconocimiento de caracteres.

1.2.1.4 Medios sonoros La tecnología para el reconocimiento de voz ha avanzado tanto, que en nuestros días existen aplicaciones de uso comercial mediante las cuales se puede capturar la voz de un individuo y descifrar su discurso en tiempo real, con la finalidad de tomar un dictado electrónico, entendido como la de captura texto a través de un dictado a la computadora. Los requerimientos de este sistema contemplan el uso de una tarjeta de captura de audio (tarjeta de sonido), un micrófono y un software especializado que realice el procesamiento de la voz (figura 6).

Figura 6. Sistema de captura de texto por medio de la voz.

6

Procesamiento digital de imágenes y texto

Esta técnica en la actualidad ha evolucionado gracias a los avances en el procesamiento digital de voz, las cuales permiten que estas aplicaciones sean eficientes hasta en un 99%. La desventaja de estos métodos es que el usuario debe capacitarse en el uso del programa de reconocimiento de voz, con el propósito de que éste reconozca algunas características de la voz del usuario, como la tonalidad y la rapidez con la que dicta. 1.2.2 Editores de texto plano Los editores de texto plano son herramientas de software que permiten capturar y modificar secuencias de caracteres en su presentación o formato más simple, generalmente en código ASCII. El formato ASCII es un código estándar que facilita representar y transferir texto, sin embargo, su gran generalidad lo lleva a muchas limitaciones como es el hecho de que los fonts o fuentes usadas estén determinadas por una terminal de tipos3, situación que favorece que cualquier plataforma pueda desplegar los caracteres ASCII directamente. Algo sumamente útil es que el código ASCII (figura 7) resulta muy compacto y fácil de almacenar, además de que es independiente de las aplicaciones y las plataformas, por lo que prácticamente cualquier aplicación de texto, acepta formatos ASCII.

Figura 7. Cuadro de caracteres ASCII.

Lo más conveniente es usar el código ASCII sin desplegarlo directamente, únicamente se debe interpretar y usar representaciones gráficas más elaboradas. HTML es un ejemplo en el cual el texto que se introduce en una página web es elaborado con caracteres ASCII, los cuales no son desplegados tal cual, sino que los browsers o navegadores tienen un programa intérprete que revisa cada una de las sentencias o enunciados del HTML con objeto de dar formato a cada caracter, lo cual hace posible observar caracteres acentuados, en negritas o cursiva y de diferentes tamaños.

3

Una terminal de tipos es aquélla que contiene solamente una forma o caracter predefinido.

7

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Otro nivel de trabajo corresponde al uso de programas para dar formato al texto, que son alimentados con caracteres ASCII junto con instrucciones para secuencias (palabras, párrafos, páginas, entre otros), y que además permiten modificar la apariencia en el despliegue gráfico. Los principales son TeX (Knuth) y LaTeX (Lamport). Aunque estos sistemas generan texto de alta calidad gráfica requieren de un entrenamiento especial sobre su lógica para dar las instrucciones, al igual que de una lista de comandos y macros. Estos paquetes se utilizan ampliamente en los ámbitos académicos, pues son muy poderosos cuando se desea representar ecuaciones matemáticas y símbolos especiales. De igual forma reciben texto plano (ASCII) y generan una salida de éste con los formatos y las fuentes o fonts, indicados por el usuario a través de los comandos y macros. Es conveniente señalar que para producir un documento de entrada, previamente se debe editar en un programa de edición de texto plano; o sea, sin ningún caracter especial. El documento de salida puede verse con una herramienta especial, pues está considerado un archivo dependiente de los dispositivos en los que se genera. Para producir una versión estándar deben utilizarse otros programas que acompañan a estos paquetes, con la finalidad de generar un archivo postscript o pdf (de Acrobat); los cuales son sumamente populares y utilizados para el intercambio de documentos a través de Internet. El PostScript es un lenguaje de programación optimizado para las impresoras gráficas y de texto; de ahí que se le conozca como un lenguaje para la descripción de páginas. Introducido por Adobe en 1985, fue utilizado para darle las instrucciones a la impresora Apple LaserWriter. Sus archivos son independientes de los dispositivos de impresión o sea que la imagen que contiene el archivo (textos con fuentes gráficas o imágenes), es descrita sin referencia a ningún dispositivo específico (por ejemplo, la resolución de la impresora), de tal forma que cualquier impresora que entiende PostScript imprime la imagen sin modificaciones. Actualmente, se ha vuelto muy popular el formato PDF (también de Adobe); pues en éste ha mejorado la calidad de los fonts o fuentes gráficas de las letras y se han incorporado nuevas tecnologías compatibles para el Internet, que ofrecen la posibilidad de construir hiperligas dentro de un documento PDF o incluir videos. Adobe cuenta con herramientas para generar esta clase de documentos pero no son gratis; sin embargo, muchos otros sistemas (como TeX y LaTex) pueden producir estos textos. La herramienta para verlos es de dominio público y se llama AcrobatReader. 1.2.3 Visualizadores de texto Una vez que el texto fue capturado y se le dio formato para que aparezca en una disposición específica, es necesario usar una herramienta de despliegue de texto que permita verlo con calidad gráfica (que se dibujen en la pantalla o monitor, las fuentes o fonts indicados, entre otras cosas).

8

Procesamiento digital de imágenes y texto

Estos visualizadores de texto son específicos para los sistemas en los que hayan sido generados, por ejemplo, si el texto se creó con AcrobatWriter, éste generará un archivo .pdf que puede ser leído con el AcrobatReader; en cambio, si al texto se le dio formato con LaTeX, se originará un archivo .ps, que podrá leerse con un visualizador de PostScript como es Ghostview (figuras 8 y 9).

Figura 8. Interfaz gráfica de Acrobat Reader.

Figura 9. Interfaz gráfica de Ghostview.

Es importante destacar que muchos de los procesadores de palabras realizan funciones relacionadas con el procesamiento de texto, desde la captura y edición, hasta el despliegue; de tal forma que desde el inicio lo que uno escribe aparece cuando se está capturando y se ve en el monitor, y finalmente tal como saldrá en cualquier otro dispositivo de salida; en este caso, una impresora. Tal es el caso de los procesadores de texto, como Word, WordStar, etcétera. 1.2.4 Despliegue gráfico de caracteres Cuando se traza o dibuja una letra sobre el monitor o en la impresora, la computadora debe conocer la manera de representarla, considerando el hardware disponible y las especificaciones del tipo de letra y fuente. Los monitores e impresoras de alta definición pueden incluir caracteres más variados y de apariencia atractiva. Un tipo es una familia de caracteres gráficos donde usualmente se incorporan muchos tipos de tamaños y estilos; mientras una fuente es una colección de caracteres de un solo tamaño y estilo que pertenece a una familia particular de tipos. El tamaño de los tipos usualmente se expresa en puntos (un punto es equivalente a 0.0138 pulgadas); por su parte, los estilos de fuentes típicos son las negritas y las itálicas; mientras que helvéticas, times y courier corresponden a los tipos de letras.

9

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Así, times 12pt itálica es una fuente o font, término usado comúnmente en el ámbito de la computación en lugar de tipo. Debido a que las fuentes en PostScript definen cada caracter en términos de descripciones matemáticas (curvas de Bezier), cada uno de éstos puede ser escalado fácilmente; a diferencia de la antigua forma donde cada tamaño de caracter de cada fuente era almacenado en cuadros (o tablas) como mapas de bits. Las fuentes poseen varios atributos como son código, familia, serie, forma y tamaño; por ello se dará una breve explicación de cada uno de estos términos: • Los atributos para el código especifican el layout o configuración de los caracteres dentro de la fuente. • La familia denota un conjunto básico de propiedades, así una familia de fuentes sería la sans serif. • La serie se refiere al peso (qué tan negritas son) y amplitud de los caracteres; existen ultralight, normal, ultrabold (para el peso) y ultracondensada, medium, ultraexpanded (para la amplitud); entre otras y sus intermedios. • La forma de la fuente comprende las características de apariencia, es decir, si son itálicas, inclinadas, normales o mayúsculas pequeñas. • El tamaño de las fuentes se refiere a los puntos que miden de alto los caracteres y generalmente van de 5pt a 28.88pt. En la figura 10 se muestran algunos de los diferentes tipos que se manejan en una aplicación:

Figura 10. Ejemplo de diferentes fuentes en una aplicación.

10

Procesamiento digital de imágenes y texto

PostScript es un lenguaje de programación bastante funcional para la representación de gráficas en dos dimensiones, en páginas destinadas a impresión o despliegue en monitores. Este lenguaje de descripción de páginas ha tenido varias revisiones a lo largo de 16 años desde su implementación; estas versiones se conocen como PostScript Nivel I, Nivel II y Nivel III. Así mismo, existen otros formatos de descripción de páginas dentro de la familia PostScript: i) PostScript encapsulado (EPS), ii) Formato de documentos portables (PDF), iii) Formato de intercambio de archivos en PostScript encapsulado (EPSI y EPSF), y iv) Formato para la creación de gráficos de precisión (PGML). i)

PostScript encapsulado (EPS), permite incluir una página PostScript dentro de otra; pues no contiene definiciones específicas de la página.

ii)

Formato de documentos portables (PDF), es un formato de Adobe y se ha convertido en el estándar para la distribución de documentos electrónicos en el Web.

iii) Formato de intercambio de archivos en PostScript encapsulado (EPSI y EPSF), es un estándar de EPS con una imagen en mapa de bits. iv) Formato para la creación de gráficos de precisión (PGML), es una representación vectorial de imágenes en XML para el Web. 1.2.5 Metafiles Los sistemas para la producción de documentos ya no se limitan al texto y actualmente son verdaderas herramientas multimedios que permiten la inclusión de texto, imágenes fijas, gráficos y videos; además de ligar electrónicamente los documentos. Para estandarizar los formatos de los documentos y aprovechar el poder de los procesadores de texto (documentos complejos), junto con las herramientas que producen los diferentes elementos que pueden ser incluidos en estos documentos, se usan los metafiles. Un metafile es una lista de comandos que puede ser ejecutada para trazar una gráfica. Típicamente, un metafile contiene comandos para dibujar objetos (líneas, polígonos, texto) y para controlar el estilo que toman éstos. Uno de estos comandos favorece el despliegue de un bitmap (ver formatos de imágenes digitales). Uno de los metafile más usado es el de Windows (WMF file) que trabaja las imágenes a 16 bits; y el metafile mejorado (enhanced metafile) que permite el uso de 32 bits para las imágenes.

1.3 Manipulación y acceso electrónico del texto Cuando se cuenta con documentos digitales, las potencialidades de manipulación de esta información son muchas. Al material electrónico se puede acceder de muy diversas formas, no sólo

11

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

de manera secuencial; también puede ser clasificado automáticamente y ser usado por un público más amplio a bajos costos y de forma rápida. En realidad, el texto y otros medios en forma digital constituyen una base de datos que sólo dependen del sistema utilizado para organizar la información. Un modo sencillo de hacer esto lo representan las hiperligas y los indexadores. El hipertexto es un tipo de sistema de base de datos especial, en donde los objetos (texto, imágenes fijas, música, etcétera) pueden ser ligados creativamente, cada uno con otro. Así, cuando se selecciona un objeto, se pueden ver todos los demás ligados a éste. El ícono seleccionado para ver los objetos asociados se conoce como liga de hipertexto o botón. Estos sistemas también son muy útiles para organizar documentos dispares y navegar eficientemente en el Web. El hipertexto en ese sentido, es el principio del acceso no lineal a los documentos. En la figura 11 se puede observar que las palabras subrayadas del lado inferior izquierdo tienen la función de hiperligas.

Figura 11. Hiperligas en un texto HTML.

1.4 Arquitectura de la información La información en un sistema lineal se organiza para acceder a ella en una jerarquía fija y desplegarla en un orden secuencial fijo; de esta forma, los usuarios siempre deben progresar

12

Procesamiento digital de imágenes y texto

mediante niveles o ventanas en un orden predeterminado. En contraste, los sistemas no lineales están basados en la tecnología de hipertexto, con objeto de acceder a la información y presentarla en un orden no secuencial sin restricciones para seguir una ruta predefinida, debido a que las ligas no lineales o hiperligas permiten navegar a través de referencias cruzadas o pantallas referenciadas (nodos) en cualquier momento. Así, el usuario según sus necesidades puede ir de una ventana a otra sin pasar por los niveles previos o subsecuentes.

1.5 Cifrado (encriptamiento) y firmas digitales Los documentos electrónicos y su intercambio mediante Internet, día con día ganan espacio en las transacciones comerciales y legales; por ello, se hacen necesarias las herramientas de autentificación de documentos electrónicos y su cifrado (encriptamiento) para la confidencialidad; acción que se lleva a efecto por conducto de las firmas digitales y los programas de codificación de textos. Las herramientas de seguridad mencionadas pueden proteger tanto texto como imágenes, éstas últimas en particular son protegidas con marcas de agua y técnicas de cifrado. En la actualidad se encuentra ampliamente disponible la tecnología para interceptar cualquier dato transmitido sobre la red, o conseguir acceso a archivos residentes en computadoras conectadas a la red. Las leyes para proteger a los usuarios de la red sobre el uso inadecuado y abuso de la información, aún resultan ambiguas e insuficientes y probablemente nunca alcancen a la carrera tecnológica para resguardar los contenidos y los derechos de autor, así como para evitar los abusos o violaciones a la privacidad de la información. La opción existente es la de usar adecuadamente la tecnología y las herramientas de protección, con objeto de disminuir los riesgos presentes en relación con el uso incorrecto de nuestra información y emplear las leyes para protegerse. Mediante un programa como PGP (Pretty Good Privacy), es posible enviar un archivo con la seguridad de que únicamente el autor podrá descifrarlo y usarlo; pues aunque sea interceptado, será inútil para cualquier otra persona. Este archivo cifrado (encriptado) solo podrá estar disponible con la autorización del autor. Esta técnica se usa para archivos de texto, audio, imágenes fijas o videos y videojuegos. También es posible manejar llaves públicas (PKP, Public Key Partners) para el descifrado (desencriptamiento); esta técnica lo que garantiza es que si se recibe un documento (un correo, por ejemplo) y se tiene la llave pública, existe la certeza de que fue enviado por el dueño de esta llave, de forma tal que este sistema representa una forma segura de autenticación de la información.

13

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

1.6 Análisis de información textual Los textos o documentos cada vez son más complejos por sus dimensiones y por la facilidad de acceder a grandes cantidades de información. En ese sentido, las técnicas de visualización o formación de imágenes que estructuran esta información se vuelven sumamente útiles. La visualización de documentos textuales o colecciones de éstos constituye una tecnología emergente en la cual se trata con tres tendencias: el Internet (Web), las bibliotecas digitales y las comunicaciones avanzadas. Esta técnica puede ser utilizada para analizar textos o colecciones de documentos muy estructurados, como los códigos de un programa de software; poco estructurados, como una colección de correos electrónicos; o nada estructurados, como los documentos históricos.

14

Procesamiento digital de imágenes y texto

2. PROCESAMIENTO DIGITAL DE IMÁGENES

2.1 Introducción Las imágenes fijas o simplemente imágenes, se generan en las computadoras mediante dos formas: mapas de bits (bitmaps o gráficos pintados o imágenes raster —figura 12—), o trazos de vectores (imágenes vectoriales —figura 13—).

Figura 12. Imagen raster.

Figura 13. Imagen vectorial.

Los bitmaps son usados para imágenes de fotorrealismo y cuando se desea elaborar trazos complejos que requieren detalles finos; mientras que los trazos con vectores se emplean para describir objetos a través de líneas, cajas, círculos, polígonos y otras formas gráficas que pueden ser expresadas matemáticamente haciendo uso de ángulos, coordenadas y distancias. Una imagen raster o bitmap es una matriz de información simple (con renglores y columnas) que describe los puntos individuales, considerados como los elementos más pequeños dados por la resolución del monitor de la computadora (u otro dispositivo de salida gráfica) y por lo tanto, la unidad fundamental de la imagen, la cual es llamada pixel.

15

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Para representar una imagen monocromática (blanco y negro o tonos de grises) en la computadora, se requiere de una matriz (un arreglo de números de dos dimensiones, o sea, varios renglones de datos, en donde sus elementos pueden ser localizados por su posición dentro de los renglones y las columnas), así a cada elemento de la matriz le corresponde un pixel. El valor de cada elemento es una tonalidad en una escala de grises, en donde el rango de valores de estos pixeles, puede estar entre 0 y 255. Para representar este rango de valores en la computadora son necesarios 8 bits. En caso de que una imagen sea solamente blanco y negro, será necesario 1 bit, el cual indicará con un 0 si el pixel es negro y con 1 si el pixel es blanco. Esto es típico en imágenes en donde únicamente exista texto, como en el caso de un fax. Cuando se quiere representar una imagen en color, es necesario contar con tres matrices, una para cada color básico (rojo, verde y azul). También es posible contar con una matriz y una serie de consideraciones, para las cuales será necesario poseer tablas de colores o mejor conocidas como paleta de colores, en donde la cantidad de bits para generarlas, será lo que determine la cantidad de colores de la imagen, por ejemplo, si se usan 4 bits solamente podrán generarse 16 colores, con 8 bits 256 colores y en el caso de 24 bits se producirán 16 millones de colores. La imagen de la figura 14 muestra un ejemplo, para entender como varía la calidad de una imagen conforme se modifica la cantidad de bits para representar un tono de un pixel, en escalas o tonos de grises.

Figura 14. Imágenes que muestran la calidad visual al variar el número de bits. (a) bits=8, (b)-bits=6, (c) bits=4, (d) bits=1.

16

Procesamiento digital de imágenes y texto

Existen tres formas básicas para crear un bitmap: 1. A partir de un proceso en el cual se copia y pega una imagen realizada previamente en alguna aplicación, para esto es necesario utilizar un programa de dibujo. 2. Eligiendo un bitmap de una ventana en la computadora activa, con un programa capturador de ventana y pegando éste en un programa de dibujo o en una aplicación. 3. Capturando un bitmap de una fotografía, trabajo artístico o una imagen de televisión, mediante un escáner o dispositivo de captura de video y realizando la digitalización de la imagen.

2.2 Componentes de un sistema de procesamiento de imágenes El desarrollo de nuevas tecnologías de cómputo favorece el uso de imágenes donde se automatice su adquisición, procesamiento, manejo y distribución a gran escala. Las tecnologías que mayor impacto han tenido en el trabajo con imágenes son las siguientes: • Dispositivos para la captura de imágenes, como los escáners de alta resolución y las máquinas de faxes. • Medios de almacenamiento ópticos de alta densidad, que resultan baratos y seguros. • Monitores e impresoras a color de alta resolución, como los monitores de 1024 x 1024 pixeles y 224 tonos de colores, cada vez más comunes. • Dispositivos para comunicaciones de gran ancho de banda, principalmente las tarjetas de red y la fibra óptica; así como la mayor disponibilidad de satélites. • Procesadores más poderosos, además de grandes memorias de acceso aleatorio veloces y con latencias muy pequeñas en su velocidad de respuesta. • Dispositivos de hardware especializados en gráficos e imágenes para tareas muy diversas. 2.2.1 Sensores El procesamiento digital demanda la obtención de imágenes en forma de señales eléctricas, las cuales son digitalizadas mediante una secuencia de números que pueden ser procesados en una computadora; para ello, existen varias formas de convertir imágenes en números digitales. La tecnología de sensores de imágenes se ha basado principalmente en los arreglos de semiconductores; siendo el más común, el arreglo de fotodetectores o CCD (del inglés, Charge Coupled Device). Este dispositivo contiene un gran número de elementos fotosensibles, así, durante la fase de acumulación cada elemento colecta cargas eléctricas que son generadas por la absorción

17

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

de fotones; siendo proporcional a la iluminación. En la fase de read-out, las cargas son transportadas secuencialmente a través de un chip de sensor a sensor y finalmente convertidas en un voltaje eléctrico. 2.2.2 Almacenamiento Las imágenes contienen grandes cantidades de datos, por ejemplo, una imagen estándar de una cámara de 35mm que mide 24mm x 36mm y que tiene una resolución de 0.01mm, tiene más de 10x7 puntos de datos. Cada punto necesita varios bits para resolver los diferentes niveles de grises (256, 8 bits=1 byte) de una imagen; necesitando 10 Mbytes. Una imagen en color requiere tres veces más espacio, ya que se deben almacenar tres canales de color (RGB). 2.2.3 Aplicaciones científicas y comerciales Como las imágenes no están restringidas a la luz visible y los sensores son sensibles en el espectro electromagnético, desde la radiación gamma hasta las ondas de radio, las aplicaciones cubren un espectro muy amplio. Las computadoras permiten mezclar esta información para generar imágenes en tonos de grises o en colores.

2.3 Color La luz puede ser entendida en dos formas diferentes, como ondas y como flujo de partículas sin masa o fotones moviéndose a una velocidad constante. Este concepto es básico en física; sin embargo, para el estudio de imágenes digitales, la característica más importante de la luz es su color; explicado por la primera interpretación que hace referencia a la luz como onda. La luz visible al ojo humano representa una pequeña parte del espectro electromagnético, pues éste incluye las ondas de radio, la luz ultravioleta, infrarroja, rayos X y otros tipos de radiación. Las propiedades más importantes de la luz son: su frecuencia f, la longitud de onda lambda y su velocidad (3x10.10 cm/s). Tanto la velocidad de la luz como la longitud de onda cambian dependiendo del medio donde se muevan; sin embargo, la frecuencia permanece constante. Por ello, se relaciona al color con la longitud de onda; la luz visible va de 400 nm a 700 nm, una longitud de onda de 420 nm corresponde a un violeta puro, mientras que 620 nm es percibido por el ojo como un rojo puro; de esta forma, la luz que percibe el ojo humano es una mezcla de varias longitudes de onda con alguna de ellas dominante. Los colores más visibles para el ojo humano son el violeta (390–430 nm), el azul-violeta (460–480 nm), el cian, el verde (490–530 nm), el amarillo (550–580 nm), el naranja (590–640 nm) y el rojo

18

Procesamiento digital de imágenes y texto

(650–800 nm). La luz blanca es una mezcla de todas las longitudes de onda sin dominancia de alguna; mientras que los tonos grises incorporan una mezcla de todas las longitudes, pero a bajas intensidades. Para la representación de estos colores en un dispositivo de cómputo se emplean modelos que consideran los tres parámetros más importantes de la luz. De esta forma, los dispositivos de despliegue gráficos usan el modelo RGB (rojo, verde, azul), mientras que en la industria de la impresión se utiliza el CMYK (cian, magenta, amarillo, negro) y los artistas generalmente manejan el modelo HLS. La luz puede ser descrita si se especifica su matiz de color (hue), la saturación y la luminancia. El matiz del color representa su longitud de onda dominante; la luminancia se relaciona con la intensidad de la luz; y la saturación se define a través del porcentaje de la luminancia que reside en la longitud de onda principal (cuando no hay una longitud de onda dominante, la saturación es cero y la luz es blanca). 2.3.1 El modelo RGB Un color o matiz primario es una tonalidad en el modelo correspondiente que no puede ser generado a partir de otros colores usados en el modelo. En ese sentido, los colores primarios son la base para crear nuevos tonos con base en sus mezclas. Cualquier color generado a partir de la mezcla de dos tonos primarios es un color secundario. En el modelo RGB (figura 15), los colores primarios son el rojo, verde y azul, mientras los secundarios son el magenta (rojo + azul), el cian (azul + verde) y el amarillo (rojo + verde). Los monitores CRT (tubo de rayos catódicos) usan el modelo RGB para crear los diferentes colores por emisión de luz de fósforos de tres diferentes tipos; posteriormente los colores se mezclan en el ojo humano y dan la apariencia de una combinación perfecta; ya que los conos en el ojo son muy sensibles a estos colores.

Figura 15. Gama de colores del modelo RGB.

19

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

2.3.2 El modelo HLS Este modelo fue introducido por Tektronics en 1978 y define su nombre a partir de los tres parámetros que considera; el color (hue), la luminancia (cantidad de negro en el color) y la saturación o croma, (cantidad de blanco). 2.3.3 Paletas de colores Para los sistemas con 256 colores que emplean 8 bits para representar el color de un pixel, la computadora usa una paleta o cuadro de búsqueda de colores (color lookup table, CLUT) con objeto de especificar cuál de los 256 colores fuera de los millones posibles, está disponible para la aplicación que lo demande en cualquier momento.

2.4 Dithering Una imagen trabajada en un escáner que contiene millones de colores, debe reducirse a 256 colores. Dithering es el proceso mediante el cual los valores de color de cada pixel cambian al tono más cercano parecido en la paleta blanco, mediante algoritmos matemáticos. Para generar la paleta que mejor represente una imagen particular existe el algoritmo de la media de Heckbert, el cual construye primero un cuadro tridimensional (o cubo de histograma) donde se indica qué tan probable es que algún color dado en el cubo RGB, esté en la imagen convertida. Posteriormente, se procede a subdividir este cubo de histograma (fraccionando cajas a la mitad) hasta que se han creado tantas cajas como entradas en la paleta. La decisión de dónde dividir la caja se basa en la distribución de colores dentro de ésta, pues el algoritmo intenta crear cajas con igual probabilidad en la imagen. Las entradas de la paleta son entonces asignadas para representar cada caja. Aunque existen otros métodos para generar una paleta de una imagen, el algoritmo de Heckbert está considerado como la relación idónea entre velocidad y calidad.

2.5 Texturas Otra herramienta existente en los sistemas computacionales para el procesamiento de imágenes, la constituye el uso de texturas que permiten representar la información o causar efectos especiales sobre las imágenes. Una textura es un patrón de valores de los pixeles sobre una región pequeña; que puede ser puesta sobre un objeto o superficie, además de que se reproduce en todo el objeto o sobre una parte seleccionada. Ciertos sistemas incluyen archivos de texturas típicas de madera, ladrillos, mármol y agua para incluirse en las imágenes que se deseen. En la figura 16 se muestra un ejemplo de ellas.

20

Procesamiento digital de imágenes y texto

Figura 16. Ejemplos de imágenes de texturas.

2.6 Formatos de archivos de imagen Windows usa bitmaps independientes del dispositivo DIB, (Device Independent Bitmaps) como el formato de archivos de imágenes más comunes. Sin embargo, están disponibles muchos formatos gráficos para las imágenes; es importante conocerlos para usar el formato adecuado dependiendo de la calidad que se desea conservar y el tamaño de archivo que se está dispuesto a almacenar en el disco duro. Los formatos más comunes son los siguientes: • PCX: establecido por ZsoftPC Paint Brush, es usado comúnmente por computadoras IBM compatibles. Éste es un formato que soporta 8 bits por pixel en color indexado. • BMP: es un formato utilizado en computadoras personales (PC), al seleccionarlo se debe especificar si se va a usar en MS-DOS o en Windows con resolución de 1 bit a 24 bits. • TIFF: es posible obtener imágenes monocromáticas de 8 bits o de 24 bits (color verdadero). En las imágenes de 24 bits, TIFF guarda la transparencia en un canal alfa. Para imágenes TIFF monocromáticas y de 8 bits, se pueden encontrar dos versiones de este formato, uno comprimido y otro normal. • GIF: las guarda como imágenes monocromáticas o de 8 bits (escala de grises de 0 a 256 tonos). GIF guarda todos los valores de transparencia sustituyendo un color transparente en

21

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

vez del color designado. Para no perder los datos de una imagen, se emplean los formatos TIFF o PGN para guardarla. Si se opta por el formato GIF y se desean conservar todos los datos de la imagen, se guarda una copia en otro formato antes de guardar conversiones de transparencias en formato GIF. • JPG: es un formato creado para guardar y comprimir imágenes fotográficas de 24 bits. Existen tres variantes dentro de este formato, Baseline o estándar es un formato reconocido por casi todos los visualizadores de www; Baseline Optimized optimiza la calidad de los colores pero puede producir un archivo ligeramente más grande que no es soportado por todos los navegadores de www, y el Progressive que provoca que la imagen se vaya desplegando gradualmente en una serie de pasos (el usuario define cuántos). Sin embargo, este formato es más grande en tamaño y requiere mayor memoria para verse, además de no estar soportado por todos los navegadores de www. FORMATO

EXTENSIÓN

Microsoft Windows DIB

BMP, DIB, RLE

Microsoft RLE DIB

DIB

Microsoft Palette

PAL

Microsoft RIFF DIB

RDI

Computer graphics metafile

CGM

Micrografx Designer/Draw

DRW

AutoCAD format 2D

DXF

Encapsulated PostScript

EPS

CompuServe GIF

GIF

HP Graphic Language

HGL

PC Paintbrush

PCX

Apple Macintosh PICT

PIC

Lotus 1-2-3 Graphics

PIC

AutoCAD Import

PLT

Truevision TGA

TGA

TIFF

TIF

Windows Metafile

WMF

DrawPerfect

WPG

Portable Gray Map

PGM

Portable PixMap

PPM

22

Procesamiento digital de imágenes y texto

2.7 Compresión de imágenes El manejar o procesar una imagen digital en ocasiones se convierte en una tarea difícil, pues ésta requiere de una gran cantidad de datos para representarse en una computadora. La tecnología actual posibilita generar imágenes de muy alta resolución, con el consiguiente incremento en el volumen de datos. Esta situación demanda dispositivos de almacenamiento de gran capacidad o canales de comunicación con grandes anchos de banda y desafortunadamente cualquiera de ellos está limitado, por lo que tienen que crearse técnicas de procesamiento de imágenes que favorezcan una reducción en la cantidad de datos para representar una imagen digital. La técnica para disminuir la cantidad de datos necesaria para representar una imagen digital, se conoce como compresión de imágenes. Regularmente, una técnica de compresión de imágenes trata de reducir o eliminar si es posible, la redundancia espacial en la imagen, es decir, la cantidad alta de redundancia percibida al observar en la imagen una región con la misma tonalidad o nivel de gris. De igual forma, una técnica de compresión de imágenes puede aprovechar las características estadísticas de una imagen original con la finalidad de suprimir los datos parecidos (eliminación de los datos correlacionados). El estándar de compresión de imágenes conocido como JPG fue creado por un grupo llamado JPEG (Join Photographic Expert Group), y para principios del año 2001 entrará en funcionamiento uno nuevo, denominado JPEG2000.

2.8 Síntesis y análisis de imágenes Las computadoras permiten realizar síntesis y análisis de imágenes; esto es, generarlas a partir de reglas o datos (síntesis, principalmente a través de las técnicas de graficación) o a partir de una imagen, extraer información (analizarla, principalmente a partir de las técnicas de procesamiento de imágenes).

2.9 Procesamiento digital de la imagen Frecuentemente es deseable transformar una imagen digitalizada a través de una o más operaciones sobre ésta. Estas operaciones son transformaciones geométricas (como la rotación), realce de orillas o detección de orillas y bordes, segmentación, restauración, reconocimiento de patrones, correlaciones, extracción de partes y suavizamiento selectivo, entre otras. Por otra parte, las operaciones locales de imágenes, permiten transformaciones limitadas en áreas pequeñas de la imagen, las cuales están definidas como un conjunto de vecinos de un punto dado en una imagen digital. Los puntos vecinos incluidos en un conjunto particular, se especifican en un rango de valores de x e y, alrededor del punto (x,y); por ello muchas de las operaciones en una imagen

23

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

incorporan tanto operaciones locales como de sus repeticiones, con objeto de lograr un efecto de transformación global. Una operación conveniente para cierto tipo de imágenes la constituye la representación vectorial o conjunto de segmentos de línea, en sustitución de un arreglo de pixeles; debido a que los resultados obtenidos favorecen su manipulación como objetos gráficos de forma más simple. Estos formatos también incluyen escalas de grises al asociar códigos de niveles de grises en cada segmento de línea. Los formatos vectoriales también pueden utilizar representaciones polinomiales de órdenes mayores. Segmentación. Cuando se trabaja una imagen digital, es necesario extraer la información semántica requerida —el significado de la imagen y sus partes— directamente de la representación digitalizada, por ello, se hace necesario el reconocimiento o separación de objetos. La segmentación de imágenes es una técnica de descomposición de imágenes en partes con significado para separar objetos del entorno o fondo (background) con objeto de distinguirlos e integrarlos en una descripción estructurada de la imagen original. El proceso de segmentación consiste en la identificación de las regiones de objetos o límites, que se distinguen por los cambios de contrastes en la escala de grises o las texturas; con lo que facilitan la identificación de regiones con áreas homogéneas. La segmentación por escala de grises o por texturas se utiliza para clasificar grupos de pixeles como parte de un objeto o en el fondo. Las técnicas mencionadas anteriormente forman parte del campo del procesamiento de imágenes. Éste es utilizado en diversas áreas como medicina, percepción remota, astronomía, quimica, biología, etcétera, por mencionar algunas. Regularmente el software comercial para edición y modificación de imágenes, contiene una serie de operadores que en muchos casos, realizan algunas de las técnicas básicas mencionadas en párrafos anteriores. De la misma forma existe también software más especializado, el cual está principalmente enfocado a analizar y procesar cierto tipo de imágenes, como las médicas o de percepción remota. Si bien es cierto que gran parte del procesamiento de imágenes está enfocado al ámbito científico, muchos de los operadores que contiene el software tanto comercial como público, pueden aplicarse por otra área importante, como lo es el diseño gráfico, que utiliza las herramientas del procesamiento de imágenes para darle un toque creativo y original a imágenes que pretenden lograr otro propósito que no sea la extracción de características de éstas. Es común que los diseñadores gráficos y la gente dedicada al campo de los multimedios, utilicen este tipo de herramientas para crear y manipular imágenes con fines artísticos.

24

Procesamiento digital de imágenes y texto

Dentro de las herramientas para edición y manipulación de imágenes se encuentran Adobe Photoshop (UNIX, Windows), Paint Shop Pro (Windows), Gimp (UNIX, Linux, Windows), Corel Draw (Windows), entre otros. En todos ellos existen los siguientes operadores: Transformaciones de la imagen • Crop: esta operación sirve para cortar o seleccionar una zona de interés en la imagen. • Flop: invierte la imagen en el plano horizontal, es decir, da la apariencia de ponerla de cabeza. • Flip: invierte la imagen pero ahora en el plano vertical, es decir, como si fuera el resultado de reflejarla en un espejo. • Rotate: aplica una rotación a la imagen, tomando como eje de rotación el centro de ésta o algunos de los puntos en los vértices. Realce • Hue: modifica el color de la imagen, es similar a modificar el “tinte” de ésta. • Saturation: es la cantidad de color presente en un determinado momento, por ejemplo, sirve para distinguir entre el rojo y el rosa. • Brightness: modifica la intensidad o brillo de la imagen. • Gamma Correction: la corrección del gamma se relaciona con modificar el factor de brillo y contraste, es similar a cambiar el ángulo de apertura de una lente en una cámara, mientras más grande sea el ángulo, mayor será la cantidad de luz, por tanto la imagen tendrá mayor brillo; en cambio mientras más pequeño sea el ángulo de apertura, menor será la cantidad de iluminación lo que generará una imagen oscura. • Equalize: este operador utiliza el histograma de una imagen, con la finalidad de tratar de igualar las tonalidades de la imagen, es decir, lograr que los tonos de la imagen sean más uniformes. • Normalize: efectúa una reasignación de valores a partir del valor más alto de cada banda de color; de esta manera modifica ese valor en relación con el valor más alto en la escala, para reasignar o remapear todos los demás valores de acuerdo con la que tenían originalmente. • Negative: obtiene el negativo de la imagen. El proceso es similar a tener el negativo de una fotografía. • Grey Scale : convierte una imagen de color en tonos de grises.

25

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Efectos • Emboss: realza los bordes verticales de una imagen. • Add Noise: este operador añade ruido a la imagen, es decir, modifica la imagen al agregar puntos de manera aleatoria para que éstos contrasten con la imagen. • Sharpen: permite realzar los bordes de la imagen sin que el fondo de ésta se afecte. Esta operación permite ver con mayor nitidez los bordes. • Blur: al aplicar este operador a una imagen, ésta se verá borrosa, debido a que se efectúan promedio de pixeles en una dirección, ya sea por columnas o por renglones, de manera que la imagen pierda nitidez. • Threshold: separa o realza valores especificos de la imagen, es decir, a este operador se le indica el valor de un pixel, que tendrá la función de un umbral; de esta forma los valores que se encuentren por arriba o por abajo (según sea el caso) de ese umbral, serán modificados a un solo valor, ya sea un 0 (negro) o un 255 (blanco). • Edge Detect: esta operación permite detectar bordes de una imagen, tanto horizontales como verticales. • Spread: modifica una imagen de tal forma que se aprecie como si hubiese sido creada por muchos puntos. • Shade: este operador funciona como si estuviera cambiando el punto de iluminación, realza las partes sombreadas de una imagen. Efectos especiales • Swirl: produce un efecto semejante al de un remolino, es decir, al aplicar este operador la imagen se deformará en forma de remolino. • Oil Painting: este efecto hará que la imagen se modifique y se observe como si se hubiese pintado al oleo. Vista • Zoom: esta operación le permitirá acercarse o alejarse de la imagen. Las imágenes de las figuras 17-30 muestran como una imagen original (figura 17) es afectada por algunos de los operadores mencionados anteriormente.

26

Procesamiento digital de imágenes y texto

Figura 17. Imagen de la abeja original.

Figura 18. Imagen con flip.

27

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Figura 19. Imagen negativa.

Figura 20. Imagen en tonos de grises.

28

Procesamiento digital de imágenes y texto

Figura 21. Imagen con detección de bordes.

Figura 22. Imagen con twirl (efecto remolino).

29

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Figura 23. Imagen con zoom.

Figura 24. Imagen con operador de rotación (45 grados).

30

Procesamiento digital de imágenes y texto

Figura 25. Imagen con el operador de ecualización.

Figura 26. Imagen con el operador emboss.

31

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

Figura 27. Imagen con ruido agregado.

Figura 28. Imagen con el operador blur.

32

Procesamiento digital de imágenes y texto

Figura 29. Imagen con el operador solarize.

Figura 30. Imagen con el operador de spread.

33

José Luis Villarreal Benítez, Rafael Montante López y Lizbeth Heras Lara

2.10 Identificación y protección de información multimedia Los productos multimedia circulan ampliamente en la Internet; sin embargo, el principal problema es la falta de herramientas de seguridad para proteger y certificar la propiedad de los contenidos. Esta barrera se busca superar con tres tecnologías básicas: las marcas de agua, identificación de objetos multimedia e infraestructura de seguridad para los contenidos. Las técnicas de marcas de agua ocultan información dentro de los contenidos con la finalidad de autentificar la propiedad intelectual de éstos, pues dichas técnicas recuperan datos mediante algoritmos especiales. El control de acceso para la distribución de datos a través de la red se soporta principalmente por el cifrado de datos y su relación con licencias, software y hardware especializados. Todas estas tecnologías son implementadas para los medios digitales más comunes: texto, imagen fija, video, audio y contenidos tridimensionales y holográficos; además de que también pueden combinarse para lograr objetivos específicos y hacerse más robustas.

2.11 La oficina del futuro Cada vez más las tecnologías de la información, el cómputo y las telecomunicaciones, convergen para concretar la telepresencia y la telecolaboración entre los individuos. Estas tecnologías favorecen el uso de herramientas para la producción de documentos multimedia (texto, imagen, voz, video) y la interacción entre grupos de trabajo distantes; además el surgimiento de estas tecnologías es tan acelerado, que es difícil formarse una idea futurista de los centros laborales en las proximas décadas; sin embargo, se espera que permanezcan por mucho tiempo las herramientas básicas analizadas en este manual. Por esta misma razón, es importante conocer los fundamentos del procesamiento digital de la información a través de texto, imagen, video y sonido; pues estos elementos han estado presentes en la cultura y permanecerán como las herramientas principales de comunicación del ser humano, cambiando sólo los medios de adquisición, manipulación, almacenamiento y transmisión de los mensajes. De esta forma, lo que se verá evolucionar como oficina del futuro, incluirá las herramientas aquí presentadas, pero con muchas mayores posibilidades de interacción entre éstas y los usuarios; de igual forma, la participación de varios individuos simultáneamente, con telepresencia y telecolaboración, de una forma transparente para los usuarios y con el desconocimiento de las complicaciones tecnológicas. La única limitante será el conocimiento profundo de la información y

34

Procesamiento digital de imágenes y texto

la creatividad de sus usuarios; esto incluye el empleo de ambientes de inmersión donde los usuarios tengan la sensación de encontrarse dentro de un mundo virtual en el cual accedan a todas las herramientas disponibles interactuando con el ambiente y los demás participantes (locales y en telepresencia) con las manos y otros elementos corporales (figura 31).

Figura 31. La oficina del futuro.

35

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO DR. JUAN RAMÓN DE LA FUENTE Rector LIC. ENRIQUE DEL VAL BLANCO Secretario General MTRO. DANIEL BARRERA PÉREZ Secretario Administrativo DRA. ELVIA ARCELIA QUINTANA ADRIANO Abogada General DR. JOSÉ NARRO ROBLES Coordinador General de Reforma Universitaria

DIRECCIÓN GENERAL DE SERVICIOS DE CÓMPUTO ACADÉMICO DR. VÍCTOR GUERRA ORTIZ Director General MTRA. FERNANDA MERAZ RODRÍGUEZ Subdirectora MAT. CARMEN BRAVO CHAVESTE Directora de Cómputo para la Docencia LIC. ROSARIO ORTIZ OSORNIO Subdirectora de Planeación Académica ING. SERGIO DE ALVA ARGUINZONIZ Coordinador del Centro Mascarones LIC. ALEJANDRINA SAN JUAN REYES Coordinadora del Centro de Extensión en Cómputo y Telecomunicaciones Nuevo León LIC. CECILIA MEDINA NAVARRO Coordinadora del Centro Coapa de Extensión en Cómputo y Telecomunicaciones ACT. FABIÁN ROMO ZAMUDIO Coordinador de Educación a Distancia QUIM. LAURA MATA MONTIEL Coordinadora de Infraestructura y Soporte Tecnológico ACADEMIA DE VISUALIZACIÓN CIENTÍFICA Y GRAFICACIÓN Revisión Técnica Lic. Semiramis Zaldívar Granada Revisión Didáctica DG Toña Zimerman Sonabend Jefa del Departamento de Diseño Lic. Imelda Arcelia Gutiérrez de la Torre Corrección de estilo DG Gabriela Lilí Morales Naranjo Diseño editorial DG Cristina Gispert Galván Diseño de portada Guías y Textos de Cómputo Procesamiento digital de imágenes y texto Diciembre de 2000