Deep Learning Exposicion

[Escriba aquí] UNIVERSIDAD NACIONAL DE TRUJILLO VALLE JEQUETEPEQUE INTELIGENCIA ARTIFICIAL TEMA: DEEP LEARNING DOCENTE

Views 201 Downloads 1 File size 962KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

[Escriba aquí]

UNIVERSIDAD NACIONAL DE TRUJILLO VALLE JEQUETEPEQUE

INTELIGENCIA ARTIFICIAL TEMA: DEEP LEARNING DOCENTE Ing. Mg. Tenorio Cabrera, Luis

PRESENTADO POR: Chapoñan Lalopú, Christian Pretell Quispe, Jaime Torres Zegarra, Franshesca Vásquez Albitres, Nataly

2017

DEEP LEARNING De manera formal la inteligencia artificial tiene dos denominaciones: aplicada y robusta (Strong AI). 



Inteligencia artificial robusta o Strong AI se ubica en el futuro, estaremos en ella cuando las máquinas puedan ejecutar todas las habilidades cognitivas de los humanos, algo que los expertos no consideran que pueda ocurrir en los próximos años. Inteligencia Artificial aplicada Weak AI (Narrow AI o Applied AI): aquí es donde entran el uso que hacemos a través de algoritmos y aprendizaje guiado con el Machine Learning y el Deep Learning.

El Machine Learning en su uso más básico es la práctica de usar algoritmos para parsear datos, aprender de ellos y luego ser capaces de hacer una predicción o sugerencia sobre algo. Los programadores deben perfeccionar algoritmos que especifiquen un conjunto de variables para ser lo más precisos posibles en una tarea en concreto. La máquina es entrenada utilizando una gran cantidad de datos dando la oportunidad a los algoritmos a ser perfeccionados. Desde los primeros albores de la temprana inteligencia artificial, los algoritmos han evolucionado con el objetivo de analizar y obtener mejores resultados: árboles de decisión, programación lógica inductiva (ILP), clustering para almacenar y leer grandes volúmenes de datos, redes Bayesianas y un numeroso abanico de técnicas que los programadores de data science pueden aprovechar.

1|P á g i n a

Por definición, Deep Learning es un subconjunto dentro del campo del Machine Learning, el cual predica con la idea del aprendizaje desde el ejemplo. En Deep Learning, es una técnica mejorada donde los sistemas alcanzan niveles de aprendizaje en un grado aún más detallado. En lugar de enseñarle a ordenador una lista enorme de reglas para solventar un problema, le damos un modelo que pueda evaluar ejemplos y una pequeña colección de instrucciones para modificar el modelo cuando se produzcan errores. Con el tiempo esperamos que esos modelos sean capaces de solucionar el problema de forma extremadamente precisa, gracias a que el sistema es capaz de extraer patrones. Aunque existen distintas técnicas para implementar Deep Learning, una de las más comunes es simular un sistema de redes artificiales de neuronas dentro del software de análisis de datos.

Salvando las distancias, inspiradas en el funcionamiento biológico de nuestra cerebro compuesto por la interconexión entre neuronas. En nuestro caso simplificando esa red artificial de neuronas está compuesta por distintas capas, conexiones y una dirección en la que se propaga los datos atravesando cada capa con una tarea en concreto de análisis. Se trata de proporcionar la suficiente cantidad de datos a las capas de neuronas para que puedan reconocer patrones, clasificarlos y categorizar. Una de las grandes ventajas es trabajar a partir de datos no etiquetados y analizar sus patrones de comportamiento y ocurrencia. Por ejemplo, puedes tomar una imagen como información de entrada de la primera capa. Allí será particionada en miles de trozos que cada neurona analizará por separado. Podemos analizar el color, la forma, etc.. cada capa es experta en una característica y le va asignando un peso. Finalmente, la capa de final de neuronas recoge esa información y ofrece un resultado.

2|P á g i n a

Cada neurona asigna un peso a la entrada, como un resultado correcto o incorrecto de forma relativa a su cometido. La salida estará determinada por la suma de esos pesos. Si usamos el ejemplo de una imagen con una taza podemos analizar por una lado su forma, su textura respecto al fondo, la disposición del asa, si tiene un asa, si está apoyada en una mesa, etc.. La red neuronal concluirá si es o no es una señal. A base de entrenamiento podemos concluir con mejores probabilidades de acierto en cada una de la capa.

Ahora existe tecnología suficiente y recursos para poder tener al alcance de la mano el uso de Deep Learning. Si tenéis curiosidad podéis empezar a trastear con ella con una de las herramientas liberadas por Google, TensorFlow que permiten aplicar Deep Learning y otras técnicas de Machine learning de una forma bastante potente.

Redes de neuronas Aunque existen varias maneras de implementar Deep Learning, una de las más comunes es utilizar redes de neuronas. Una red de neuronas es una herramienta matemática que modela, de forma muy simplificada, el funcionamiento de las neuronas en el cerebro. Dicho así suena bastante complicado, pero en realidad es una serie de operaciones matemáticas sobre una lista de números, que da como resultado otra lista de números. Otra forma de verlas, es como un procesador de información, que recibe información 3|P á g i n a

entrante, codificada como números, hace un poco de magia, y produce como resultado información saliente, codificada como otros números. Un ejemplo concreto sería una red de neuronas que detecte rostros en imágenes. Es muy fácil codificar una imagen como una lista de números. De hecho, ya las codificamos así en los ordenadores. Por tanto, esta red recibiría tantos números a su entrada como píxeles tienen nuestras imágenes (o tres por cada píxel si utilizamos imágenes en color). Y si la información que esperamos a la salida es que nos diga si hay un rostro o no, basta con un solo número. en la lista saliente. Podemos imaginar que si ese número, que sale de la red, toma un valor cercano a 1.0 significa que hay un rostro, y si toma un valor cercano a 0.0 significa que no lo hay. Valores intermedios se pueden interpretar como inseguridad, o probabilidad.

Campos de Aplicación Sus aplicaciones son cada vez más demandadas por el mundo empresarial, algunos campos en los que se ha desarrollado el Deep Learning son: 

Los traductores inteligentes: el que utiliza Google se vale de esta tecnología para aprender de forma similar al comportamiento humano.  El reconocimiento de voz: gracias a esta tecnología los resultados son cada vez más precisos y rápidos mejorando las búsquedas entre un 10% y 15%.  La interpretación semánticas: las máquinas son capaces de entender comentarios y conversaciones, como por ejemplo el asistente virtual de Apple: Siri.  El reconocimiento de imágenes: la tecnología permite reconocerlas y clasificarlas cualitativamente de forma eficaz. Hoy en día muchas estrategias de Marketing dependen de estos mecanismos que realizan funciones como leer Páginas Web, contestar preguntas en un chat, recomendar Sitios Web, películas o libros, entre otros. Y todas estas tareas se gestionan mediante la adquisición de datos y un análisis e interpretación posterior de los mismos. La Inteligencia Artificial avanza cada día más e interviene en muchos aspectos de la cadena de productividad dentro de cualquier negocio. No integrar este tipo de tecnologías en la estrategia empresarial, especialmente en las digitales, puede hacer que los negocios queden obsoletos respecto al mercado cada día más tecnológico. MACHINE LEARNING Y DEEP LEARNING, ¿CUÁL ES LA DIFERENCIA? Llevamos ya mucho tiempo oyendo cosas sobre el Maching Learning y el Deep Learning, pero, ¿sabemos realmente lo que es? Por supuesto, hay que destacar que esto no es algo de 2017 ni de 2016. Ni siquiera se trata de algo novedoso del s. XXI, sino más bien en la

4|P á g i n a

década de los años 50’s (solo que en aquel entonces las máquinas no eran tan potentes y por lo tanto no daban para seguir desarrollando más profundamente esta tecnología). Machine Learning El Machine Learning (Aprendizaje automático en español). Es justamente el conjunto de algoritmos que aprender por sí mismo. Es, básicamente, quien (o mejor dicho, lo que) se encarga de ‘programar’. Dentro del Machine Learning hay dos métodos. Supervised Learning El primero es lo que se conoce como Aprendizaje dirigido en español. ‘Aprendizaje supervisado’ sería una mala traducción, pues desde luego no hay nadie supervisando lo que una máquina aprende o no, sino más bien dirigiendo. Veamos con un ejemplo, la IA recibe un estímulo o ejemplo (lo que se conoce como parseo de datos). El algoritmo de Aprendizaje automático (y más concretamente de Aprendizaje supervisado) lo procesa y extrae un modelo. Con este modelo, cada vez que se introduce un nuevo dato la máquina es capaz de dar una respuesta.

Un caso práctico sería, por ejemplo, el sistema de filtrado de SPAM de Google: el usuario ayuda a identificar a Gmail cuáles son los correos electrónicos que contienen SPAM. Llegado a un determinado punto, la IA ya ha procesado tantos datos que es capaz de extraer un modelo para poder predecir con alta probabilidad de éxito cuáles de los correos que vayan entrando sean correos basura para que ni siquiera sean mostrados. Otro ejemplo más ‘visual’ es el proceso de aprendizaje por el que pasaría una IA que se dedica a reconocer qué fotografías incluyen caras (por ejemplo, para sacar una foto cada vez que se reconozca a una persona): se introducen fotografías con o sin caras para que

5|P á g i n a

la máquina sea capaz de diferenciarlas. Por supuesto cada uno de los elementos que introducimos tiene que estar etiquetado (es decir, decirle a la IA si tiene una cara o no). Unsupervised Learning Ahora, efectivamente, toca el caso del Aprendizaje no dirigido. También se le conoce como el Deep Learning (DL; Aprendizaje profundo). En este otro método de Machine Learning no se introducen ejemplos, sino que es el propio algoritmo de la máquina el que debe sacar patrones o anomalías para crear un modelo.

Pongamos ahora un caso práctico: tenemos una base de datos donde están los datos de mil personas junto con su nombre, su edad, su estado físico y sus hábitos alimenticios. Si queremos saber cuáles son los hábitos alimenticios menos saludables, tendremos que ir comparando cada uno de ellos con el estado de salud física de la persona hasta que encontremos el patrón. En este caso, más que patrón, anomalía, que sería la comida no saludable. Por supuesto este ejemplo no es verídico (es muy básico y los resultados podrían ser no siempre válidos), pues necesitaríamos también otros datos, como por ejemplo el tipo de genética de la persona o la cantidad y el tipo de ejercicio que realizan.

6|P á g i n a

En concreto el aprendizaje profundo imita el comportamiento de un sistema nervioso. En el Supervised Learning, las redes neuronales usadas se comportan de forma monolítica. Es decir, todas las neuronas artificiales se comportan de igual manera entre sí. Esto es, pueden cumplir todas las mismas funciones. En un sistema nervioso esto no ocurre así. Cada red neuronal tiene una función específica. Esto es, cada neurona (realmente cada capa) es experta en una sola característica. Pues en el Deep Learning se imita precisamente ese comportamiento. Deep Learning: la aproximación a la percepción humana Posiblemente el futuro del aprendizaje automático pase por un giro hacia el aprendizaje no supervisado. En este paradigma los algoritmos son capaces de aprender sin intervención humana previa, sacando ellos mismos las conclusiones acerca de la semántica embebida en los datos. Ya existen compañías que se centran completamente en enfoques de aprendizaje automático no supervisado, como Loop AI Labs, cuya plataforma cognitiva es capaz de procesar millones de documentos no estructurados y construir de forma autónoma representaciones estructuradas. La disciplina del aprendizaje automático está en plena ebullición gracias a su aplicación en el mundo del Big Data y el IoT. No dejan de aparecer avances y mejoras de los algoritmos más tradicionales, desde los conjuntos de clasificadores (ensemble learning) hasta el Deep Learning, que está muy de moda en la actualidad por sus capacidad de acercarse cada vez más a la potencia perceptiva humana. Posiblemente el futuro del aprendizaje automático pase por un giro hacia el aprendizaje no supervisado

En el enfoque Deep Learning se usan estructuras lógicas que se asemejan en mayor medida a la organización del sistema nervioso de los mamíferos, teniendo capas de unidades de proceso (neuronas artificiales) que se especializan en detectar determinadas características existentes en los objetos percibidos. La visión artificial es una de las áreas donde el Deep Learning proporciona una mejora considerable en comparación con algoritmos más tradicionales. Existen varios entornos y bibliotecas de código de Deep Learning que se ejecutan en las potentes GPUs modernas tipo CUDA, como por ejemplo NVIDIA cuDNN. El Deep Learning representa un acercamiento más íntimo al modo de funcionamiento del sistema nervioso humano. Nuestro encéfalo tiene una microarquitectura de gran complejidad, en la que se han descubierto núcleos y áreas diferenciados cuyas redes de neuronas están especializadas para realizar tareas específicas. 7|P á g i n a

Gracias a la neurociencia, el estudio de casos clínicos de daño cerebral sobrevenido y los avances en diagnóstico por imagen sabemos por ejemplo que hay centros específicos del lenguaje (como las áreas de Broca o Wernicke), o que existen redes especializadas en detectar diferentes aspectos de la visión, como los bordes, la inclinación de las líneas, la simetría e incluso áreas íntimamente relacionadas con el reconocimiento de rostros y la expresión emocional de los mismos (el giro fusiforme en colaboración con la amígdala). Los modelos computacionales de Deep Learning imitan estas características arquitecturales del sistema nervioso, permitiendo que dentro del sistema global haya redes de unidades de proceso que se especialicen en la detección de determinadas características ocultas en los datos. Este enfoque ha permitido mejores resultados en tareas de percepción computacional, si las comparamos con las redes monolíticas de neuronas artificiales. Hasta ahora hemos visto que la computación cognitiva se basa en la integración de procesos psicológicos típicamente humanos como el aprendizaje o el lenguaje. En los próximos años veremos como los sistemas cognitivos artificiales se expanden en múltiples aplicaciones en el ecosistema digital. Además, veremos como el aprendizaje y el lenguaje empiezan a integrarse con más funciones psicológicas como la memoria semántica, el razonamiento, la atención, la motivación y la emoción, de forma que los sistemas artificiales vayan acercándose más y más al nivel humano de inteligencia, o quizás, como ya se adelantaba en ConsScale (una escala para medir el desarrollo cognitivo), las máquinas puedan alcanzar niveles superiores a los humanos. La industria del futuro y el presente apuesta por el Deep Learning El Deep Learning nos está empujando a otra realidad en la que seamos capaces de interpretar de otra forma nuestros mundo a través del reconocimiento de imágenes, el análisis del lenguaje natural y anticiparnos a muchos problemas gracias a la extracción de patrones de comportamiento. Cosa que hasta entonces el Machine Learning que conociamos hace unos años no nos permitía. Tenemos ejemplos actuales de cada uno de ellos y los grandes de la industria del software están haciendo su apuesta de lo que será el futuro. Uno de los grandes hitos de Deep Learning se produjo en 2012, cuando el equipo de Andrew NG por aquel entonces en Google, a hora en Baidu, fue capaz de reconocer un gato entre los más de 10 millones de vídeos de Youtube. En ese momento, fue necesario 16.000 ordenadores, ahora los medios necesarios son muchísimo menos. 8|P á g i n a

La evolución sobre este tema llega a nuestros días con ejemplos como Facebook etiquetando cualquier imagen que subamos a la red social a través de su Computer Vision. De hecho, podemos probarlo con nuestras propias imágenes gracias a ciertas extensiones del navegador que simplemente exponen el texto alternativo que Facebook añade al html de la página. Pero la computer vision no se queda solo ahí. En Silicon Valley hay un montón de startups usándola, tanto para la agricultura a través de imágenes áreas analizando cultivos o para las compras por internet. Por ejemplo, desde el análisis de la ropa que lleva un famoso en una foto de revista para sugerir dónde comprar esas prendas hasta poder analizar una imagen de unas vacaciones y sugerir destinos turísticos similares.

Unas de las compras más reciente de Twitter iba encaminada al procesado de imágenes gracias al deep learning. Utilizando redes de neuronas es capaz de mejorar la calidad de las imágenes que llegan a través de un streaming, comprimiendo aún más el vídeo. El secreto: aprender cómo funcionan las imágenes y asemejar como el cerebro humano las interpreta. ¿La utilidad? Ya lo están probando en las retrasmisiones de los partidos de beisbol en algunos terminales móviles para ahorrar ancho de banda. 9|P á g i n a

La conducción autónoma de Tesla o la anunciada por Uber adaptando sus vehículos está basada en el reconocimiento de ciertos patrones de conducción, incluso la capacidad de predecir accidentes segundos antes de que se produzcan como el siguiente vídeo. La clave es analizar toda la información procedente del exterior y sintetizarla compartiéndola con la red de sistemas interconectados. Ir aprendiendo de forma colaborativa de todos los aspecto necesario para sustituir a un humano, siendo más preciso que ellos. Y Uber ya lo utiliza para optimizar los viajes que hacen sus conductores teniendo en cuenta distintas variables, más propias de la logística que del transporte urbano. Otra de las áreas donde el deep learning tiene peso es el reconocimiento de voz. Google lleva años trabajando en este campo utilizando técnicas como Long Short-term Memory Recurrent Neural Networks (LSTM RNN) para mejorar sus servicios, incluidos los que utilizando sus teléfonos móviles Android al igual que sus asistentes virtuales para poder hacer consultas en lenguaje natural, tanto al buscador como a los asistentes presentes en los dispositivos móviles.

10 | P á g i n a