Universidad Nacional del Altiplano Puno Escuela Profesional de Ingeniería de Sistemas Inteligencia Artificial (Curso Vac
Views 44 Downloads 0 File size 425KB
Universidad Nacional del Altiplano Puno Escuela Profesional de Ingeniería de Sistemas Inteligencia Artificial (Curso Vacacional 2014) Ejercicios propuestos de la Primera Unidad. Fecha: 26/02/2014 1.
Ejercicios a. ¿Qué es un axioma? b. Defina con sus palabras el concepto de “semántica” en general, asiendo hincapié en el su entendimiento de “significado de un símbolo (o signo)” c. Explique, con sus propias palabras, la semántica de sentencias en lógica proposicional. Idem para lógica de predicados. d. ¿Qué es una regla de inferencia? e. ¿Qué significa que una teoría/lógica sea decidible? f. Que puede decir sobre la veracidad o falsedad de las sentencias axiomáticas, (o simplemente axiomas)? Indique bajo qué condiciones el algoritmo de encadenamiento hacia adelante es completo. g. Construir la tabla de valores de verdad para: Muestre cada paso de su construcción
2.
Ejercicios: a) Tenemos el siguiente conocimiento directo: Pedro padece gripe. Pedro padece hepatitis Juan padece hepatitis María padece gripe Carlos padece intoxicación La fiebre es síntoma de gripe El cansancio es síntoma de hepatitis La diarrea es síntoma de intoxicación El cansancio es síntoma de gripe La aspirina suprime la fiebre El Lomotil suprime la diarrea Además podemos aportar el siguiente conocimiento inferido Un fármaco alivia una enfermedad si la enfermedad tiene un síntoma que sea suprimido por el fármaco. Una persona debería tomar un fármaco si padece una enfermedad que sea aliviada por el fármaco. Construir un programa que refleje dicho conocimiento y permita resolver las siguientes cuestiones: 1) 2) 3) 4) 5) 6) 7) b)
¿Podemos conocer qué dolencia tiene Pedro? ¿Y María? ¿Quién padece gripe? ¿Qué síntomas tiene Pedro? ¿Quién padece diarrea? ¿Y quién está cansado? ¿Hay algún fármaco que alivie a Pedro? ¿Hay algún síntoma que compartan Juan y María?
Tenemos el siguiente conocimiento directo: Bertoldo y Bartolo son rufianes. Romeo y Bertoldo, como su nombre indica, son nobles. Bartolo es un plebeyo. Gertrudis y Julieta son damas. Julieta es hermosa. También disponemos del siguiente conocimiento indirecto: Los plebeyos desean a cualquier dama, mientras que los nobles sólo a aquellas que son hermosas. Los rufianes, para satisfacer sus instintos, raptan a las personas a las que desean.
Construir un programa que refleje dicho conocimiento y permita resolver las siguientes cuestiones: 1) 2) 3)
¿Qué noble es un rufián? ¿Quién es susceptible de ser raptada por Romeo? ¿Quién puede raptar a Julieta?
1
c)
4) ¿Quién rapta a quién? 5) ¿A quién desea Bartolo? 6) ¿Y Romeo? 7) ¿Cuál hermosa dama es deseada por Bartolo?. Consideremos las siguientes afirmaciones en lenguaje natural: Los estudiantes son siempre jóvenes. Los jóvenes que estudian están solteros. Los estudiantes que trabajan están casados. Los estudiantes del Seminario, aunque trabajen, están solteros. Las personas independientes están solteras. Soltero y casado son estados incompatibles. María estudia, y Jorge está casado. Natalia estudia filosofía, es independiente pero le gusta Daniel.
3.
4.
Representar este conocimiento en PROLOG. Según ésta base de conocimientos, ¿Podría casarse María con Daniel? Ejercicios Que distingue, en los sistemas basados en reglas, el razonamiento hacia delante del razonamiento hacia atrás? ¿ qué tipo de problemas son adecuados para cada tipo de razonamiento? ¿Qué es un árbol de decisión?, ¿cuál es el objetivo del algoritmo ID3?, ¿que se entiende por entropía esperada?, ¿ y por ganancia de información? ¿En qué consiste la validación cruzada?, ¿para que se utiliza? ¿cuando decimos que una regla cubre a un ejemplo? ¿cuándo lo cubre correctamente? Diferencia entre sobreajuste y ruido. Ejercicios Una entidad bancaria concede un préstamo a un cliente determinado en función de una serie de parámetros: su edad (puede ser joven, mediano o mayor), sus ingresos (altos, medios, bajos), un informe sobre su actividad financiera (que puede ser positivo o negativo) y finalmente en función de que tenga o no a su cargo otro préstamo. La siguiente tabla presenta una serie de ejemplos en los que se especifica la concesión o no del préstamo en función de estos parámetros: Ej.
Edad
Ingresos
Informe
Otro
Conceder
E1
joven
Altos
negativo
no
no
E2
joven
Altos
negativo
si
no
E3
mediano
Altos
negativo
no
si
E4
mayor
Medios
negativo
no
si
E5
mayor
Bajos
positivo
no
si
E6
mayor
Bajos
positivo
si
no
E7
mediano
Bajos
positivo
si
si
E8
joven
Medios
negativo
no
no
E9
joven
Bajos
positivo
si
si
E10
mayor
Medios
positivo
no
si
E11
joven
Medios
positivo
si
si
E12
mediano
Medios
negativo
si
si
E13
mediano
Altos
positivo
no
si
E14
mayor
Mediano
negativo
si
no
Aplicar (detallando cada uno de los pasos realizados) el algoritmo ID3 para encontrar, a partir de este conjunto de entrenamiento, un árbol que nos permita decidir sobre la concesión de préstamos. 5.
Ejercicio
En una determinada población, el 30% de las personas que deciden iniciar una dieta de adelgazamiento utilizan algún tipo de supervisión medica mientras que el 40% de todas las personas que inician una dieta de adelgazamiento continúan con ella al menos un mes. En esa población, el 80% de las personas que inician la dieta sin supervisión abandona antes del primer mes.
a. b.
Se escoge al azar a un individuo de esa población del que sabemos que ha iniciado una dieta. ¿Cuál es la probabilidad de que abandonara antes del primer mes y no hubiera tenido supervisión médica? ¿Qué porcentaje de las personas que inician una dieta con supervisión médica abandona antes del primer mes?
2
6.
7.
8.
Ejercicios: Contestar las siguientes cuestiones de manera clara y concisa, usando para ello el espacio en blanco que aparece a continuación de cada una de ellas: a) ¿Por qué es conveniente aplicar un algoritmo de poda sobre un árbol aprendido mediante ID3 ¿Diseñar, basado en la idea del algoritmo de podado de árboles visto en clase, un algoritmo de podado de reglas, que se usaría sobre reglas aprendidas mediante el algoritmo de cobertura. b) ¿Para qué se usa el algoritmo de eliminación de variables en redes bayesianas? Explicar brevemente en qué consisten las operaciones de agrupamiento y de multiplicación ¿Que sabes sobre la complejidad del algoritmo? c) Modificar el algoritmo ID3 visto en clase para tratar con problemas de aprendizaje en los que haya más de dos valores de clasificación ¿Qué criterio se escogería para decidir en cada paso el mejor atributo? d) ¿Por qué es frecuente que existan variables ocultas en un problema de aprendizaje de redes bayesianas? ¿Para qué se usa el algoritmo EM sobre redes bayesianas? ¿Por qué se denomina algoritmo EM? ¿En qué sentido puede verse como un algoritmo de optimización mediante búsqueda local? Ejercicios Una asociación juvenil de geología propone a sus miembros una excursión a Sierra Magina (Jaén) para buscar restos de meteoritos. Para distinguirlos de las demás piedras se tienen en cuenta diferentes factores entre los que se encuentran los siguientes: Presencia de corteza de fusión (superficie de color negro o marrón), alta densidad (pesa mucho para el tamaño que tiene), magnetismo (atrae un imán o desvía la aguja de la brújula), apariencia interior (metálica, cristalina o pétrea). Una vez recogidas las muestras, el Museo de Geología de Sevilla determina cuales son restos de meteoritos y cuáles no. Los datos se recogen en la siguiente tabla: Ej
Color
Densidad
Magnetismo
Interior
Meteorito
E1
negro
Alta
alto
metálico
Si
E2
blanco
Baja
bajo
Pétreo
No
E3
blanco
Baja
bajo
Cristal
No
E4
gris
Alta
medio
metálico
Si
E5
negro
Baja
medio
metálico
No
E6
marrón
Alta
alto
metálico
Si
E7
marrón
Alta
alto
Cristal
No
E8
negro
Baja
medio
Pétreo
No
E9
negro
Alta
alto
Pétreo
No
E10
blanco
Alta
bajo
Pétreo
No
Se pide en la presente: a) Aplicar el algoritmo de cobertura para obtener un conjunto de reglas que ayuden a decidir si una muestra es un resto de meteorito o no. b) Aplicar el algoritmo ID3 para obtener un árbol de decisión que igualmente nos ayude a decidir si una muestra es un resto de meteorito o no. c) A la vista de los resultados, ¿existe algún atributo que sea irrelevante a la hora de tomar la decisión? d) Extraer un conjunto de reglas a partir del árbol construido por el algoritmo ID3 ¿es el mismo conjunto de reglas que el obtenido en el primer apartado? Ejercicios: Sea f una función de R × R en {−1, 1}. Consideremos el problema de aprender f mediante un perceptron simple bipolar, para ello se tiene el siguiente conjunto de entrenamiento:
a.
b.
Entradas
Salida
Ej1
(2,0)
1
Ej2
(0,0)
-1
Ej3
(2,2)
1
Ej4
(0,1)
-1
Ej5
(1,1)
1
Ej6
(1,2)
-1
Aplicar el algoritmo de entrenamiento del perceptron simple bipolar con el conjunto de entrenamiento anterior, considerando los ejemplos en el mismo orden en que aparecen, hasta que se clasifiquen correctamente todos los ejemplos. Tomar 0 como valor inicial para los pesos y 0.1 como factor de aprendizaje. Con los pesos aprendidos, ¿qué salida se obtiene para las siguientes entradas: (0, 2), (1, 0) y (2, 1)?
3
9.
Ejercicios: a. Consideremos la siguiente red bayesiana que relaciona las variables aleatorias A, B, C, D, E, F y G:
Con las siguientes tablas de distribución:
Calcular la distribución de la variable aleatoria B condicionada a que se ha observado que D es verdadera y F es falsa, utilizando para ello el algoritmo de ponderaci´on por verosimilitud con 5 muestras, indicando las muestras generadas y el peso de las mismas ¿Es necesario generar valores en las muestras para todas las variables o se puede eliminar alguna de ellas?, justificar la respuesta. Considerar la siguiente secuencia de números aleatorios en el proceso de generaci´on de las muestras: 0.13, 0.07, 0.57, 0.94, 0.13, 0.78, 0.48, 0.38, 0.75, 0.93, 0.55, 0.16, 0.91, 0.06, 0.74, 0.02, 0.71, 0.48, 0.10, 0.04, 0.86, 0.70, 0.49, 0.40, 0.77 b.
En un congreso científico regional participan 50 representantes de 3 universidades: 23 de la primera, 18 de la segunda y 9 de la tercera. En la primera universidad, el 30% de los profesores se dedican a las ciencias, el 40% a la ingeniería, el 25% a las humanidades y el 5% a la economía. Para la 2ª universidad los porcentajes son 25, 35, 30 y 10 y para la 3ª 20, 50, 10 y 20. A la salida del congreso nos encontramos con un profesor. ¿Cuál es la probabilidad de que sea de la 3ª universidad? ¿Y si sabemos que es de economía?
10. Ejercicios
4
5
6