Sistemas basados en el Conocimiento

Tarea MODALIDAD ABIERTA Y A DISTANCIA La Universidad Católica de Loja Sistemas basados en el Conocimiento 5 Créditos

Views 226 Downloads 0 File size 459KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Tarea MODALIDAD ABIERTA Y A DISTANCIA La Universidad Católica de Loja

Sistemas basados en el Conocimiento

5 Créditos

Departamento de Ciencias de la Computación y Electrónica Sección Tecnologías Avanzadas de la Web y SBC Titulación

§§ Informática

Ciclo

X

Profesora autora: Janneth Chicaiza Espinosa Le recordamos que el envío de la tarea a través del EVA (Entorno Virtual de Aprendizaje) es obligatorio; y, el ingreso se lo realiza en las fechas establecidas en el calendario académico, que se encuentra en el siguiente enlace.

https://distancia.utpl.edu.ec/calendario-academico/

Octubre 2017 - Febrero 2018 TUTORÍAS: El profesor asignado publicará en el Entorno Virtual de Aprendizaje (EVA) su número telefónico y horario de tutoría. Más información puede obtener llamando al Call Center 07 3701444, línea gratuita 1800 88758875 o al correo electrónico [email protected]

Asesoría virtual: www.utpl.edu.ec

Tarea

Tarea: Sistemas basados en el Conocimiento

Primer bimestre

Actividad 1 1.

Actividad de aprendizaje: aplicar los conocimientos adquiridos sobre el modelo de datos RDF y demás tecnologías de la Web Semántica.

2.

Tema: Modelo de datos RDF y vocabularios abiertos

3.

Competencia a la que aporta la actividad: Describe las principales tecnologías de la Web Semántica.

4.

Resuelva el siguiente caso planteado: A partir del siguiente conjunto de datos, cree una tabla de los términos que identifique (conceptos, instancias y propiedades) y de los metadatos que podría reutilizar para cada caso. Además, elabore un grafo RDF que describa los datos de cada documento (tesis de grado) que aparece en la tabla: Título

Editorial

Innovación didáctica como experiencia educativa para el mejoramiento de la calidad de la educación.

Universidad Técnica Particular de Loja (UTPL)

La transparencia de la tecnología en la agricultura en la provincia de Loja

Fundamentos de la Web Semántica

Autores

Edith Bravo Jaigua (eebravo@ utpl.edu.ec)

Fecha de pub.

UTPL

Estrella, Rodrigo

24/06/2009

Ecuador

Torres Víctor Edgar Jara (ejara@utpl. edu.ec)

Innovación

Español

Didáctica

Agricultura Tecnología 1987

Producción agrícola

es

Loja - Ecuador

Jara, Edgar Universidad Técnica Particular de Loja,

Lenguaje

Calidad Educativa

Vargas, Flavio González, Armando

Palabras clave

03 de febrero de 2015

Educational quality

es

Innovation

English

2 MODALIDAD ABIERTA Y A DISTANCIA

Tarea: Sistemas basados en el Conocimiento

5.

Orientaciones metodológicas (estrategias de trabajo): 1.

2.

Analice la estructura general de la tabla de datos, así como la composición de cada columna. Observe que: a.

Existen columnas multi-valuadas, como palabras clave y autores.

b.

Existen columnas con valores heterogéneos, como editorial y lenguaje que tienen diferentes valores para referirse a la misma entidad.

c.

En la columna Autores se maneja diferente convención y orden para referirse a sus nombres. Mientras que en la primera fila consta primero nombre y luego el apellido del autor, en la segunda fila, primero van los apellidos y luego el nombre. También revise cuáles son instancias equivalentes (por ejemplo, Jara, Edgar = a Edgar Jara).

d.

En Autores consta más de un valor para una misma entidad. En la fila 1 se incluye nombre y correo del autor, en el segundo caso, solo se incluyen nombres.

A partir del análisis de la estructura de la tabla origen, elabore una tabla en la que se enlisten: 1) los principales términos referidos en el conjunto de datos, 2) al frente de cada término, coloque su tipo, y 3) el metadato a reutilizar. a.

En cuanto al tipo de cada término considere que pueden ser: i.

clases o conceptos,

ii.

instancias o entidades conocidas, y

iii.

propiedades que corresponden a cada concepto (relaciones y atributos de datos)

b.

Por cada elemento identificado, reutilice el metadato más adecuado para describirlo en RDF. Entre los vocabularios que se recomienda utilizar están: FOAF, Dublin Core, DBPedia ontology, schema.org y SKOS. Antes de desarrollar este punto es importante que conozca la especificación de cada vocabulario sugerido y así elija la mejor opción para cada metadato de la tabla de datos proporcionada.

c.

Para las entidades que sea pertinente, identifique los recursos DBPedia con los que podría crear enlaces. Por ejemplo, busque

3 La Universidad Católica de Loja

UTPL

Tarea: Sistemas basados en el Conocimiento

en DBPedia la URI que corresponde a UTPL y asocie la URI a las entidades que corresponda.

6.

3.

Para las nuevas instancias (no encontradas en DBPedia) que identifique en la tabla de datos, defina una URI fija a través de un prefijo previamente establecido y asigne a cada elemento un valor válido.

4.

Para elaborar el grafo, utilice la simbología correcta: óvalos para clases, rectángulos para literales y vínculos dirigidos para unir sujeto a objeto.

Entregables: 1.

Un documento donde conste: a)

Una tabla donde se enliste cada término relevante del dominio, se determine su tipo (propiedad de dato, relación, instancia o concepto) y el metadato a reutilizar de alguno de los vocabularios sugeridos.

b)

Grafo RDF elaborado en cualquier diagramador disponible, según las especificaciones proporcionadas.

4 MODALIDAD ABIERTA Y A DISTANCIA

La Universidad Católica de Loja

Reutiliza en un 50% de los casos posibles Los metadatos reutilizados son coherentes en un 50% de los casos posibles

Reutiliza en un 25% de los casos posibles Los metadatos reutilizados son coherentes en un 25% de los casos posibles

No reutiliza ningún metadato predefinido o entidad DBPedia Ningún metadato reutilizado es coherente con su definición

Reuso de los metadatos y recursos semánticos (DBPedia) más adecuados para cada término y entidad que proceda (ver estrategias 3 y 4)

Uso semántico de los metadatos reutilizados (ver estrategia 3)

Acierta en un 25% Acierta en un 50% de los términos de los términos

En progreso (C)

No acierta en ningún tipo de termino

Iniciado (D)

Elección del tipo de término para cada metadato (ver estrategias 1 y 2)

Ausencia (E)

Rúbrica de evaluación A – Actividad 1:

9. Valoración

Puntaje: 3 puntos

8.

Criterio

Criterio de evaluación: Se calificará la actividad de acuerdo a la rúbrica A.

7.

Los metadatos reutilizados son coherentes en un 75% de los casos posibles

Reutiliza en un 75% de los casos posibles

Acierta en un 75% de los términos

Satisfactorio (B)

Los metadatos reutilizados son coherentes en un 100% de los casos posibles

Reutiliza en un 100% de los casos posibles

Acierta en un 100% de los términos

Excelente (A)

___/1.5 ptos.

3 ptos.

Puntaje

Tarea: Sistemas basados en el Conocimiento

5

UTPL

Tarea: Sistemas basados en el Conocimiento

Criterio

Valoración Ausencia (E)

Iniciado (D)

En progreso (C)

Satisfactorio (B)

Definición/asignación de URIs para las instancias nuevas del modelo (ver estrategia 3)

No define URIs para los nuevos recursos semánticos (casos posibles)

Define las URIs de forma correcta para el 25% de los casos posibles

Define las URIs de forma correcta para el 50% de los casos posibles

Define las URIs de forma correcta para el 75% de los casos posibles

Elaboración del grafo RDF de acuerdo a la simbología estándar (ver estrategia 4)

No utiliza la simbología correcta para los diferentes elementos del grafo

Acierta en uno de los símbolos utilizados para grafos

Acierta en tres Acierta en dos de los de los símbolos símbolos utilizados utilizados para para grafos grafos RDF

Actividad 2 1.

Actividad de aprendizaje: aplicar los conocimientos adquiridos para la creación de un modelo conceptual de conocimiento de acuerdo a una metodología formal.

2.

Tema: Ontologías

3.

Competencia a la que aporta la actividad: Habilidad para crear modelos conceptuales de conocimiento

4.

Resuelva el siguiente caso planteado: Cree el modelo conceptual de una ontología para describir las “Revistas y publicaciones científicas de investigadores afiliados a universidades e instituciones del país”. Para desarrollar esta actividad, aplique las actividades y tareas definidas por la metodología METHONTOLOGY

5.

Orientaciones metodológicas (estrategias de trabajo): 1.

Busque en la Web al menos 1 recurso bibliográfico que describa a cada uno de los términos clave del dominio como: revista científica, publicación científica y sus tipos (como artículo, libro, paper de conferencia, etc.), afiliación, impacto de revista, quartil, base de datos científica, etc. Realice las abstracciones necesarias para plasmar en un mapa mental los términos más representativos del dominio y cómo estos se conectarían.

2.

Una vez que tenga claro a qué se refiere cada término, inicie elaborando el documento de especificación de la ontología. Tome como referencia

6 MODALIDAD ABIERTA Y A DISTANCIA

a s

Tarea: Sistemas basados en el Conocimiento

la Puntaje Excelente (A) Define las URIs de forma correcta para el 100% de los casos posibles Utiliza correctamente todos los símbolos de un grafo RDF

6.

estructura definida en el ejercicio 3.3 propuesto en el texto-guía y el mapa mental construido en el paso anterior. 3 ptos. •

___/1.5 • ptos.

3.

Recuerde que la clave para construir el modelo conceptual de la ontología es definir de forma clara y completa los requerimientos funcionales de la ontología (preguntas de competencia). Por cada pregunta de competencia, identifique los términos clave y elabore el pre-glosario de términos.

Desarrolle la fase de conceptualización de ontologías, de acuerdo a las actividades definidas por METHONTOLOGY. Tome como referencia el ejercicio 3.3 desarrollado en el texto-guía. Recuerde que la metodología define 11 tareas, como referencia puede revisar (Corcho et.al, 2005).

Entregables: 1.

2.

Un documento que incluya el desarrollo de cada fase: a.

Fase I – Adquisición de conocimiento: Mapa mental con los principales términos y asociaciones del dominio.

b.

Fase II – Especificación de la ontología

c.

Fase III – Conceptualización

Nota: Las actividades 1 y 2 deben ser desarrolladas en el mismo documento.

7.

Criterio de evaluación: Se calificará la actividad de acuerdo a la rúbrica B.

8.

Puntaje: 3 puntos

7 La Universidad Católica de Loja

UTPL

No realiza esta actividad

No realiza la actividad

Fase II: Elaboración del documento de especificación de la ontología

Fase III: Conceptualización de la ontología

Construye todas las actividades de la conceptualización. Incluyendo una especificación completa y correcta de las primeras 3 tareas.

Construye el glosario de términos, la taxonomía de conceptos y el diagrama de relaciones binarias incluyendo los términos más relevantes del dominio y de forma correcta Construye el glosario de términos, la taxonomía de conceptos y el diagrama de relaciones binarias de forma parcial o con algunos errores

Elabora el documento de especificación de forma parcial, sin considerar los requerimientos funcionales

Construye el glosario de términos y la taxonomía de conceptos de forma parcial o con algunos errores

Elabora el documento de especificación, sin embargo, los requerimientos funcionales identificando a todos los términos relevantes del dominio Elabora el documento de especificación, sin embargo, los requerimientos funcionales identifican apenas a menos del 75% de términos relevantes del dominio.

Elabora el documento de especificación, sin embargo, los requerimientos funcionales identifican apenas a menos del 50% de términos relevantes del dominio.

Reconoce la totalidad de los términos y asociaciones claves del dominio

Reconoce el 75% de los términos y asociaciones claves del dominio

Reconoce el 50% de los términos y asociaciones claves del dominio

Reconoce el 25% de los términos y asociaciones claves del dominio

Excelente (A)

No acierta identificando ninguno de los términos clave del dominio / No realiza esta actividad

Satisfactorio (B)

Fase I: Adquisición de conocimiento: Elaboración del mapa mental

Valoración En progreso (C)

Iniciado (D)

Criterio

Rúbrica de evaluación B – Actividad 2:

Ausencia (E)

9.

___/1 pto.

___/1 pto.

___/1 pto.

3 ptos.

Puntaje

Tarea: Sistemas basados en el Conocimiento

8

MODALIDAD ABIERTA Y A DISTANCIA

Tarea: Sistemas basados en el Conocimiento

Estimado(a) estudiante, una vez resuelta su tarea en el documento impreso (borrador), acceda al Entorno Virtual de Aprendizaje (EVA) en www.utpl.edu.ec e ingrese las respuestas respectivas.

SEÑOR ESTUDIANTE: Le recordamos que para presentarse a rendir las evaluaciones presenciales no está permitido el uso de ningún material auxiliar (calculadora, diccionario, libros, Biblia, formularios, códigos, leyes, etc.) Las pruebas presenciales están diseñadas para desarrollarlas sin la utilización de estos materiales.

9 La Universidad Católica de Loja

UTPL

Tarea

Tarea: Sistemas basados en el Conocimiento

Segundo bimestre

Actividad 1 1.

Actividad de aprendizaje: aplicar las tareas de desarrollo de una ontología con el objetivo de crear un modelo legible para máquinas.

2.

Tema: Construcción del modelo formal de una ontología

3.

Competencia a la que aporta la actividad: Capacidad para construir modelos formales de representación de conocimiento.

4.

Resuelva el siguiente caso planteado: Tomando como base el modelo conceptual de la ontología propuesta en el primer parcial “Revistas y publicaciones científicas de investigadores afiliados a universidades e instituciones del país”, realice la respectiva implementación y validación en Protégé. Además genere un conjunto de instancias RDF en base a algún conjunto de datos previamente seleccionado.

5.

Orientaciones metodológicas (estrategias de trabajo): 1.

En base a la retroalimentación proporcionada en la actividad 2 del primer parcial, realice las respectivas mejoras en el modelo conceptual, de tal manera, que se corrija alguna inconsistencia o error. Luego tomando como base la taxonomía de conceptos, el diagrama de relaciones binarias y el diccionario de conceptos de la ontología, cree los respectivos elementos en la ontología desde Progégé.

2.

Documente cada uno de los objetos creados en la ontología, es decir, agregue las respectivas propiedades de anotación (rdfs:label y rdfs:comment). Las descripciones a incluir debería obtenerlas del glosario de términos construido previamente.

3.

Una vez que tenga un modelo estable de la ontología, valídela mediante algún razonador disponible en Protégé. Realice las correcciones en caso de que se genere algún error y nuevamente proceda a validarla.

4.

Desde el repositorio de recursos académicos (artículos, proceedings, etc.) [http://eprints.rclis.org/], realice una búsqueda de los términos “Semantic Web”, elija al menos 10 trabajos diferentes y registre sus datos en una hoja electrónica, considerando los principales metadatos de cada recurso. La hoja

10 MODALIDAD ABIERTA Y A DISTANCIA

Tarea Segundo bimestre

electrónica deberá tener una estructura coherente con el modelo ontológico creado en Protégé.

5.

6.

A continuación utilice la herramienta Google Refine para mapear esos datos de acuerdo con la estructura definida por la ontología. Una vez que complete el mapping, exporte los resultados en formato RDF.

Entregables: 1.

Archivo OWL de la ontología implementada y un documento que contenga: a.

Algunas pantallas relevantes a la creación y elementos de la ontología

b.

Evidencia de la respectiva verificación sintáctica de la ontología mediante un razonador.

2.

Archivo de datos de publicaciones científicas recogidas desde el sitio [http://eprints.rclis.org/].

3.

Proyecto Google Refine exportado desde la herramienta y archivo RDF con las tripletas del conjunto de datos relacionado a artículos y revistas científicas, y generado a través de Google Refine.

Nota: Comprimir un solo archivo. 7.

Criterio de evaluación: Se calificará la actividad de acuerdo a la rúbrica C.

8.

Puntaje: 3 puntos

11 La Universidad Católica de Loja

UTPL

9.

No realiza esta actividad

Generación de datos RDF

Adjunta el archivo RDF completo y el proyecto de Google Refine con todos los mappings correctamente especificados.

Adjunta el archivo RDF completo y el proyecto de Google Refine, sin embargo, el proyecto no está completo o es inválido.

Adjunta el archivo RDF pero no tiene la cantidad suficiente de tripletas

No realiza la actividad

Adjunta el archivo RDF y tiene la cantidad suficiente de datos esperados

El archivo de datos de publicaciones tiene la cantidad suficiente de filas solicitadas (al menos 10) y columnas y los datos son de calidad.

Valida la ontología y no se reportan errores.

Recolección de datos de publicaciones científicas

Crea la taxonomía de conceptos, propiedades de datos y relaciones de manera incompleta.

Crea de forma correcta todos los objetos esperados de la ontología: conceptos, propiedades de datos, relaciones y propiedades de anotación.

El archivo de datos de publicaciones tiene la cantidad suficiente de filas solicitadas (al menos 10) e incluye todas las columnas con datos requeridos por el modelo ontológico pero existen inconsistencias en los datos (el valor de un metadato no corresponde con el valor esperado.

Crea de manera correcta todos los objetos esperados de la ontología: conceptos, propiedades de datos, relaciones y propiedades de anotación.

Crea la taxonomía de conceptos, propiedades de datos y relaciones con algunas inconsistencias o errores

Excelente (A)

El archivo de datos de publicaciones El archivo de datos tiene la cantidad de publicaciones suficiente de filas no tiene la solicitadas (al cantidad suficiente menos 10) pero de filas solicitadas no incluye todas (al menos 10) las columnas con datos requeridos por el modelo ontológico.

Satisfactorio (B)

Valoración En progreso (C)

Iniciado (D)

No realiza actividad

Ausencia (E)

Implementación de la ontología en Protégé

Criterio

Rúbrica de evaluación C – Actividad 1:

___/1 pto.

___/1 pto.

___/1 pto.

3 ptos.

Puntaje

Tarea: Sistemas basados en el Conocimiento

12

MODALIDAD ABIERTA Y A DISTANCIA

Tarea: Sistemas basados en el Conocimiento

Actividad 2 1.

Actividad de aprendizaje: aplicar lenguajes de consulta para la recuperación de datos de la nube de Datos Enlazados

2.

Tema: Explotación de bases de conocimiento a través de lenguajes de consulta

3.

Competencia a la que aporta la actividad: Habilidad para construir el modelo computable de una ontología y explotar el conocimiento subyacente mediante tecnologías semánticas.

4.

Resuelva el siguiente caso planteado: Implemente consultas SPARQL para responder las tres cuestiones de competencia que a continuación se enlistan y que se enfocan en preguntar acerca de los journals de Ciencias de la Computación (CC) -Computer_ science_journals-.

5.

6.

a.

¿Cuál es el nombre, el año y el factor de impacto de los journals que están asociados a CC?

b.

¿Cuáles son las direcciones Web de los journals que tienen licencia abierta?

c.

¿Cuáles son las URIs e ISSN de los journals de CC que son publicados por ACM (Association_for_Computing_Machinery) y que se enfocan en algún tema de lenguajes de programación?

Orientaciones metodológicas (estrategias de trabajo): a.

En DBPedia intente encontrar un nodo (o propiedad) base a partir del cual establecer los filtros necesarios para cada consulta.

b.

Ingrese al SPARQL Endpoint de DBPedia [http://dbpedia.org/sparql] y arme las consultas de forma incremental, es decir, agregando un patrón RDF a la vez y observando los resultados parciales que se devuelven, en función de esto, ir refinando los filtros e ir agregando más condiciones.

Entregables: •

Elabore un informe donde se documente la estrategia de búsqueda utilizada, la consulta SPARQL para cada caso y se muestre los resultados

13 La Universidad Católica de Loja

UTPL

Tarea: Sistemas basados en el Conocimiento

de su ejecución (limitar la cantidad de resultados a presentar hasta máximo 10 elementos). Nota: En el EVA se habilitará un solo enlace, donde deberá subir todos los entregables de cada actividad 7.

Criterio de evaluación: Se calificará la actividad de acuerdo a la rúbrica D.

8.

Puntaje: 3 puntos

9.

Rúbrica de evaluación D – Actividad 2: Por cada cuestión de competencia se evaluarán los siguientes aspectos: Valoración Criterio

Selección de nodos (instancias, conceptos) y/o propiedades

Lógica de la consulta SPARQL y resultados esperados

Puntaje

Ausencia (E)

Iniciado (D)

En progreso (C)

Satisfactorio (B)

Excelente (A)

No realiza la actividad

Identifica un 25% de los elementos de partida (nodos y vínculos) requeridos para la consulta.

Identifica un 50% de los elementos de partida (nodos y vínculos) requeridos para la consulta.

Identifica un 75% de los elementos de partida (nodos y vínculos) requeridos para la consulta.

Identifica la totalidad de los elementos de partida (nodos y vínculos) requeridos para la consulta.

No realiza la actividad

Estructura y combina los patrones RDF de forma incorrecta

Estructura y combina los patrones RDF de forma correcta pero de forma parcial.

Estructura y combina los patrones RDF de tal manera que resuelve la cuestión de competencia. No adjunta los resultados esperados de la ejecución.

Estructura y combina los patrones RDF de tal manera que resuelve la cuestión de competencia.

1 pto.

___/0.5 ptos.

___/0.5 ptos.

Adjunta los resultados esperados de la ejecución.

14 MODALIDAD ABIERTA Y A DISTANCIA

Tarea: Sistemas basados en el Conocimiento

Estimado(a) estudiante, una vez resuelta su tarea en el documento impreso (borrador), acceda al Entorno Virtual de Aprendizaje (EVA) en www.utpl.edu.ec e ingrese las respuestas respectivas.

SEÑOR ESTUDIANTE: Le recordamos que para presentarse a rendir las evaluaciones presenciales no está permitido el uso de ningún material auxiliar (calculadora, diccionario, libros, Biblia, formularios, códigos, leyes, etc.) Las pruebas presenciales están diseñadas para desarrollarlas sin la utilización de estos materiales.

15 La Universidad Católica de Loja

UTPL