jgsogo / muia-linkeddata

Linked Data application for Ontological Engineering MUIA
3 stars 2 forks source link

Texto online explicando el trabajo #14

Closed jgsogo closed 9 years ago

jgsogo commented 9 years ago

Si alguien se anima a rellenar el "about" es más que bienvenido... se trataría de modificar este archivo

muia-linkeddata/webapp/linkeddata/templates/linkeddata/about.html

y aparecería en la URL http://rafco.jgsogo.es/about/

jgsogo commented 9 years ago

Algo que creo que sí será obligatorio poner aquí (por si alguien llega a la web) es que se trata de un trabajo en un contexto educativo y que por eso nos saltamos la licencia de cualquier cosa que pudiera tener licencia de una forma muy libre. <<- en el documento que entreguemos hay que hablar de las licencias de los datos.

¿Le entregamos a un Óscar simplemente un link, nada de pdf? xD

ghost commented 9 years ago

jajajaja es tentador xD. Si queréis me encargo yo de esta parte como si fuese el documento, que también lo teníamos en la lista de tareas, y de que quede bien explicada y nos olvidamos del pdf que es más rollo. ¿Os parece?

jgsogo commented 9 years ago

Hacer una web en vez de un PDF es apostar fuerte... yo debo ser ludópata porque me atrae la idea :space_invader:

Si te apetece aprender (liarte con algo nuevo), puedes mirar Sphinx, que es una herramienta que te permite hacer documentación de una manera bastante sencilla. Partiendo de un mismo documento (RST, p.ej) puedes generar la documentación en HTML (con su CSS), en LaTeX (y aplicarle una plantilla),... resulta very interesting, flexible y adecuado ante esta duda...

ghost commented 9 years ago

Jajaja si me parece que quedaría muy chulo ^^ yo lo intento xD. ¿Qué secciones creéis que debería tener el documento/página web?

EDIT: ver comentario más abajo que tiene el índice modificado con sugerencias de @jgsogo

Y las conclusiones me las saltaría. Si llegamos a un acuerdo con las secciones puedo intentar lo que ha dicho Javi sin rellenar los campos de un documento y así ya tenemos las páginas generadas, ¿qué os parece?.

OJO: En clase vimos que una parte importante era la publicación de los datos en internet, que tenían que tener un fichero descriptivo de metadatos en RDF o algo así. ¿Nosotros hacemos algo de eso?

jgsogo commented 9 years ago

En los apuntes está el flujo de trabajo para ir desde los datos hasta la aplicación online.. yo pondría esos capítulos.

ghost commented 9 years ago

Pongo el esquema de las transparencias con lo que explicaríamos en cada sección. Si no os gusta algo corregidme again :P

  1. Introduction
    • Explicamos de donde partimos por encima (el proyecto RAFCO de la práctica anterior, podemos hasta poner un link al pdf si queréis)
    • Cuáles son los objetivos que nos hemos propuesto alcanzar
    • Estructura del resto del documento?
    • Tecnologías a utilizar (o esto pega más adelante?)
  2. Data preparation
    1. Select data source
      • Bases de datos y por que las hemos elegido
    2. Obtain access to data source
      • Enlaces o fuentes de descarga
    3. Analyse licensing of the data source --> _No lo hemos tenido en cuenta para nada_ ¿alguna idea de qué poner? Quizá por qué nos creemos con derecho a reutilizarlas... o analizar si tenemos o no permiso para hacer lo que hemos hecho.. pero claro, si nos damos cuenta de que no, ¿entonces que hacemos? porque marcha atras no es una opcion xD
    4. Analyse data source
      • Describir si los datos son estructurados o no
      • Formatos en los que están
      • Esquema que siguen
  3. Define resource naming strategy
    • NIT seguida. Hablamos también de las reglas que puse en otro issue para generar las IRIs concretas de nuestros datos.
    • Listado final de IRIs?
  4. Ontology development
    • Link al documento rafco anterior
    • Cambios explicados por encima (conceptualmente)
    • Esquema final de la ontología?
  5. Data generation
    • Overview de estrategia ETL
    • Transformación de datos a SQL (en cada apartado ejemplos explicativos pero centrándonos en las ideas más que en la implementación no?)
    • Paso a CSV y adición de nueva información
    • Estructura de la base de datos (tablas y campos)
    • Los scripts de python
    • Transformación de datos de SQL a RDF: R2RML.
    • Generación de IRIs para los recursos. Aquí mencionar la relación entre las claves primarias de la BB. DD. en SQL y R2RML.
  6. Online publishing
    • MySQL
    • Django e interfaz "admin"
    • Virtuoso DB - SPARQL endpoint
    • Elda
    • Nginx (reverse proxy)
      • Muy de pasada cabría mencionar el content-negotiation de rafco.owl/rdf/ttl
      • Mencionar también que el servicio no va a estar ahí forever, que es algo para enseñar (a ver si va a llegar alguien dos años después preguntando XDDD
  7. Linking --> ¿ideas?
  8. Discussion/Results --> Aquí podríamos poner 2 o 3 queries de ejemplo (algo elaboradas) con sus resultados. ¿ideas?
jgsogo commented 9 years ago

2.iii es muy importante. No se trata de la licencia con la cual nosotros distribuimos, sino de la licencia original de los datos.

5. Hay que hablar de estrategia ETL (extract - transform - load)

... y hecho de menos apartados de puesta online y linking, al menos ¿No te salían por ahí también?

ghost commented 9 years ago

Se me habrán pasado, ¿puedes decir más en concreto que pondrías y donde los meterías dentro del índice que he puesto?

Para no llenar esto de comentarios edito sobre el comentario anterior añadiendo lo que vais diciendo.

jgsogo commented 9 years ago

(he actualizado arriba el comentario.... lo que aparecía como "1" hace referencia al punto "5")

En puesta online (o publicación) me refiero a lo del servidor que comentabas, hablar de las tecnologías que hemos utilizado y que funcionan... creo que se pueden meter en un capítulo propio en vez de en "discusión"

Y con linking me refiero a enlazar los datos con datos de otros lugares, a fin de cuentas para eso se hace esto, ¿no? No tengo muy claro cómo podemos hacerlo, pero si se nos ocurre algo, puede ser interesante señalarlo.

ghost commented 9 years ago

Actualizado el comentario de arriba con sugerencias. Lo he fusionado con el que puse antes para tener una visión mejor. ¡Empieza a parecer serio y todo! :dancer:

Me reclama la familia. No os atraganteis con las uvas :cocktail:

jgsogo commented 9 years ago

Sugerencias de edición

6. Online publishing
     MySQL
     Django e interfaz "admin"
     Virtuoso DB - SPARQL endpoint
     Elda
     Nginx (reverse proxy)
     ~ muy de pasada cabría mencionar el content-negotiation de rafco.owl/rdf/ttl
     ~ mencionar también que el servicio no va a estar ahí forever, que es algo para enseñar (a ver si va a llegar alguien dos años después preguntando XDDD

El cambio de rafco.ttl a rafco hay que explicarlo, pero es como re hace... se puede comentar junto al tema del content-negotiation.

ghost commented 9 years ago

Que pena, yo pensaba que lo íbamos a dejar en tu servidor xD osea que cuando terminemos el proyecto esto se cierra?

EDIT: Actualizados los cambios.

jgsogo commented 9 years ago

A ver, se puede quedar ahí, a mí no me molesta, pero no me puedo comprometer a que esté online forever... y además, si lo dejamos ahí puesto, habría que plantearse en serio el tema de licencias.

ghost commented 9 years ago

Ya... bueno al menos dejamos el proyecto de GitHub por si nos da por retomarlo o mejorarlo en el futuro :D que se ha quedado chulo.

Volviendo al issue, cuando me has dicho que use Sphinx, imagino que tenías en mente generar varias páginas en HTML, pero ¿es realmente necesario? ¿no podemos poner los apartados directamente en el about.html con headers y un índice al principio con links? ¿o qué tenías en mente?

jgsogo commented 9 years ago

A ver, a ver, mi idea era meter ahí cuatro líneas para explicar qué es por si algún navegante pasa por ahí y después hacer el PDF por otro lado.

Sphinx no implica hacer varios HTML o uno solo... pero eso, que yo sólo lo comentaba como una tecnología interesante. Que vaya a liderar esta parte que elija qué y cómo. Yo estos días voy a tener q priorizar otras cosas, q si no, no llego. El 01/01/2015 20:41, "Irene Córdoba Sánchez" notifications@github.com escribió:

Ya... bueno al menos dejamos el proyecto de GitHub por si nos da por retomarlo o mejorarlo en el futuro :D que se ha quedado chulo.

Volviendo al issue, cuando me has dicho que use Sphinx, imagino que tenías en mente generar varias páginas en HTML, pero ¿es realmente necesario? ¿no podemos poner los apartados directamente en el about.html con headers y un índice al principio con links? ¿o qué tenías en mente?

— Reply to this email directly or view it on GitHub https://github.com/jgsogo/muia-linkeddata/issues/14#issuecomment-68495905 .

ghost commented 9 years ago

Ok como yo estoy igual que tu e imagino que Alfonso también andará liado entonces hago yo el breve texto en el about.html y luego hacemos el pdf y listo. Crearé otro issue para la repartición del pdf.

alfhonso commented 9 years ago

Me parece bien.

ghost commented 9 years ago

He subido el texto del about. Solamente quedaría rellenar los enlaces al documento de la ontología y al de Linked Data que hagamos. Si algo no os gusta cambiadlo, lo he hecho en plan visión general porque luego en los documentos ya damos muchísimo detalle.

ghost commented 9 years ago

No se nos tiene que olvidar subir los pdfs de la ontología y de la aplicación cuando los tengamos y actualizar los enlaces del about.

ghost commented 9 years ago

BUMP

Creo que sigue faltando actualizar los enlaces del about, ya tenemos los pdf ^^

jgsogo commented 9 years ago

venga ahí d218dbf8e910595bf6b3ca1473bb2d3f85f02f1c