IIC2440 / Syllabus-2024-1

20 stars 0 forks source link

[Tarea 2] Implementacion de programa para Subgrafo #20

Open pedrozavalat opened 5 months ago

pedrozavalat commented 5 months ago

Hola, no entiendo muy bien que es lo que se pide para este caso:

  • Asume ahora que recibes un subgrafo como tres arreglos: un arreglo A con las variables, otro L con los tipos de aristas, y una matriz M de tamaño |A| × |L| × |A| que tiene un uno en la posicion (x, R, y) si y solo si (x, R, y) es una arista de tu subgrafo.
  • Implementa un programa en PySpark que reciba un patr ́on que tiene solo variables, y exactamente cuatro variables, y entregue todos los matches de ese patr ́on (como tuplas de 4 nodos) en el grafo usando b4 reducers, donde b es un par ́ametro.

Este subgrafo será entregado mediante algun archivo, o debe ser creado a partir del procesamiento de la RDD?

Si entiendo bien, solo para confirmar, para esta parte de la tarea deberiamos construir una RDD a partir de la matriz de adyacencia M que se entregaria con el fin de encontrar patrones de solo 4 variables?

Saludos!

juanreutter commented 5 months ago

Hola! El primer bullet simplemente habla de como vamos a codificar los subgrafos. En el segundo bullet debes asumir que recibes un patrón con ciertas características. Los patrones son subgrafos, por tanto, asume que viene codificados según la explicación de arriba. Entonces, lo que tienes que hacer es una programa que reciba un patrón y entregue todos los matches de este patrón en tu RDD, la que levantaste antes desde Neo4j.

pedrozavalat commented 5 months ago

Aaaah ya, ahora entiendo, Muchas gracias!