mvk-team42 / Veracitor

An application that studies the trust in a network of users, sources and articles
6 stars 2 forks source link

Returvärde och P'n i sample_bounds #28

Open mrunelov opened 11 years ago

mrunelov commented 11 years ago

Vi kan börja med vad som står i texterna:

I SUNNY så används returvärdet från sample_bounds till att sätta P⊥(source) och P⊤(source). (Se paper). Och det skrivs att sample_bounds ska räkna ut saker som handlar om source, så inget konstigt där, egentligen. Och det är iofs inget problem att göra det, tror jag, men då förstår jag inte riktigt varför man har en counter för xmin och xmax för ALLA noder i sample_bounds. Citat kring detta från paper (8:9):

"SAMPLE-BOUNDS keeps a counter for both minimum and maximum case at each intermediate node, which are initialized to 0 at the very beginning of the sampling process. If, in this simulation, the algorithm samples that n is TRUE in the minimum and/or in the maximum case, then the corresponding counters are incremented. At the end of the successive simulations, the counter values associated with each node are divided by the total number of simulations in order to compute the estimates for the lower and upper bounds P⊥(n) and P⊤(n)."

Men det verkar ju som att SUNNY bara behövde detta P för source? Vad missar jag? Kanske att sample_bounds använder dessa internt på nåt sätt. Väldigt otydligt isf. (Som det mesta i den..)

Just nu lagras alla P i två dicts (utan att användas), och P'n för source returneras.

mrunelov commented 11 years ago

Har pushat ett förslag nu, som bygger lite på att sample-bounds körs i två "varianter". En initial sampling, och en andra sampling som återanvänder de samplade värdena från förra körningen för mellanliggande noder. I texten säger dom att dom använder de förra värdena i en "hill-climbing to finalize a decision". Vilket den nu gör. Väldigt oklart om den gör det på rätt sätt dock.