malmostad / sitevision_assets

Sitevision specific assets used in addition to Global Assets
http://malmostad.github.io/wag-external-v4/
GNU Affero General Public License v3.0
0 stars 1 forks source link

Gå över till SiteVisions egna sök #375

Open magnivar opened 6 years ago

magnivar commented 6 years ago

Vi vill kunna använda SolR på malmo.se när vi i framtiden hanterar sidhuvud.

Etablera SolR sök på www.test.malmo.se och få till "formel" som ger relevanta resultat

israelsson commented 6 years ago

Hej! Jag har gjort ett provskott på test.malmo.se med sitevisions egna sök. Det är bara en snabb uppsättning så allt kanske inte ser OK ut i alla browsers men det ger säkert ett hum om vad man kan göra med den inbyggda söken.

Ni hittar den på: https://www.test.malmo.se/4.719e72ae160e0f98c2552224.html

Mvh Anders

olajoh1 commented 6 years ago

Jag har gjort ett första test med 20 sökord.

Resultat: Siteseeker 17 korrekta träffar på första plats Sitevision 10 Google 18

Jag tror att resultaten kan förbättras avsevärt om de olika filtyperna får olika vikt.

Kan ni ställa motorn så att följande filtyper får olika vikt enligt nedan (vi kommer att få tweaka men börjar så här):

Sidor - 100 PDF - 60 Officedokument - 40 BIlder - 20 Video - 60

israelsson commented 6 years ago

Hej!

Nu har jag lagt in söken på malmo.se också, länken är http://malmo.se/4.685fbbb5160dbb463c2a34d8.html

Mvh Anders

badwiz commented 6 years ago

VI har en plan:

  1. Bouvet fixar indexering under fredag eftermiddag (19/1)
  2. Bouvet uppdaterar sökmodulen med rätt index
  3. @olajoh1 verifierar sökträffar under v4
  4. Bouvet fixar boosting av olika filtyper v5
  5. @olajoh1 verifierar sökträffar efter boosting v5
  6. Uppsättning av Nutch fär webcrawling under v5-v6
olajoh1 commented 6 years ago

Är p. 2 klar? @israelsson

olajoh1 commented 6 years ago

P. 3 klar --> dax för 4. Boosting

badwiz commented 6 years ago

P.4 klar Dock är det så att för attt få bilder att rankas ännu lägre än andra träffar (de har redan lägre ranking än sidor default) måste detta skötas manuellt i sökmodulen (tips från coachen Magnus Lövgren) och inte via sökindexet som jag har satt upp detta just nu.

olajoh1 commented 6 years ago

Inga märkbara förbättringar.

Vill du ändra i receptet

Sidor - 100 PDF -60 >>40 Officedokument - 40 ->> 20 BIlder - 20 Video - 60 >> 40

badwiz commented 6 years ago

Fixar, men väntar till eftermiddagen med att köra en omindexering. Återkopplar när indexeringen är gjord, då kan du testa och se om det blir någon förändring.

badwiz commented 6 years ago

Ping @olajoh1 Nu är indexeringen klar med de nya värdena. Men för att hantera bilder får vi nog tweaka i modulen och inte bara i indexet enligt SiteVision.

olajoh1 commented 6 years ago

Vill du justera receptet

Sidor - 100 PDF -60 >>40 >> 20 Officedokument - 40 ->> 20 >> 10 BIlder - 20 >> 10 Video - 60 >> 40 >> 20

P.S: Skicka gärna epostadress så kommer Siteimprove med vändande.

badwiz commented 6 years ago

Nu är detta fixat och indexet är uppdaterat med nya värden! Ping @olajoh1

olajoh1 commented 6 years ago

Ser ingen skillnad efter sista ändringen. VI går vidare ändå. Nedan kan du se hur Siteseeker viktar de parametrar de arbetar med. Vi eftersträvar att få till något liknande.

Fundera på vad ni tror är möjligt. De parametrar som har högst värde är förstås viktigast att "få till".

image