Open cbrevik opened 1 year ago
Disse faller ut også, i tillegg til verdiene:
Skulle vi hatt en linter på indekseringen kanskje?
Burde utrede om vi skal returnere markdown til indeksering for GPT/vector-database. Jeg vet at GPT kan forstå markdown, og kunne i så tilfelle også gitt lenker til de som spør spørsmål. Men usikker på om markdown her ville ødelagt relatedness-søk på embeddings - så der må kanskje ren tekst til.
Tror forresten dette kan løses enkelt med a legge til flere noder til indexeren
<divs>
faller ut av indeksering, øverste seksjon i håndbok fornull
påslug
,title
ogurl
etter denne: https://github.com/varianter/handbook/commit/701377a136d855a794379c289f5a1e7c07be7aee#diff-e0ea75075db38b859f48651afcf18e8d09f7c1af738d0d0951d739e3abd0f2cc (men gjelder flere plasser)<code>
og<strong>
utelates fra indeksering - sikkert flere typer som utaltes?<li>
deles opp i enkelt-items. I noen tilfeller kan det være greit der hvor det er lengre tekst som under Likestilling: "Du får selvsagt full lønn under foreldrepermisjon." - mindre heldig der hvor det bare listes ut korte ting, som under Gadgets: "Aug 2018: 10 000 kr" - eller under Helse, hvor en er kun "Operasjon"Slug/title/url null, fra første punkt:
Sample på punkt to,
<code>
faller ut, se også håndbok https://handbook.variant.no/information#Heimevernet-(HV)-og-militaertjeneste