varianter / handbook

Åpen Variant håndbok
https://handbook.variant.no
Other
22 stars 14 forks source link

Forbedringer på hvordan vi indekserer #292

Open cbrevik opened 1 year ago

cbrevik commented 1 year ago

image

Slug/title/url null, fra første punkt:

  {
    "slug": null,
    "title": null,
    "urlPath": "/",
    "matter": {
      "title": "En variants håndbok"
    },
    "systemId": "handbook",
    "url": "/#null",
    "content": "Her forsøker vi å beskrive hvordan ting gjøres i Variant, hva vi prøver å oppnå\nog hvorfor vi tenker som vi gjør. Denne er både for ansatte og folk som er\nnysgjerrige på hvordan det er å være en variant. Håndboka er et levende dokument\nsom vi ønsker alle ansatte skal ha eierskap til. Vi oppfordrer alle til å endre\neller legge til innhold i den. Håndboken\n ligger åpent på GitHub  hvor\n alle kan sende inn endringer \neller  stille spørsmål .",
    "department": [
      "Trondheim",
      "Oslo",
      "Bergen",
      "Molde"
    ]
  },

Sample på punkt to, <code> faller ut, se også håndbok https://handbook.variant.no/information#Heimevernet-(HV)-og-militaertjeneste

{
    "slug": "Heimevernet-(HV)-og-militaertjeneste",
    "title": "Heimevernet (HV) og militærtjeneste",
    "urlPath": "/information",
    "matter": {
      "title": "Det praktiske"
    },
    "systemId": "handbook",
    "url": "/information#Heimevernet-(HV)-og-militaertjeneste",
    "content": "Variant dekker lønn under HV-øvelser. Dette timeføres som vanlig under\n .",
    "department": [
      "Trondheim",
      "Oslo",
      "Bergen",
      "Molde"
    ]
  },
cbrevik commented 1 year ago

Disse faller ut også, i tillegg til verdiene: image

cbrevik commented 1 year ago

Skulle vi hatt en linter på indekseringen kanskje?

cbrevik commented 1 year ago

Burde utrede om vi skal returnere markdown til indeksering for GPT/vector-database. Jeg vet at GPT kan forstå markdown, og kunne i så tilfelle også gitt lenker til de som spør spørsmål. Men usikker på om markdown her ville ødelagt relatedness-søk på embeddings - så der må kanskje ren tekst til.

mikaelbr commented 1 year ago

Tror forresten dette kan løses enkelt med a legge til flere noder til indexeren