Randers-Kommune-Digitalisering / auto-tilskudsberegning-fodterapi

Beregning af tilskud til WorkLet fodpleje-fakturaer med pensionsdata fra KP.
0 stars 0 forks source link

Tilføjelse af løskoblet webscraping service #65

Closed st-randers closed 1 year ago

st-randers commented 1 year ago

Byg en løskoblet selvstændig webscraping komponent der kan opereres via remote kald og returnere scrapet data i et åbent standard format.

Teknologi forsøg med puppeteer og https://hub.docker.com/r/browserless/chrome#puppeteer som selvstændig løskoblet service.

Research links-->

1) Puppeteer https://github.com/puppeteer/puppeteer/blob/main/docs/troubleshooting.md#running-on-alpine https://github.com/puppeteer/puppeteer/pkgs/container/puppeteer https://pptr.dev/guides/docker (Puppeteer + Chromium incl. dependencies)

2) Chrome + Dependecies https://hub.docker.com/r/browserless/chrome https://github.com/Zenika/alpine-chrome

3) Node-red

Andre referencer: https://www.howtogeek.com/devops/how-to-run-puppeteer-and-headless-chrome-in-a-docker-container/

ghost commented 1 year ago

Forsøg med test af https://hub.docker.com/r/browserless/chrome#puppeteer som service.

Tilgåes som js metode med const browser = await puppeteer.connect({ browserWSEndpoint: 'ws://servicenavn:3000' }); hvor servicenavn er det det definerede servicenavn fra docker-compose filen.

Ny compose laves.. @jmk-randers

ghost commented 1 year ago

@st-randers : Lad os tale om hvilke af disse settings der kan være relevante for dit scraping flow: https://www.browserless.io/docs/docker

ghost commented 1 year ago

@st-randers: Test med const browser = await puppeteer.connect({ browserWSEndpoint: 'ws://browserless:3000' });