DorkasV / jira-to-github-issues

0 stars 0 forks source link

Samme matrikel optræder flere gange i e_gis_matrikel --> fejl i jar-off. #110

Open sync-by-unito[bot] opened 3 months ago

sync-by-unito[bot] commented 3 months ago

Vi har konstateret at der er fejl i e_gis_matrikel som betyder at borgere ikke kan trække en attest på disse matrikler. Det drejer sig i hvert fald om matr. nre. 28dv og 28dx Klitmøller Huse, V. Vandet.

Fejlen består i at disse matrikler begge findes i 4 ens versioner i tabellen. Jeg kan ikke umiddelbart slette matrikler i tabellen så hvordan skal det løses??

Skal vi lave en ny total opdatering med downloadede data fra i dag eller kan I fjerne de 6 matrikler som ikke skal bruges ??

┆Attachments: image-20201007-090305.png | image-20221003-140341.png | image-20221003-140406.png | image-20221003-140858.png | JAR-1399 Analyse estimat_timebox.pdf | Matrikler med identiske geometrier i e_gis_matrikel.sql | Matrikler som optræder flere gange i JAR.xlsx | UPDATE e_gis_matrikel - Manglende matrikel i e_gis_matrikel.sql

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Her kan de 2 matrikler ses sammen med attributtabellen fra JAR (e_gis_matrikel)

!image-20201007-090305.png|width=827,height=407!

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Selvom billedet er fra JAR-test DB så er det samme problem i begge så I kan teste hvordan det kan løses på JAR-test DB

sync-by-unito[bot] commented 3 months ago

➤ Daniel Balint Szucs commented:

Hej Poul Jeg har set at jeres Matrikel plusminus kører ordenligt, og data hos Kortforsyning er også i orden, og de har ikke disse 3-3 overflødige polygoner.

Jeg kunne godt prøve at slette disse 6 polygoner fra deres test miljøs database. Som jeg kan se, ingen lokaliteter dækker disse matrikler. Det ville være et problem, hvis systemet forbinde dem sammen.

Hvis det løse problemet så er det fint, men det ville ikke forklare hvor fejlen stammer fra. Har I en gammel backup, der kunne vise os hvor længe tid siden har disse matrikler været sådan.

Og ja, hvis vi kan ikke fjerne manuelt, så kan total opdatering være en løsning,

Mvh Daniel

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Hej Daniel Jeg havde også tjekket data fra kortforsyningen og kommet frem til samme som dig.

Du må gerne se om du kan slette de 6 overflødige matrikler i testen og kan det lade sig gøre så gør vi det på driften også. Jeg kan lige tjekke om e_gis_matrikel har flere dubletter 🙂

sync-by-unito[bot] commented 3 months ago

➤ Daniel Balint Szucs commented:

Har har lige slettet de 6 stk. fra jeres testmiljø. Attesten virker det igen. Du må godt teste det.

Og så kunne jeg også slette fra jeres PRD.

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Jeg kan godt lave attest på testen 🙂 Har tjekket e_gis_matrikel på test og der er der 50 dubletter mens der på driften er hele 52 stk.

Har brugt følgende sql sætning:

SELECT matr, elavskode, COUNT() FROM egismatrikel GROUP BY matr, elavskode HAVING COUNT() > 1

matrelavskodeantal55155214l55155226101555k61015542005952319bq200595227603511n76035152005351238ai200535122005351238ah20053512541951123a5419512570654111r57065426213522bk6213526570654113a570654253055149n530551261015521c610155462135210cf621352753055152b530551265035325b650353261015521f61015542005952319ao2005952253055151b530551253055154b530551269105128dx69105146101557000o61015542005952319ae200595226610547000a66105427603518f760351569105128dv69105146503515x650351253055151e530551269025233e690252269025233d69025226610549x66105427603518g76035156503538c650353261015521d61015546207571by620757261015521a6101554541951123o54195127603519g76035156907523r690752260145538af60145522005952319ai2005952261015521e610155420059527000ac2005952255155214k55155226610549z66105426013565r601356661015521b61015546503538o650353261015521g61015546101557000n61015542005351238ak2005351253055153b53055126101556g6101554

sync-by-unito[bot] commented 3 months ago

➤ Daniel Balint Szucs commented:

Hej Poul Ja, der er en forskel med to, da jeg har slettet de første to matrikel-dubletter manuelt.

Det her script er bedre, da vi kan se både matrikel og elavskode selvstændigt.

Jeg har kørt din script på den nuværende RH, regionH’s db fra 2.6.5, og regionM’s db fra 2.6.5, og alle dem har martikler med dublet polygoner i. Alle disse databaser har mellem 30 og 60 dubletter.

Jeg foreslår at du overfører denne Jira til de fælles Jiras.

Mvh Daniel

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Efter Daniel har tjekket de øvrige DB kopier fra RH og RM så har jeg flyttet opgaven til JAR Jira. Peter Riis Hans Christian Ries : I bør måske lige tjekke jeres DB. Som skrevet tidligere så giver det problemer på jar-off hvis der ønskes en attest på en af dublet matriklerne for så virker attesten ikke.

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

Vi har 45 matrikler med dubletter, men kun 26 hvor aktiv = 'j'.

SELECT matr,matrnr, elavskode, COUNT() AS Antal FROM e_gis_matrikel --WHERE aktiv = 'j' GROUP BY matr, matrnr, elavskode HAVING COUNT() > 1 ORDER BY Antal DESCLaver vi selv script til sletning af dubletter? Hvorledes opstår dubletterne? Hvis det er efter 2.6.5, så er det vel en BUG.

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Hej

Det er rigtigt at aktiv skal være = j da de øvrige er historiske matrikler.

Daniel har slettet matriklerne beskrevet øverst i vores test-DB og vi kan godt få slettet dubletterne via scripts men vi skal være sikre på vi ikke sletter matrikler som anvendes i lokaliteter. Jeg ikke om det har betydning om det er en matrikel med et bestemt matrikel_tabelid som anvendes. Så jeg vil gerne at COWI finder ud af om vi blot kan slette dubletværdier eller om vi skal lægge et nyt komplet matrikel datasæt ind.

Daniel har testet på DB versioner som er i 2.6.5 så der er nok tale om dubletter som har været der i lang tid.

sync-by-unito[bot] commented 3 months ago

➤ Hans Christian Ries commented:

Vi har 23 matrikler med aktive

SELECT matr,matrnr, elavskode, COUNT() AS Antal FROM egismatrikel WHERE aktiv = 'j' GROUP BY matr, matrnr, elavskode HAVING COUNT() > 1 ORDER BY Antal DESC

matr matrnr elavskode Antal 4101518aø 8aø 410151 7 4101518aæ 8aæ 410151 7 13403545bm 5bm 1340354 7 13302511ad 1ad 1330251 5 20067541gp 1gp 2006754 5 200435192b 92b 2004351 5 200435192a 92a 2004351 5 11701521x 1x 1170152 4 146025114a 14a 1460251 4 146025114b 14b 1460251 4 2008052421e 421e 2008052 2 2008052421f 421f 2008052 2 2008052421g 421g 2008052 2 2008052421n 421n 2008052 2 2008052421o 421o 2008052 2 2008052421l 421l 2008052 2 2008052421i 421i 2008052 2 2008052421m 421m 2008052 2 2008052421d 421d 2008052 2 2008052421p 421p 2008052 2 2008052421q 421q 2008052 2 2008052421h 421h 2008052 2 2008052421k 421k 2008052 2

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

Jeg har fjernet dubletter i vores TEST miljø med dette script, under den antagelse at vi ønsker at bevare MAX(matrikel_tabelid), da denne er typen int Identity.

DECLARE @svn_revision varchar(15) = '$Rev: $' DECLARE @db_version varchar(15) = '4.01' DECLARE @pakke_version varchar(15) = 'RSj' DECLARE @scriptnavn varchar(60) = 'DELETE e_gis_matrikel dubletter.sql' DECLARE @beskrivelse varchar(250)= 'Slet dubletter af aktive matrikler i e_gis_matrikler '

BEGIN TRY BEGIN TRANSACTION DELETE FROM e_gis_matrikel OUTPUT CONCAT('Slettet den ', CAST(GETDATE() AS date)) AS Info, DELETED.matrikel_tabelid, DELETED.wkt, DELETED.matr, DELETED.aktiv, DELETED.elavskode, DELETED.matrnr WHERE matrikel_tabelid IN (SELECT matrikel_tabelid FROM (SELECT m.matrikel_tabelid, m.wkt, m.matr, m.aktiv, m.elavskode, m.matrnr , RANK() OVER(PARTITION BY matr,matrnr, elavskode ORDER BY matrikel_tabelid DESC) AS Rank_matrikel_tabelid FROM e_gis_matrikel m WHERE matr IN (SELECT matr FROM (SELECT matr,matrnr, elavskode FROM e_gis_matrikel WHERE aktiv = 'j' GROUP BY matr,matrnr, elavskode HAVING COUNT(*) > 1) AS dub ) ) AS dub_rank WHERE Rank_matrikel_tabelid > 1 )

    IF OBJECT_ID(N'[dbo].[script_log_gm]') IS NOT NULL
    BEGIN
        INSERT INTO script_log_gm (db_version,pakke_version,dato,scriptnavn,beskrivelse,svn_revision)
        VALUES  (@db_version,@pakke_version,getdate(),@scriptnavn,@beskrivelse,@svn_revision)
    END

--ROLLBACK TRANSACTION;
COMMIT TRANSACTION;

END TRY BEGIN CATCH SELECT ERROR_NUMBER() AS ErrNum , ERROR_MESSAGE() AS ErrMsg ROLLBACK TRANSACTION; END CATCH; GO

sync-by-unito[bot] commented 3 months ago

➤ Hans Christian Ries commented:

Tak for scriptet, Peter men jeg vil ikke slette noget før vi har styr på hvad det bevirker 🙂

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

Klart nok, men e_gis_matrikel er orphan table og står alene.

Vi afventer COWI.

sync-by-unito[bot] commented 3 months ago

➤ Kim Jacobsen commented:

Hej Filip,

Daniel har videre sendt denne til mig? Men regionerne har jo rent faktisk bedt jer om at svare på om deres antagelser vedr. opretning af data i e_gis_matrikel - hvor dubletter fjernes - er rigtig.

sync-by-unito[bot] commented 3 months ago

➤ Kim Jacobsen commented:

Du bedes give et bud på hvor meget tid I skal anvende for at svare på dette

sync-by-unito[bot] commented 3 months ago

➤ Filip Bruman commented:

Kim Jacobsen

Hvilken release skal Jira indgå i?

sync-by-unito[bot] commented 3 months ago

➤ Hans Christian Ries commented:

Burde vi ikke få Cowi til at se på hvordan det kan lade sig gøre, i det eksisterende setup, at få dubletter i e_gis_matrikel tabellen?

sync-by-unito[bot] commented 3 months ago

➤ Kim Jacobsen commented:

Hvor er vi egentligt med denne?

sync-by-unito[bot] commented 3 months ago

➤ Anders Rosengreen commented:

Kim Jacobsen

Hej Kim,

Hermed timebox for https://jar-cowi.atlassian.net/browse/JAR-1399 ( https://jar-cowi.atlassian.net/browse/JAR-1399|smart-link ) til din godkendelse: Konsulent: 25 timer Seniorkonsulent: 5 timer Projektleder: 3 timer Pris: 19.793 kr.

Mvh

Anders

sync-by-unito[bot] commented 3 months ago

➤ Kim Jacobsen commented:

Analysen skal udmønte sig i specifikation af en løsning.

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

HC har også bekræftet af scripts virker.

Poul Haugaard, har du undersøgt hvad årsagen er til at der er kommet dubletter ind i e_gis_matrikel? Dubletterne er sikkert opstået ifm. indlæsning af matrikelkortet og/eller +/- data.

Er der potentielt mulighed for at vi fremadrettet kan få dubletter ind i e_gis_matrikel?

Assign issuet til Kim efter du har svaret. så beslutter vi om hvad der skal ske med dette issue eller om der skal oprettes et nyt. Det er essentielt af vi ikke fremadrettet får dubletter ind i tabellen.

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Peter Riis Jeg har ikke undersøgt årsagen til at dubletter er kommet ind men er rimelig sikke rpå at det må skyldes opdateringer fra KMS (GST) mest sandsynligt ved fulde opdateringer.

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

Kim Jacobsen , hvad gør vi med dette issue?

sync-by-unito[bot] commented 3 months ago

➤ Kim Jacobsen commented:

Region Hovedstaden, Region Midt, Region Nord laver oprydning med ovenstående script

Hvis problem genopstår skal sagen tages op igen

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Region Nordjylland har kørt scriptet på både test og drift. I vores database var der stadig matrikler som var dubletter men kun fordi de var der med “aktiv” sat til både ja og nej - altså en aktiv version og en IKKE aktiv version. Det giver problemer på den offentlige side så jeg har eterfølgende slette de IKKE aktive matrikler. Vi havde 41 stk. Nu virker den offentlige søgeside igen 🙂

sync-by-unito[bot] commented 3 months ago

➤ Tom Birch Hansen commented:

I Midt har vi 19 matrikler med dubletter aktiv=ja ( een af dem med 29 styk(2005752420a)) på drift.

På test har vi 19 matrikler med dubletter aktiv=ja (helt identisk med driften)

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

Tom Birch Hansen har I kørt scriptet https://jar-cowi.atlassian.net/browse/JAR-1399?focusedCommentId=32723 ( https://jar-cowi.atlassian.net/browse/JAR-1399?focusedCommentId=32723|smart-link )

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Jeg har testet JAR_drift igennem, og havde 173 dubletter og jeg havde kørt Peters script da han lagde det på issuet. Jeg har gennemgået nogle af dem som jeg har fået og de er med Approbations dato i f.eks. november 2021 og den vedlagte er fra februar 2022 så vi kan stadig lave dubletter. På billedet er vist matr. nr. 43dr og 43ds som begge optræder med dubletter i e_gis_matrikel.

!image-20221003-140341.png|width=637,height=34!

!image-20221003-140406.png|width=1436,height=506!

!image-20221003-140858.png|width=1683,height=67!

Jeg kører Peters script igen på torsdag men vi skal have fundet ud af hvordan de kan opstå.

sync-by-unito[bot] commented 3 months ago

➤ Peter Riis commented:

Vi har sat overvågning op på tabellen e_gis_matrikel (DDS i SSRS) og vi har stadig ingen dubletter.

SQL

SELECT matr, matrnr, elavskode , COUNT() AS Antal FROM egismatrikel WHERE aktiv = 'j' GROUP BY matr, matrnr, elavskode HAVING COUNT() > 1 ORDER BY Antal DESC GO

sync-by-unito[bot] commented 3 months ago

➤ Hans Christian Ries commented:

Region syd har ingen i driften 🙂

sync-by-unito[bot] commented 3 months ago

➤ Poul Haugaard commented:

Jeg har nu kørt scriptet på vores drift igen og sammenlignet med de filer vi har modtaget fra GST som ligger i PlusMinus_backup.

Jeg har vedlagt et excelark som viser de matrikler vi havde og hvordan de var afleveret fra GST. Jeg har indsat de rigtige geometrier i kolonnen WKT men dem som starter med “POLYGON ((“ var gældende for dem med samme baggrundsfarve. Det viser at fejlene er kommet fra GST da vi har modtaget JORDSTYKKE_M som har indeholdt alle matrikler som skulle slettes mens JORDSTYKKE indeholdt de matrikler som skulle lægges ind dog med den udfordring at flere af dem havde samme geometri som betyder der er huller i e_gis_matrikel men også matrikelgeometrier liggende oven på hinanden. Det hele kan ses i excelarket. Hvor de enkelte datoer også er vist for hvornår vi fik disse data leveret. Har ikke modtaget +/- stykker med fejl

[^Matrikler som optræder flere gange i JAR.xlsx]

siden den 1. august 2022