flegmatematik / BC_Lukas_Loffler_OdhadVlakovychSuprav

0 stars 0 forks source link

Rozdiely Medzi PlanDrivingTime a RealDrivingTime #12

Open flegmatematik opened 4 years ago

flegmatematik commented 4 years ago

V datasete su data, v ktorých Plánovaná jazdná doba je niekedy aj niekoľko hodín ale jeho reálna doba je iba niekoľko minút (bavili sme sa o tom cez mobil). Keďže pri predikcií, nemám prístup k reálnej jazdnej dobe, tak by som nemohol zistit, ci tieto dáta su nespravne. Mam tieto data teda vyradit pri oprave dát? Alebo mam ich radsej ponechat, aj ked su nespravne, pretoze ich neviem v praxi odhalit?

KelloTomas commented 4 years ago

Piprosim ta o select, ktory tie riatky vypise.

Rozhodnutie podla poctu takych riadkov a datumu. Ak sa to vyskytovalo len na zacistku v rokoch 2016-2018. Tak vymazat. Ak su take aj 2019 a 2020 tak zistim preco to nastava. Len potrebujem select. Alebo oblast a id vlaku

flegmatematik commented 4 years ago

SELECT [FromName] ,[ToName] ,[TrainType] ,[Weight] ,[Length] ,[CarCount] ,[AxisCount] ,DATEDIFF(SECOND,[DepRealTime],[ArrRealTime]) as RealDrivingTime ,DATEDIFF(SECOND,[DepPlanTime],[ArrPlanTime]) as PlanDrivingTime ,COALESCE([LengthSect],0) as LengthSect ,COALESCE([PredLength],0) as PredLength ,CASE WHEN DATEPART(MONTH,DepPlanTime) in (3,4,5) then 'Jar' WHEN DATEPART(MONTH,DepPlanTime) in (6,7,8) then 'Leto' WHEN DATEPART(MONTH,DepPlanTime) in (9,10,11) then 'Jesen' WHEN DATEPART(MONTH,DepPlanTime) in (12,1,2) then 'Zima' END as Season, year(DepPlanTime) as year FROM [TrainsDb20-01-23].[dbo].[CZ-PREOS_GTN] where DepPlanTime IS NOT NULL and DepRealTime IS NOT NULL and ArrRealTime IS NOT NULL and ArrPlanTime IS NOT NULL and FromName <> ToName and DATEDIFF(SECOND,[DepRealTime],[ArrRealTime]) > 60 and (DATEDIFF(SECOND,[DepRealTime],[ArrRealTime]) *5) <= DATEDIFF(SECOND,[DepPlanTime],[ArrPlanTime])

vyhodit ich nemam problem. Ale to jedno precistovanie dat robim tak, aby som mohol pri tej aplikacii vypisat, ze ak dostane nespravne data, tak na to upozorni. A tieto data by nemohol odhalit, kedze by som nemal RealDrivingTime. Tie hodnoty ktore su nad 86000 mi nevadia, tie mam osetrene. iba tie mensie hodnoty ma zaujimaju