njy622 / Onnanana_second-Projct

- 휴먼교육센터 2차 프로젝트 (미세먼지 빅데이터 분석)
1 stars 2 forks source link

2023.11.23 데이터 분석 #40

Open siant88 opened 9 months ago

siant88 commented 9 months ago

Image

변수 상관 관계 결과를 토대로

내용을 정리하면

일산화탄소는 차량수와 연관이 매우 낮다

하지만 이산화질소와 차량수는 연관이 유의미 하다로 해석됩니다.

또한 제가 수집한 데이터들을 합칠 때의 기준은 년,월별과 시도별로

합치게 되는데 여기에서 데이터가 부족한 변수로 인해

데이터의 총 개수가 낮아지게 되는 문제가 있습니다.

년,월별을 기준을 정하지 않고 데이터 분석을 한 이유는

저는 시간적, 비용적 문제가 있어 수집하는데 한계가 있기 때문에

일단 많은 데이터를 수집을 했기 때문입니다.

Image

이산화질소와 차량수는 연관이 있다로 볼수 있습니다.

Image

독립 표본 t-검정 결과해석을 해보면

t-통계량 값은 약 12.26입니다. 이 값은 두 그룹 간 평균 차이가 상당히 크다는 것을 나타냅니다. 일반적으로 t-통계량의 절대값이 클수록, 두 집단 간의 평균 차이가 더 크다고 해석할 수 있습니다.

p-값은 매우 작은 값으로, 이는 통계적으로 매우 유의미한 결과입니다. 일반적으로 p-값이 0.05 이하일 때, 우리는 두 그룹 간의 평균 차이가 우연히 발생했다고 볼 확률이 매우 낮다고 판단합니다. 이 경우, p-값이 0.05보다 훨씬 작으므로, 두 그룹의 평균 차이가 우연히 발생했다고 보기 어렵습니다. 이러한 결과는 두 그룹 간에 통계적으로 유의미한 차이가 있다는 것을 나타냅니다. 즉, 이 결과는 검정 대상이 된 두 그룹(여기서는 특정 기준에 따라 구분된 그룹일 것으로 추정됩니다) 사이에 평균 차량 수에서 통계적으로 의미 있는 차이가 존재한다는 것을 보여줍니다. 이 차이는 우연히 발생한 것이 아니라는 강력한 증거를 제공합니다.

하지만 현재 우리가 일반적으로 알기로는

자동차는 일산화탄소 배출량이 높다고 알고 있습니다.

대기오염물질 중 88.2%가 자동차 배출가스 등 수송 분야에서 발생되고 있으며, 2012년 기준 전국 대기오염물질 배출량 중 일산화탄소 62.9%, 질소산화물 32.2%, 미세먼지(PM10) 10.6%가 자동차에서 배출되고 있어, 대기오염의 주된 원인이 자동차에 의한 것임을 알 수 있습니다.

하지만 제가 수집한 이산화질소와, 일산화탄소는 대기중 시도별,월별데이터 입니다.

제 주관적인 견해로 해석하자면

이것은 개방된 곳에서 수집한 데이터입니다.

그리고 일산화탄소 (CO):

이러한 특성으로 낮은 수치들이 기록된 것으로 해석됩니다.

또한 프로젝트의 목표가 대기오염 미래예측을 통한 캠패인활동 활성화인데

현재 전세계의 탄소배출량 감소는 모든 나라의 목표이므로

일산화탄소에 대해서 해석을 해보자면

일산화탄소는 대기중에서 외부요인으로 인해 이산화탄소로 변환될 수 있고

탄소배출량은 기후 변화와 지구온난화에 대응하기 위한 목표로 설정되기 때문입니다.

세계적인 문제에 대해서 초점을 맞추기 위해서 탄소배출량이라는

워드를 정하므로 더욱 초점을 좁혔다고 해석됩니다.

초점을 좁힐수록 집중이 더 강화되기 때문입니다.

기후변화예측을 위해선

여러 환경요인들 데이터를 분석해야하는데

이것은 현재로서는 아직 어렵다 판단되고

조원들간의 회의를 통해서 정해야 할것으로 보임

그리고 일산화탄소의 대기측정치를 각 시의 도로데이터를 분석요망