njy622 / Onnanana_second-Projct

- 휴먼교육센터 2차 프로젝트 (미세먼지 빅데이터 분석)
1 stars 2 forks source link

2023.11.30일 회의록 #65

Open njy622 opened 9 months ago

njy622 commented 9 months ago

23.11.30.회의록.txt

njy622 commented 9 months ago

새로운 노트 2023.11.30 목 오후 4:23 ・ 17분 0초 남지영

참석자 1 00:00 네 말씀하십시오.

참석자 2 00:03 그러니까 이게 지금 강원 형이 하시는 말씀이

참석자 3 00:07 그렇게 말하면 그렇게 보이면 이해가 안 되는데

참석자 4 00:11 이거 왜 먹어야 돼?

참석자 1 00:13 영화 언니가 써도 된다고 그랬어.

참석자 3 00:17 지금 뭐라고 해야 되지? 우리가 배웠던 딥러닝 예측할 때 있잖아요. 어떻게 예측을 하냐면 현재 데이터를 바탕으로 예측을 해요. 그래서 만약에 이런 그래프가 있는데 이런 식으로 그래프가 있어요. 그리고 만약에 예측도 막 이런 식으로 가요. 그러면은 이 이 지점마다 만약에 얘가 예측 그래프예요. 그럼 얘가 예측을 할 때 이 데이터를 바탕으로 예측을 하는 게 아니라 이 데이터를 바탕을 예측을 해요. 그러니까 현실 데이터를 바탕으로

참석자 2 00:59 그러니까 지금 저기 데이터가 지금 현실 데이터랑 하나는 뭐예요?

참석자 3 01:03 약간 이게

참석자 3 01:11 미래 예측이라는 게 되게 나도 처음에는 이런 자세한 건 몰랐는데 하다가 알게 된 거라서 이거는

참석자 3 01:23 만약 이런 식으로 있다 치면은 아무튼 대충 이게 빨간색이 예측한 데이터예요. 근데 이 빨간색이 예측한 데이터들은 웃기게도 자기 데이터를 쓰는 게 아니라 원래 있는 값을 바탕으로 예측을 해.

참석자 2 01:48 현지 데이터를 바탕으로

참석자 3 01:49 그러니까 지 데이터를 바탕으로 하는 게 아니라

참석자 2 01:51 얘 데이터가 어디 있는데 없잖아요.

참석자 3 01:53 그러니까 우리가 모든 배웠던

참석자 1 01:57 훈련을 시켜서

참석자 3 01:58 이번에 배웠던 거 세토사 그런 거라든지 아이리스라든지 피마 공유병이라든지 모든 그 데이터는 다 예측을 했을 때 현재 있는 데이터를 바탕으로 예측을 했던 거야. 그러니까 예측을 하는 시점마다 그 데이터를 불러와서 예측을 하고 데이터를 불러와서 예측을 해. 근데 이건 미래 예측이 아니야. 그러면 어떻게 보면 그러니까 이거 미래 예측을 할 수는 있어. 한 번은 한 스텝은 가능해. 원 스텝은 만약에 이 예측 확률이 75%야. 그럼 한 스텝은 75% 확률로 맞출 수 있는데 이 이유가 문제야. 왜냐하면 이 이후부터는 이 한 스텝이 나아가는 이 데이터는 우리의 데이터야. 우리가 미래를 예측하는 데이터 그러니까 이거 데이터 자체가 그거 얘기 들어봐 이건 말이 안 된다. 어쨌든 가상의 데이터잖아 현재 있는 데이터가 아니잖아요. 이것도 75%의 확률로 맞았는지 안 맞았는지 아직 알 수가 없어요. 우리는 그렇죠.

참석자 3 03:00 만약에 25%의 확률로 틀렸을 수도 있어요. 그럼 이 틀린 데이터를 바탕으로 또 다음 스텝을 나아가요. 이게 미래 예측이에요.

참석자 2 03:09 어 그 예측이겠지.

참석자 3 03:10 근데 이게 되게 75%라고 했잖아. 만약에 이게 25%의 나쁜 데이터야 이걸 바탕으로 75%로 또 얘를 예측을 해. 이거 스텝으로 넘어갈 때마다 어떻게 되겠어요? 근데 예측 데이터가 당연히 정확한 건 아니

참석자 5 03:24 그러니까

참석자 2 03:26 상관이 없지 않나라는 생각이 들거든요. 그러니까 만약에 이게 다 100%로 맞았으면 형님 말씀하신 주식도 그렇게 예측되면 다 떼어야 되잖아.

참석자 5 03:35 그렇죠

참석자 3 03:36 그래서 문제가 뭐냐면 그래서 그래프를 예쁘게 그리는 코드는 미래 예측하는 코드는 어느 정도 그릴 수 있게 됐어. 근데 실제 데이터

참석자 5 03:45 뭐

참석자 3 03:46 오전이라든지 기후라든지 보면 일정한 그래프의 흐름이라는 게 있거든요. 근데 이런 일정한 그래프의 흐름이 있는데 이게 잠깐 한 달 한 달까지 한 6개월 정도 예측을 한다 그러면 어느 정도 이 그래프가 살짝은 비슷해요. 근데 문제는 이게 몇 년이 넘어갈수록 어떻게 되냐면 이 예측을 한 데이터들을 바탕으로 뭐라고 최대값이 되나 최소값이 됐을 때 이게 점점 골이 깊어져요. 그래서 결국엔 어떤 식의 그래프가 되냐면 이런 식으로 돼버려

참석자 6 04:20 그때 심박수

참석자 3 04:22 그 모양이결국엔 이렇게 돼버릴 수밖에 없는 거예요. 이게 될 수밖에 없는 문제가 뭐냐 이것 때문에 현재의 데이터가 없으니까

참석자 5 04:30 음

참석자 6 04:32 모든 데이터가 다

참석자 3 04:34 네 그렇다고 편법으로 현재 데이터를 또 오려서 붙일 순 없잖아요.

참석자 5 04:40 그래도 그렇지

참석자 1 04:44 현재를 기준으로 예측을 할 수밖에 없긴 한데

참석자 3 04:48 그러니까 이게 먼 미래를 예측하기는 너무 어렵다. 그러니까 그래프를 이렇게 비슷한 패턴을 그리기는 너무 어렵다.

참석자 2 04:55 그러니까 이게 지금 몇 년을 예측한 건데요 몇 년 뒤를 예측한 거야

참석자 3 05:01 이거 나 10년

참석자 1 05:02 10년 근데

참석자 6 05:06 6개월 이상만 넘어가도 이렇게 나온다는 거 아니에요

참석자 3 05:09 한 2년까지도 괜찮긴 한데 2년까지 근데 이것도 거의 인연도 되게 좀 딥러닝이라는 게 비율이라는 게 있어요. 훈련 비율 테스트 비율 훈련 비율이 높을수록 그러니까 최저값이 8 대 2거나 9 대 1인데 대충 이렇게 했을 때 성능이 올라가거든요. 많이 보통은 실제로도 그렇고 근데 이 값을 역전시키면 성능은 떨어져요. 성능은 떨어지는 대신에 이 과거의 데이터를 많이 쓰겠다는 게 돼버려요. 그래서 그래프가 좀 이쁘게 나와요. 대신에 그래프 이쁘게 그리려고 성능을 떨어뜨릴 수도 없고 그렇죠 그러니까 지금 이런 딜레마에 빠져 있어요. 지금

참석자 1 06:03 쉬운 게 하나도 없네

참석자 3 06:07 그래가지고 그러면 우리가 지금 데이터가 부족해서 그런가 하면서

참석자 4 06:12 무슨 진짜

참석자 3 06:14 보관이라고 있는데 데이터 보관

참석자 1 06:16 그러니까

참석자 3 06:17 지금 월별 데이터잖아요. 근데 이

참석자 2 06:21 근데 그 데이터도 거의 한 10년 치 아니에요 거의

참석자 3 06:24 10년 치지만 월별이야 12개월 해서 12 곱하기 1에서 120 120개 근데 그거를 각 시도로 각 시도에서 17개씩 했는데 콜롬 수가 높아질수록 머신러닝은 그거래 가족합이래 그래서 보통은 데이터 개수를 높이는 게 좋지. 그래서 내가 그랬죠. 컬럼에 있는 것도 어차피 결국엔 같은 값이고 날짜만 같은 값에 그것만 다른데 이게 어떻게 과적합이냐 그러니까 컬럼에 들어가는 것은 분석할 때 딥러닝 자체의 모델이 그런 식으로밖에 안 돼 있대요.

참석자 2 06:59 일들 베이스는 없죠. 월별이 끝이지

참석자 3 07:02 일별 데이터로 하려면은 모르겠어. 기본은 있을 것 같고 데이터가 있어 오존도 있으려나 모르겠는데 오존

참석자 2 07:11 데이터 양은 늘리는 것 같아요. 일별 받아가지고 일단 오전만 받아본다든지 해서 그럼 이제 오전만 한 번 돌려봐서 데이터가 많아지니까 좀 이쁘게 나오면 쓸 만하니까 그 이거 우리가 예측을 전체 다 할 필요는 없잖아 되는 것만 이렇게 보여줘도 될 것 같고 맞아

참석자 3 07:30 그럼 차라리 데이터를 한번 다시 수

참석자 2 07:32 데이터 수집을 좀 많이 해서 양을 늘리면 괜찮을 것 같긴 해. 뭔가

참석자 1 07:36 얘기만 들어봤을 때는 데이터

참석자 2 07:38 일단 해보는 거지 정확히 해보겠다. 계속

참석자 3 07:41 쓸데없이 생각한 게 뭐냐면 1월부터 여기가 1월이고 만약에 2월이에요. 그럼 여기랑 점이랑 점이 찍혀 있잖아요. 그럼 수학적인 계산을 했을 때도 우리 이 점은 이 선은 점의 집합이잖아요. 그쵸 그쵸. 그래서 만약에 여기 30개의 점을 찍는다면 28개의 점을 찍는다면 이게 일별 데이터가 되지 않을까 해가지고 이 코드를 짜서 해봤어요. 근데 이렇게 하면 무슨 문제가 발생하냐

참석자 1 08:06 정말 그거는

참석자 3 08:08 그러니까 완전히 좀 이상하죠.

참석자 6 08:10 듣기만 해도 오늘

참석자 3 08:14 99% 맞춘 확률이 나오고 아무튼 이상해

참석자 6 08:17 그거야말로 정말 예측이고

참석자 3 08:20 그래가지고 또 생각한 게 그러면은 이 간격을 학습을 해가지고 여기에다가 머신러닝을 통해서 여기다 넣을 수 있냐 그런 코드도 있더라고요. 근데 지금 그 가운데 이거 헛 작업인 것 같아요. 지금 얘기할 수

참석자 6 08:39 말씀하신 대로 제일 먼저 해야 될 건 데이터를 일자별로

참석자 1 08:45 하는 게

참석자 3 08:47 우리 주제가 자체가 미세먼지 환경 기후니까 일단 이거는 일별로 모으는 게 맞는 것 같아. 맞아. 그래서 얘를 미리 예측을 하는 코드를 완성을 시켜놓고서 보여주고 나서 그다음에 이렇게 나빠지니까 그거 나빠지는 원인에 대한 것들은 월별 데이터 그거 모은 거를 쓰면 될 것 같아.

참석자 5 09:07 네

참석자 3 09:08 그전에 했던 제가 계속 올렸었잖아요. 그거는 그 이후에 나와야 될 것들이고 이게 그전 이게 시작 단계겠죠. 우리 모든

참석자 3 09:20 근데 일별로 해도 될까 걱정이다.

참석자 2 09:23 데이터 많아지면

참석자 3 09:24 될까

참석자 2 09:25 해봐야지 맞아요. 해봐야지.

참석자 6 09:28 저희 모든 개발이 다 일단 해보고 안 되면 그때 얘기

참석자 3 09:34 괜히 보관 작업을 한다고 하는

참석자 2 09:35 어차피 계속 하면 형도 느꼈겠지만 내가 생각한 대로 여기가 나오지 않

참석자 6 09:39 맞아요. 저도 봐요. 뭐 할 때마다 다 이어 뜨고 지금 빨간색 보이세요.

참석자 2 09:45 어제 남아서 한 게 그거였거든요. 카토그램 지금 우리가 파란색으로만 나오고 색이 연암 진남으로 지금 이렇게 농도가 나오잖아. 그러니까 그거를 우리 마지막으로 얘기했을 때는 서울 강남구 거기가 농도가 높으면 초록색 이렇게 변하고 글씨를 바꾸자고 그랬잖아. 원래는 그 카토그램을 바꾸려고 생각을 했었어. 카토그램 나오는 색을 그거를 어제 해마다 못해 하려다 못했고 일단은 글씨 바꾸는 건 됐어요. 그거는 이제 카토그램은 그냥 그냥 거기서 그냥 마무리를 지을까 하고 지금은 또 이제 원래는 지금 카토그램 또 이미지를 받아가지고 그러니까 그거를 이제 플러스크로 해서 이미지 받는 것까지 한 다음에 그걸 이제 스프링해서 그때 선생님이랑 얘기했을 때 스프링해서 불러와서 이제 거기서 이제 그 카톡이나 버튼 만들고 하려고 그랬잖아. 그래서 원래는 그래서 지금 아까 하던 게 그냥 플라스틱 서버를 만들려고 그랬어. 근데 모르겠는 거예요. 그러고 그냥 선생님 거 저기다가 그냥 추가하는 형식으로 할까

참석자 2 10:50 마지막에 우리 카카오 그거 한 거 있잖아요. 선생님하고 같이 한 거 있잖아.

참석자 4 10:56 카운스 그래서

참석자 2 10:57 얘한테 물어봤었거든 하고 있다고 그래서 그래서 얘도 그냥 카셀 알에다가 새로 하나 또 만들어지고 아래 가운데 보이자 커져 있는데 새로 하나 만들어 가지고 했더라고 그래서 나도 그냥 내가 짠 코드를 저런 식으로 넣어가지고 어차피 서버 띄우면 나올 것 같으니까 그러니까 그거예요. 그러니까 내가 지금 정확히 생각하고 있는 거로 있는데 지금 ipymb vs 코드에서 실행했을 때는 코드 실행하면 저장까지 돼 그거를 이제 여기다가 이제 붙여 넣는 거지 지금 저기다가 그래서 서버를 띄우면은 바로 나오나 그러니까 서버를 띄우면은 이미지 파일이 생성이 되는지가 지금 확신이 없어가지고 일단 해봐야 될 것 같긴 한데 서버를 띄운다고 해서 그 이미지 파일이 생성이 되냐 그게 지금 궁금해

참석자 3 11:48 빨리 잡아 가고 싶네.

참석자 2 11:52 왜냐면 그게 안 되면은 스프링에서 바랄 게 없으니까 그러니까 그게 만약에 바로 실행이 안 되면은 실시간 데이터 가지고 카토그램을 만들어서 이미지 파일로 저장한 건데 그게 안 돼버리면 받아서 이미지 파일로 저장이 안 되면 스프링에서 할 수가 없으니까 받아서 쓸 수가 없으니까.

참석자 3 12:14 근데 결국에는 그 카테고리 자체가 이미지 파일을 하는 거였어. 마지막은

참석자 2 12:18 그래서 이미지 파일로 받아

참석자 3 12:20 그 모듈 자체가 이미지요.

참석자 2 12:23 예 나온 게 이미지 진짜

참석자 3 12:26 그러면은 우리 어떡하냐 그거 옆에 띄우는 거

참석자 2 12:29 클 버튼 만들 수 있어요. 그러니까 이제 나도 그래서 이미지 파일이면 그 버튼을 만들 수 있나 했더니 만들 수 있대 진짜 만들 수 있다. 다행이 어떻게 취등생이 그러던데 내가 카톡을 만들어서

참석자 6 12:42 선생님 너무 믿으면 안 돼

참석자 2 12:43 아파트로 만들고 베트남 만들 수 있냐 했더니

참석자 4 12:45 오케이 오케이 그런 식으로 하면 안 돼

참석자 6 12:48 지 선생님한테 몇 번씩이나 물어봤는데 지금 답답해서 선생님 부르고 이거는 너무 믿을 수 없어.

참석자 2 12:57 근데 그게 안 된다 하면은 그걸 생각해야지 그냥 아예 플라스켓을 완성해서 스프링에서 그냥 띄워주기만 하는 걸로 생각을 해야지. 만약에 그게 안 되면

참석자 3 13:11 결국에 그치 이미지로 가야지 방법이

참석자 4 13:14 출자 값을

참석자 2 13:15 그것도 이미지 드로브 코리아 저장 안 돼가지고 모듈 만졌잖아.

참석자 1 13:20 진짜 너무 고생했다.

참석자 3 13:23 근데 그 클릭하는 것도 모듈에서 했어야 됐을 거야. 아마 하려면은 애초에 거기다 a 태그 정도는 달아야 되지 않을까 글씨에다가

참석자 2 13:33 그러면 내가 모듈을 만드는 게 말도

참석자 5 13:38 카테고리 제

참석자 1 13:40 아니 다 제 이름이

참석자 2 13:43 이제 좀 카테고리 만들 때 그래도 뭘 해야겠다 해야겠다 뭐라든가 이렇게 물어보면 되겠다 싶은데 뭔가 이제 플라스크랑 스프링 쪽으로 넘어가서는 좀 막막하더라고요. 반응이 많이 없어서

참석자 1 13:58 요즘 SQL이랑 같이 하고 있는데 SQL을 불러오면 돼 뭐 하나 하면은 안 불러. 아직

참석자 6 14:06 하나만 안 불러요. 지금

참석자 1 14:08 선생님한테 물어보면

참석자 6 14:09 간단한 방법이 아닌 거 지금 그러고 있어요.

참석자 2 14:13 충분히 할 수 있으려나

참석자 1 14:15 그러니까요.

참석자 6 14:18 그래도 저기

참석자 1 14:20 스탬프 찍고 거리 계산 되는 것까지는 다 되긴 하는데 이제 거기서 내가 찍은 것만큼 옆에다 띄우고 싶은데 그거를 못하고 있어요. 선생님 거 보면서 하려고 하고 있는데 지금 그 저거 회원가입하고 로그인하고 하는 것도 안 되고 있어서 그러니까요. 생각보다 어려워 내 SQL을 지난 프로젝트 때 만져봤어야 돼서

참석자 2 14:53 지난 거 할 때 플라스크 만들어봤어야 되는데 1차 할 때 그때 데이터만 가지고 있어가지고 그래서 데이터는 할 줄 알잖아.

참석자 3 15:02 맞아 너 AP 만만 했잖아 그래서 AP를 잘하잖아. 나는 그때 저번 거는 다 해가지고 상관이 없는데 아예 그러면 다 맞았었어 가지고 API만 빼고 저번에 그래서 API 출

참석자 2 15:16 API도 근데 그때 쓰는 API랑 지금 쓰는 API랑 달라서 사용 방법 아이 다르던데 요즘 제가 느끼기에는

참석자 1 15:26 아주 다 조금씩 조금씩 다르게

참석자 3 15:28 1월 2일 19면 카카오

참석자 1 15:30 같은 카카오인데 조금 거리 바꾸는 거 하면은 들어가는 경로도 다르고

참석자 3 15:35 그렇죠

참석자 1 15:36 그렇죠 거기는 더 복잡할 것 같은데요.

참석자 3 15:39 근데 지금 사용법이 있으니까 그래도

참석자 2 15:41 저걸 띄우는 것도 문제고 버튼 만드는 것도 문제고 그 버튼에다가 기상청 데이터 또 넣는 것도 문제

참석자 3 15:48 괜히 다 코팅일 거야. 아마 그런 거는 다 코트를 버튼식으로 옮긴 다음에 문자 들어가기만 죄다 모든 게 다 코트일 것 같아요. 지금 일단은 네 한글이다 보니까

참석자 2 16:00 할 건 생각 안 하고 있어. 받아오는 거는 만들어 놨는데 나중에 어떻게 넣어야 될지는 저거 띄우고 생각하라고

참석자 1 16:07 진짜 띄우는 게 우선이니까 저도 지금 띄우는 걸 우선으로 하려고 하는데 에스크 메기 어려워 SQL 제가 만지기 시작했으니까 제가 SQL 할게요.

참석자 3 16:23 15

참석자 1 16:25 망했어요.

참석자 3 16:27 근데 일단 저도 끝내면 한 번씩 다 만져볼 거예요. 저도 그

참석자 3 16:34 근데 모르겠네 지금

참석자 4 16:36 맞아 무슨 함수로만 지고 있어

참석자 2 16:42 이해하기 좀 힘들더라.

참석자 6 16:43 그렇죠 그래서 자꾸 질문 환영합니다라고 울렸던 게 분명히 이해 안 될 거란 말이죠.

참석자 6 16:56 템플릿 이쁘게 하는 건 나중에 생각하고 그냥 원래 거에다.

clovanote.naver.com