Open minzero31 opened 3 months ago
모든 경우의 수를 데이터셋으로 제공할 필요가 없음.
---> 어차피 인공지능은 user의 반응에 따라 output이 결정되기 때문에 모든 경우의 수를 줄 필요 X, ===> 인공지능이 이기는 경우만 넣어서 학습 시키고 최대한 많이
--> 결과가 정해져 있기 때문에 지도학습을 사용해야 함. ---> 5초 간격으로 넘겨주고, 결국 이기는 팀이 나오기 때문에.
그렇다면? 학습을 시켜야 하는 데이터셋은 무엇이 되어야 하지...? 일단 1) 15초/30초/60초 내에서 AI와 사람이 각자 폭탄을 가지고 있는 폭탄 체류 시간..? 을 쭉 나열 --> 최소 3,6,15 ---> 최대 15, 30, 60, 이렇게 가능 .. 2) 단순히 사람한테 넘겨 받은 초기 시간 + 다시 사람에게 넘겨준 시간만 넘겨줄지...? --> 그러면 이겼는지 여부가 의미가 없는 건가..?
지도학습 - 회귀 를 사용하는 게 적합한가? 사용자의 폭탄 넘겨주는 시간 or 폭탄 체류 시간..? 을 기반으로 그에 대해 AI가 폭탄을 넘겨줄 시간을 정하는 거니끼ㅏ>>> 0----> 즉, 과거의 데이터들을 기반으로 새로운 input에 대한 output을 예측하는 것...
참고 자료 : LSTM 시계열 예측 모델 https://velog.io/@lazy_learner/LSTM-%EC%8B%9C%EA%B3%84%EC%97%B4-%EC%98%88%EC%B8%A1-%EB%AA%A8%EB%93%88-%EB%A7%8C%EB%93%A4%EA%B8%B0-1