saykim0727 / IS511

0 stars 0 forks source link

05/15 Meeting #13

Closed AhnMo closed 6 years ago

AhnMo commented 6 years ago
  1. 머신러닝 - 정선용 Q. 현기 = 머신러닝으로 구체적으로 어떻게 분류를 할거냐... A. 선용 = 이미지 프로세싱만 해봐서 잘 모르겠지만 통신하는 메시지, 소켓 생성에 대해서 숫자를 부여, R. 현기 = 우리가 일단 구현이 먼저고, Feature를 정하는게 중요하다... 웹소켓 생성, 워커 생성, 다 좋은데 어떤 것들을 넣어야지만 의미가 있는 데이터가 될지... 우리가 뜬 구름씩으로 말하는 걸로는 힘들다. R. 선용 = 어떤 정상적인 사이트의 케이스도 분류를 해야... R. 정환 = 알렉사1000, 1만, 10만, 으로...

  2. Tensorflow.js - 현기 선용 = 학습된 데이터를 사용하면 js에서 판별하는건 빠르다. 정환 = 학습시킬때 브라우저 수정해야되는거 아니냐?? 라는 이야기

  3. 함수 호출하면 모든걸 실행하는... Function을 지정해서... 특정 Feature를 넣을 때.... 실제 ML을 할때의 이야기... 선용 = 사실 우리가 기존의 내용에서 6장을 더 늘려야되는데... 기존의 내용도 갈아 엎어야... 논문 양을 늘리고, 대부분 최신 연구에 적용한 방식을 우리도 적용해봤다 라는 보여주기식 Paper Theater...

평판 채크 , 패킷통신 채크, 호스트 베이스, 마지막 취합 - 우리랑 기존상 동일

  1. 기존에 있는거 완성을... 페이지에서 익스텐션으로 데이터를 전송해야하는 문제점 - 찾아보겠

  2. 일분배 1) 선용 --> 4 2) 주형 --> 같은 Threat Model, 광고vs마이닝, 유저측에서 보기 좋고, 비용적인 측면으로 어느게 더 이득인지, 마이닝 해야하는 이유를 더~~, 프로세스, 3) 정환 --> 페이지 1만개, 익스텐션 테스트 automation 방안 4) 현기 --> 아무것도 안함. 쉴꺼야.

20183300 commented 6 years ago

선용:

  1. 머신러닝이야기 ( feature ->>> 기준에의한 분류 -->> 특징적인 애들 찾기 ->> 뽑기 -->> feature 주제보다는 방법론 feature ->> worker 생성 1 /0 100가지 분류를 이벤트 학습을 위한 의미있는 데이터 뽑기를 위한 구체적인 기준은? 웹소켓 1000안에 있어야 -->> 진행중인 프로그램을 끝내고 native code -->> tensor flow JS -->> 학습 :Pyhton , C -->> 브라우저 소스코드 수정해서 브라우저를 실제 실행해서 학습을 시킨다. 임의로 설정하기 -->> FIX -->>

현기:

  1. 그냥 모든로그를 다 찍는다 ->> 시스템콜 --->> 로그 ->> 웹소켓 /워커 / --->> 세팅->> 머신 러닝 --->> 정확도 떨어질수있다. 정확도를 높이는 가공하는 일. 실제 ML 을 할때 이야기.

  2. 인트로덕션 --> 논문 양 늘리고 -->> 보여주기식으로 어떻게 실제적으로 성능 향상에 대한 기대. ->> 분량 채우기용 -->>> 6월 16일

기존에 만들던 프로그램 완성시키기 ->> extension // page// 에서 검사를 하고, send-messeges 2단 도메인 적용할수있는 방안.

--- > > > 사이트 - >> flag boolean --->> 통신패킷 OR ::-->>Websocket argument // key, appkey ->>> parsing 마이닝사이트 확인만 할 수 있다면// parsing -> --->>> ....site --->>>>> skip

virtual host 마이닝사이트 -랜덤하게 만들어놓고 indirect -- - >> ------------------------------------------------------내가 해야할일 --------------------------------------------------------

일단 -->> 대기 --------------------->>>>>>>>>>>>>>>>>>>-------->>>>>

같은 쓰레드 모델에서는 경쟁되는 상대가 광고, 마이닝 -> 파급력이 큰지 ( 광고 를 해야하는 이유 // 시간대비 / 유저측면 깊게 광고 프로세스를 위한 프로세스 스크립트 -->> 정리 // 구글 -->> 광고에 대한 --------------------------->>>>>> 마이닝 긍정적인 측면 -> 근거는 ? 광고 수익 . 이점 . 장시간 노출시에 마이닝이 좋은 효과를 노릴수있다. 광고 reward 시스템 --> 실질적으로 계산 할수있는지 ->> 깊게 팝업되는 클릭 -->> 실질적인 수 를 세거나 // 광고 -->> 리워드 시스템

---->> 마이닝 VS 광고 -->>>
-------------------랜덤하게 웹사이트 100개 천개 만개를 만들수있는 방안 ?? ------------------------------------------------ 테스트 사이트->> coverage 넓히기 위한 percebtage direct -->>어떤툴로해도 검거 할수있다. -->> 개인적으로 만들어서 ->> 자기 우회하는 사이트 -->>

인다이렉트로 되어있는 사이트를 찾아라. 알렉사에 대한 1000개-->> warning-->> 각모듈을 추가해서 -->>>

---------------------------------------- 1million-->> indirect / direct alexa 1000개까지만 먼저해서 봐야한다. -->>

월요일:

============================== ============ =============== ====------------------------------------------------------------------------------------ TCP -->> SSL ---------------------------------------------------- 셀레니움 -> 익스텐션 수집 ?

구상 --->>>>>> 금요일 회의 --->>