jungwoo-ha / WeeklyArxivTalk

[Zoom & Facebook Live] Weekly AI Arxiv 시즌2
969 stars 41 forks source link

[20220116] Weekly AI ArXiv 만담 - 36회차 #36

Closed jungwoo-ha closed 2 years ago

jungwoo-ha commented 2 years ago
ghlee0304 commented 2 years ago
jwlee-ml commented 2 years ago

image

image image image

kimyoungdo0122 commented 2 years ago
visualxlab commented 2 years ago

image image image

veritas9872 commented 2 years ago

Structure and position-aware graph neural network for airway labeling Arxiv: https://arxiv.org/abs/2201.04532 GitHub: https://github.com/DIAGNijmegen/spgnn (아직 없음).

흉부 의료영상에서 저명하신 네덜란드의 Bram van Ginneken 교수님의 연구를 공우해드립니다.

Segmentation이 되어 있는 Lung CT 영상에서 각 airway가 구체적으로 폐의 어떤 airway인지 classification하는 연구에 CNN과 Graph Transformer를 사용한 연구입니다.

Airway의 구조는 큰 가지와 작은 가지의 구조에서 큰 차이가 존재하는데 작은 가지는 개인마다 차이가 크지만 대체로 큰 가지를 비슷합니다. 이때 해당 가지가 어떤 segment인지 분류하는 것을 하기 위해 기존에는 순수 CNN classification 방식이나 segmentation 방식을 적용했었으나 본 논문에서는 구조 정보와 위치 정보를 혼합한 구조를 사용합니다.

조금 아쉬운 점은 segmentation map ground truth가 미리 제공되어야 한다는 점인 것 같습니다.

Screenshot (10)

Screenshot (11)

hollobit commented 2 years ago

선관위, 딥페이크 영상 기반 선거운동에 대한 법규 해석 발표

https://www.nec.go.kr/site/vt/ex/bbs/View.do?cbIdx=1231&bcIdx=156972&relCbIdx=1084

중국 AI 세계에서 벌어지는 일들

https://analyticsindiamag.com/absurd-happenings-in-the-world-of-ai-in-china/

우리는 AI의 윤리에 실패하고 있다

https://www.weforum.org/agenda/2022/01/we-re-failing-at-the-ethics-of-ai-here-s-why/

terryum commented 2 years ago

어떤 분이 흥미로운 논문을 발견(?)해서 1월 5일 Reddit에 공유를 했네요. Time-series anomaly detection (TAD) 문제의 evaluation 과정에서 후처리로 쓰는 point adjustment (PA)라는 프로세스가 있는데, PA만 있으면 random prediction도 SOTA를 찍는 놀라운 변신 능력(?)을 보여준다고 합니다. 즉, 성능평가에 있어 PA를 적용한 여러 TAD 연구들의 성능이 매우 과장되어 있다는 것이죠.

원 논문은 (흥미롭게도) 한국에서 나온 논문입니다. (will appear in AAAI-22) Towards a Rigorous Evaluation of Time-series Anomaly Detection Siwon Kim, Kukjin Choi, Hyun-Soo Choi, Byunghan Lee, Sungroh Yoon

PA는 "ground truth 입장에서 보았을 때 하나라도 point-wise prediction에 걸렸다면 모두를 맞춘 것으로 친다"라고 하는 '하나만 걸려라' 식 후처리입니다. 아래 그래프에서처럼 딱 하나만 point prediction이 threshold를 넘어도 GT를 참고해 모든 point를 맞춘것처럼 prediction을 수정해 주는거죠. image image

우습게도(?) PA를 적용하면 현존하는 최고의 TAD 알고리즘은 random prediction이 된다고 하네요. image

Reddit의 댓글에는 time-series prediction에서 꾸준히 재기되어왔던 성능평가에 대한 이슈를 비판하며 "오늘의 날씨 = 어제의 날씨"와 같은 냉소적인 댓글이 달리고 있네요.

[Terry의 의견] 학계에서 말하는 '벤치마크에서 높은 성능을 찍었다'라는 것과 실제 현장에서 '이 알고리즘이 정말 쓸만하다'라는 것과 차이가 날 때가 많습니다. 때로는 데이터의 가정이 현실적이지 않아서, 때로는 현실에선 논문처럼 문제가 명확하게 정의되지 않아서, 때로는 evaluation이 현실문제와는 동떨어져서 등의 이유로 현실에선 못쓰이는 경우가 많죠. 하지만 여전히 많은 연구자들은 "쓸모없는 문제"에서 SOTA를 찍으려 노력합니다.

현실에서 가장 어려운 문제 중 하나가 '이 문제를 잘 풀었다는 것을 어떻게 evaluation 하는가?'에 대한 답을 내는 것입니다. 현실문제를 수학적으로 모델링하고, 그 성능을 하나의 숫자로 표현 한다는 건 정말 어려운 일이죠 (그것만으로도 AI에서 큰 업적을 냈다고 할만합니다.) 하지만 TAD 문제가 어렵단 이유로 이렇게 관대한 metric을 2018년에 제안하고 아직까지도 써왔다는 것에 대해선 유감입니다. 아마도 논문의 우수성을 증명하고 싶었겠지만, 어려운 문제는 과장없이 '어렵다'는 결론으로 두는게 맞지 않을까 싶습니다.

[Reference] PA를 처음 evaluation에 사용한 논문: Unsupervised Anomaly Detection via Variational Auto-Encoder for Seasonal KPIs in Web Applications, H. Su et al.