Closed jungwoo-ha closed 2 years ago
ArXiv
DelightfulTTS: The Microsoft Speech Synthesis System for Blizzard Challenge 2021
Chunked Autoregressive GAN for Conditional Waveform Synthesis
VISinger: Variational Inference with Adversarial Learning for End-to-End Singing Voice Synthesis
행사 소개
Conference on the Mathematical Theory of Deep Neural Networks가 곧 virtual로 열려요... (11/4~11/5) https://deepmath-conference.com/ registration deadline: 11/4까지!
한국인공지능학회ㅣ LG AI연구원 추계공동학술대회가 곧 virtual로 열려요... (11/4~11/5) http://aiassociation.kr/Conference/ConferenceView.asp?AC=0&CODE=CC20210801&CpPage=123#CONF registration deadline: 11/3까지!
논문들
Learning in High Dimension Always Amounts to Extrapolation (arXiv 2021)
An Investigation into the Role of Author Demographics in ICLR Participation and Review (ICLR Openreview)
[1] An Open Review of OpenReview: A Critical Analysis of the Machine Learning Conference Review Process - rejected from ICLR2021 yet got a positive review: "The paper should be brought to the attention of the various committees and made available somehow at the conference and acknowledged as a useful publication."
You Are the Best Reviewer of Your Own Papers: An Owner-Assisted Scoring Mechanism (NeurIPS 2021)
Parameter Prediction for Unseen Deep Architectures (NeurIPS 2021)
Extra
[1] Bayesian Deep Learning and a Probabilistic Perspective of Generalization (NeurIPS 2020)
쓸데없는 논문
STOC 2022 (ACM Symposium on Theory of Computing)의 author ordering에 대한 공고:
호오...
상-당한 뒷북
The Nobel Prize in Physics 2021 was awarded "for groundbreaking contributions to our understanding of complex systems" with one half jointly to Syukuro Manabe and Klaus Hasselmann "for the physical modelling of Earth's climate, quantifying variability and reliably predicting global warming" and the other half to Giorgio Parisi "for the discovery of the interplay of disorder and fluctuations in physical systems from atomic to planetary scales."
그냥 뭔가 이런 연구가 있었다는게 최신 deep learning과 large scale LM의 홍수에 잊혀지면 약간 슬플거 같애서 이렇게 소개해드려요,, (물론 저 홍수가 나쁘다는건 절대 아님다 ㅎㅎ)
https://www.iso.org/committee/6794475.html
- 총 240여명의 참석자, 한국에서도 30명 넘게 참석
- 1개 AG 신설 결정, 25건의 표준 개발 논의, 3건의 신규 표준 개발 결정 (data life cycle framework, transparency taxonomy, Treatment of unwanted bias in classification and regression machine learning tasks)
- 미국 식품의약국(FDA), 캐나다 보건부, 영국 MHRA(의약품 및 건강 관리 제품 규제 기관)는 GMLP(Good Machine Learning Practice) 개발에 도움이 되는 10가지 지침 원칙 공유
- 향후 IMDRF(International Medical Device Regulators Forum), 국제 표준 기구 및 기타 협력 기관이 GMLP 드라이브 전망
- 전체 제품 수명 주기 동안 다분야 전문 지식 활용
- 우수한 소프트웨어 엔지니어링 및 보안 사례 구현
- 임상 연구 참가자 및 데이터 세트는 의도된 환자 모집단을 대표
- 훈련 데이터 세트는 테스트 세트 와 독립적
- 선택된 참조 데이터 세트는 최적의 사용 가능한 방법에 기반
- 모델 설계는 사용 가능한 데이터에 맞게 조정되고 장치의 의도된 사용을 반영해야
- 인간-AI 팀의 성과에 초점이 맞춰야
- 테스트 시 임상 관련 조건에서 장치 성능을 보여줘야
- 사용자에게 명확하고 필수적인 정보 제공
- 배포된 모델의 성능 모니터링 및 재학습 위험 관리
https://www.nist.gov/news-events/events/2021/10/kicking-nist-ai-risk-management-framework
http://www.aitimes.com/news/articleView.html?idxno=141256 https://www.korea.kr/news/pressReleaseView.do?newsId=156477670
- 과기정통부 17개 시·도 및 관계부처 합동 ‘인공지능 지역확산 추진방향’ 발표 -
- 지역경제 재도약과 디지털 대전환 가속화를 위한 초광역 협업 사업(프로젝트) - · (혁신거점) 광주 집적단지를 국가 인공지능 혁신거점으로 고도화 · (선도사업) 5대 권역별 강점을 반영한 대형 인공지능 사업(프로젝트) 기획 · (특화융합) 지역별 주력산업 혁신을 위한 인공지능 융합 확대
- 3대 유형 : AI-generated NFTs, NFTs’ embedded-AI, AI-first NFT infrastructures
https://thehill.com/changing-america/respect/579196-expert-warns-that-artificial-intelligence-could-soon-be-able-to-hack https://www.dailymail.co.uk/news/article-10147617/Israeli-historian-Yuval-Harari-warns-humans-cooperate-stop-human-hacking.html
- Harari의 주요 주제 중 하나는 인공 지능 알고리즘이 인간의 삶에 대한 영향력을 높일 때 초래할 수 있는 위험한 변화에 대해 사람들에게 경고하는 것
- 'Netflix는 우리에게 무엇을 봐야 하는지 알려주고 Amazon은 무엇을 사야 하는지 알려줍니다. 결국 10년, 20년 또는 30년 내에 그러한 알고리즘은 대학에서 무엇을 공부해야 하는지, 어디에서 일해야 하는지, 누구와 결혼하고 누구에게 투표해야 하는지 알려줄 수 있을 것입니다'라고 그는 말했습니다.
- 유일한 해결책은 데이터 수집을 규제하기 위해 국가들이 협력하는 것
Bruno Maisonnier, founder and CEO of AI firm AnotherBrain
- We brought fire and people died from the fire, we brought nuclear and people died from that.
- Each time we have the same reaction: First we fear and then we start to put the feedback and learn and put rules to get the positive out of this technology
- The same goes with AI. The question is when do we have to set these rules?
- Rules must be put but first, we must allow the evolution to happen.
News
Facebook has gone~ Meta has come!!!!
State of AI Report 2021
ICLR 2022 리뷰 데드라인 (사실상 화욜밤까지)
ArXiv
P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks
LM의 성능을 SOTA Finetuned LM 이상의 성능을 만들도록 하는 p-tuning.
그런데 작은 LM에선 효과가 별로 였고 어려운 태깅문제에서도 효과가 별로 였다고
P-tuning 을 제안한 BAAI 그룹에서 v2를 반년만에 공개함.
Layer별 (Multilayer prompt == deep prompt tuning) 추가 파라미터를 쓰고 학습한다는 측면에서 prefix tuning과 유사한 구조
작은 LM에서도 잘되고 태스크 다양성도 훨씬 넒어짐. 단 추가 학습 파라미터는 좀 더 많음. (추가 파라미터 최대크기는 3% 정도?)
https://github.com/THUDM/P-tuning-v2 (아직은 껍데기만)
Wav2CLIP: Learning Robust Audio Representations From CLIP
CLIP을 distill 한 audio representation learning from NYU
Audio + CLIP기반 text, image common embedding을 이용하여 audio downstream task
VQGAN-CLIP을 이용해서 오디오-to-이미지 생성
코드: https://github.com/descriptinc/lyrebird-wav2clip
NormFormer: Improved Transformer Pretraining with Extra Normalization
Pre-Norm은 가라. LayerNorm 3개 정도는 써줘야지 from 페이스북 아.. Meta AI Research
그럼 어디다가? self-attention 뒤, SA의 head-wise scaling 뒤, 첫 FC layer 뒤
일단 수렴속도 가속화에도 도움이됨.
전체적으로 1.3B, 2.7B 정도의 실험결과. 더 큰 모델에서 실험은 필요해 보임
13B에서 모델 학습 불안정성은 상당히 개선하는 것 처럼 보임.
코드는: https://github.com/pytorch/fairseq/tree/main/examples/normformer
Online Continual Learning on Class Incremental Blurry Task Configuration with Anytime Inference
좀더 현실적인 continual learning setup (i-Blurry) from NAVER AI Lab + GIST
Disjoint와 blurry 양쪽 한계 해결: 태스크마다 클래스를 share도 하지만 태스크마다 완전히 처음보는 클래스도 등장 (class incremental blurry)
Task 끝나는 시점에서 평가를 하지만 사실 우리는 task가 끝나는 걸 모름. 그래서 anytime inference가 필요
그러다보니 Avg accuracy 형태가 아닌 accumulated acc 형태의 새로운 메트릭이 필요.
Sample 단위 중요도 + adaptive LR 스케쥴링
Solving Math Word Problems
수학문제 풀이를 위한 GPT-3 Finetuing from OpenAI
GSM8k dataset 을 함께 공개: 8천개의 다양한 등급(학년) 언어로 표현된 고퀄 수학문제
그냥 파인튠으로 하면 아무리 커도 안되는 데 test time에 여러 솔루션들 중 랭킹을 매기는 verifier를 도입해서 문제 해결
GSM8k data: https://github.com/openai/grade-school-math