Closed jungwoo-ha closed 3 years ago
Paper
News
DeepRapper: Neural Rap Generation with Rhyme and Rhythm Modeling
AdaSpeech 3: Adaptive Text to Speech for Spontaneous Style
Can You Learn an Algorithm? Generalizing from Easy to Hard Problems with Recurrent Networks
Rissanen Data Analysis: Examining Dataset Characteristics via Description Length
Comparing Test Sets with Item Response Theory
Catastrophic Fisher Explosion: Early Phase Fisher Matrix Impacts Generalization
[Improved Regret Bounds of Bilinear Bandits using Action Space Analysis]()
SSBSE 2021 결과 나왔어요...! (for SE people)
@nick-jhlee NeurIPS 2021 말씀이시죠?
@nick-jhlee NeurIPS 2021 말씀이시죠?
(오 맞네용,, 감사합니다 ㅎㅎㅎㅎ)
정필모 의원 '인공지능법 제정안', 포털·의료 AI 판단 설명 의무화 http://www.aitimes.com/news/articleView.html?idxno=139381
AI천왕 한자리에! 요슈아 벤지오·제프리 힌튼·얀 르쿤, 공동 논문 발표 http://www.aitimes.com/news/articleView.html?idxno=139428&fbclid=IwAR3NHTmj-1x5wLRxHf9b88kw3g86kXEBDUV-sqjHsf8CsUVFmxwqk9fQERI
What OpenAI and GitHub’s ‘AI pair programmer’ means for the software industry
Google’s Supermodel: DeepMind Perceiver is a step on the road to an AI machine that could process anything and everything https://www.zdnet.com/article/googles-supermodel-deepmind-perceiver-is-a-step-on-the-road-to-an-ai-machine-that-could-process-everything/
Google Open-Sources Token-Free Language Model ByT5
AI voice actors sound more human than ever—and they’re ready to hire
How a New AI Mindset for AutoML Will Make Deep Learning More Accessible
2021년 한국인공지능학회 하계학술대회 (07.08~07.09)
조~금 오래된 논문이지만 의료AI 논문 데뷰를 위해 공유해드립니다.
nnDetection: A Self-configuring Method for Medical Object Detection Arxiv: https://arxiv.org/abs/2106.00817 GitHub: https://github.com/MIC-DKFZ/nnDetection
Nature Methods에 publish된 nnUNet의 후속작 논문입니다.
Natural Image에서도 마찬가지이지만 Medical Imaging에서는 작은 데이터셋에서 modality마다 특성이 매우 다르고 3D 데이터에서 각 이미지마다 pixel의 distance가 다르다는 특성이 있습니다. 그래서 기존에서 각 modality, dataset마다 데이터의 특성에 맞게 많은 custom engineering 및 노하우가 필요했었습니다. 그러나 nn (no-new) UNet은 UNet으로 모델 구조를 통일하고 학습을 위해 data parameter (fingerprint라고 부릅니다)를 맞추어 학습이 잘되도록 하고 실제로 parameter를 그대로 둔 채 여러 challenge에서 상위권 성적을 거두었습니다. 기존의 nnUNet은 segmentation을 위한 것이었지만 medical imaging에서는 detection이 segmentation만큼 혹은 그 이상 중요한 경우가 있는데 (예를 들어 Lung에서 nodule을 찾는 것처럼) 이를 위해 detection에 특화된 framework를 제시했습니다.
RMA: Rapid Motor Adaptation for Legged Robots
MedGPT: Medical Concept Prediction from Clinical Narratives
AI ArXiv
Improved Transformer for High-Resolution GANs
GAN generator 혹은 decoder를 transformer 기반 구조로
SA를 그대로 쓴건 아니고 일단 퀄을 위해서 (local 정보가 중요하니) 2 phases 로 분리
phase1: z --> low resolution 에선 Nested transformer,
phase2: low r --> high r 에선 SA대신 neural implicit repre 스타일로 MLP 적극 활용
둘다 latent (Q)와 패치 입력(K, V)에 대한 cross-attention 활용.
StyleGAN2 대비 효과도 괜찮고 효율성도 괜찮고 ImageNet같은 일반이미지도 괜찮은 듯?
Evaluating Large Language Models Trained on Code
장안의 화제 github copilot by MS + OpenAI
그 Copilot에 적용된 code생성에 finetune된 GPT3-12B짜리 모델 Codex!
Human evaluation 뿐 아니라 코드생성에 필요한 매우 다양한 관점의 실험/고려 등등
그런데.. 학습에 쓰인 소스코드 라이센스 제대로 확인 안했다는 설도....
A Survey on Data Augmentation for Text Classification
Text classification 을 위한 data augmentation 연구들에 대한 survey paper
비교적 최근 연구들까지 잘 정리된 느낌 (GPT-3를 적극 쓰는 쪽 까진 아니고)
교수님들 NLP 수업 자료 만드실 때 유용하실 듯?
Anticipating Safety Issues in E2E Conversational AI: Framework and Tooling
E2E 대화 AI 서비스나 출시 전에 safety와 관련된 여러이슈를 체크하는 프로토콜 정리 연구 (from Facebook)
각종 악성 활용에 대해서 어떻게 사전에 점검하고 평가할 것인지가 제법 잘 정리된 것으로 보임
대화 AI를 사용서비스로 준비하는 기업들에서는 꼭! 읽어봐야할 것 같고 대화모델 연구하시는 분들에게도 유용할 듯
Kosp2e: Korean Speech to English Translation Corpus
서울대와 네이버 파파고 공동 연구로 만든 한영 음성-텍스트 번역 데이터셋
발음은 KOSPI 로~~ (코스피 5천 가즈아!)
제대로 된 소개 시간은 별도로 진행 예정이라고 합니다~
https://github.com/warnikchow/kosp2e
Edinburgh Pig Behavior Video Dataset
U of Edinburgh 에서 만든 돼지 행동 비디오 데이터 (23일간)
BBox, tracking identifier, 8 마리 돼지 7200 labeled frames
농축산업 + AI
논문은: https://homepages.inf.ed.ac.uk/rbf/PAPERS/pigsbehaviouranalysis_visapp2021.pdf