Open penguin1109 opened 2 years ago
한글을 초성-중성-종성으로 분리하여 (=Character Decomposition) 총 52개의 한글 자음과 모음 class를 사용해 학습
기존의 text recognition 모델과는 구조가 완전히 다르기 때문에 구현을 제대로 해야 함
11/22(화)에 오세은 교수님과 면담후 구현을 완료할 예정
[X] Transformer 기본 코드 구현
Transformer
[X] Vision Transformer 기본 코드 구현
Vision Transformer
[X] Class Embedding Token을 사용해서 개채명 분류 시도
Class Embedding Token
[X] Text Detection 학습 코드 구현
[ ] Hangul Net에서 grapheme의 position encoding 구현 방법 연구 (면담 후 확정)
[ ] 구현 완료한 Hangul Net을 AIHUB 한국어 인쇄체 이미지로 학습
한글을 초성-중성-종성으로 분리하여 (=Character Decomposition) 총 52개의 한글 자음과 모음 class를 사용해 학습
기존의 text recognition 모델과는 구조가 완전히 다르기 때문에 구현을 제대로 해야 함
11/22(화)에 오세은 교수님과 면담후 구현을 완료할 예정
[X]
Transformer
기본 코드 구현[X]
Vision Transformer
기본 코드 구현[X]
Class Embedding Token
을 사용해서 개채명 분류 시도[X] Text Detection 학습 코드 구현
[ ] Hangul Net에서 grapheme의 position encoding 구현 방법 연구 (면담 후 확정)
[ ] 구현 완료한 Hangul Net을 AIHUB 한국어 인쇄체 이미지로 학습