-
## 배경
- 언어 별로 성능이 가장 좋다고 알려진 BERT 계열 모델이 있으며, 각 모델 별로 best performance 를 보이는 layer 가 다름
![image](https://user-images.githubusercontent.com/3401574/94112303-3237ad00-fe80-11ea-9aed-f07a632a1add.p…
lovit updated
4 years ago
-
```
ParserError: Error tokenizing data. C error: Expected 7 fields in line 2096, saw 8
```
-
- 며칠 간 작업을 함께 하면서 패키지 구조를 변경하는 일들이 발생했고, 그와 동시에 여러 개의 코퍼스에 대한 작업을 수행하다보니 conflict 가 날 가능성이 높아지고 있습니다.
- 코드 관리 및 이후에 다른 분들과의 협업을 위해서도 간단한 convention 을 논의해 보면 좋을 것 같아요.
- 아래에 comments 로 conventions 을 …
lovit updated
4 years ago
-
## env
- korpora == 0.2.0
- python ~= 3.8
## Issue
### command
아래 커맨드 실행시 에러 발생
```bash
korpora lmdata \
--corpus all \
--output_dir ~/works/lmdata
```
### Error log
```
…
Beomi updated
3 years ago
-
-
This is a "living issue". Editing is appreciated.
### Context:
- Most prominent benchmark for embedding models: https://huggingface.co/spaces/mteb/leaderboard
- We can choose to index the pdf dat…
-
혹시 해당 모델은 어떠한 방식으로 학습된건지 자세히 알 수 있을까요?
P.S
BM-K 님 레포 보면서 많이 배우고있습니다 감사합니다 ㅎㅎ
-
We have been reported to have issues with our downstream evaluation due to issues such as the following link.
https://github.com/haven-jeon/KoGPT2-subtasks/pull/1
We investigated the range that af…
wbaek updated
2 years ago
-
한국어 Paraphrase Detection 데이터를 사용한 Test Accuracy 를 측정하는 코드를 공유해주실수 있으신가요?
-
# Question
## Information
Model I am using (Bert, XLNet ...): XLM-RoBERTa-base
Language I am using the model on (English, Chinese ...): Korean
Adapter setup I am using (if any):
The pro…