-
## Dataset Information
* Dataset Name:
* Prefered code name(e.g. `korean_chatbot_qa_data`): `sae4k`
* Dataset description:
* Homepage: https://github.com/warnikchow/sae4k
* Citation:
## Addi…
-
## Dataset Information
* Dataset Name: namuwiki corpus
* Prefered code name(e.g. `korean_chatbot_qa_data`):
* Dataset description:
* Homepage: https://github.com/jeongukjae/namuwiki-corpus
* Ci…
-
## Dataset Information
* Dataset Name: KorQuAD 1.0
* Prefered code name(e.g. `korean_chatbot_qa_data`): `korquad_10`
* Dataset description: KorQuAD 1.0은 한국어 Machine Reading Comprehension을 위해 만든 데…
-
## Dataset Information
* Dataset Name: 한국해양대학교 자연언어처리 연구실 NER 데이터셋
* Prefered code name(e.g. `korean_chatbot_qa_data`): `kmounlp_ner`
* Dataset description: 한국어 개체명 정의 및 표지 표준화 기술보고서와 이를 기반으로 제작된…
-
## Dataset Information
* Dataset Name: KLUE
* Prefered code name(e.g. `korean_chatbot_qa_data`): `klue_dp`, `klue_mrc`, ...
* Dataset description:
* Homepage:
* Citation:
* License:
## Addi…
-
## Dataset Information
* Dataset Name: Wikitext format dataset of Namuwiki
* Prefered code name(e.g. `korean_chatbot_qa_data`): `namuwikitext`
* Dataset description: 나무위키의 덤프 데이터를 바탕을 제작한 wikite…
-
현재 REAME en 의 부분에서도 다음처런 내용이 기술되어 있습니다.
```python
from Korpora import Korpora
Korpora.corpus_list()
```
```
{
'kcbert': 'beomi@github 님이 만드신 KcBERT 학습데이터',
'korean_chatbot_data': 'so…
lovit updated
3 years ago
-
다운로드 가능한 데이터셋에 대해서만 lmdata를 통해 학습용 데이터셋을 출력하는 것으로 보입니다.
AIHUB나 모두의 코퍼스 셋은 로더 쪽도 준비가 다 된 것 같아, lmdata에 반영을 하면 될 것으로 보이는데, 혹시 작업 예정이신지 궁금합니다.
-
### 路由地址
/the-economist
### 完整路由地址
/the-economist/:endpoint
### 相关文档
https://docs.rsshub.app/traditional-media.html#the-economist
### 预期是什么?
可以抓取到全文输出RSS内容
### 实际发生了什么?
无法抓取,报错
官方演示页面同样无…
-
여러 종류의 Korpus 로부터 texts 성분만 취하여 이들을 병합하여 언어 모델을 학습할 때 사용할 수 있는 데이터로 정제하는 기능을 CLI 형태로 제공하면 좋을듯 합니다.
lovit updated
4 years ago