-
我测试Qwen2-1.5B-Instruct时遇到了重复回答的问题,这属于Bug吗?
模型是在modelscope上下载的,没有调整配置参数。
以下是prompt。“XXX”为匿名处理
---
{
"model": "Qwen2-1.5B-Instruct",
"messages": [
{
"role": "system",
"content": "Please w…
-
I am a student from China, and I really appreciate your project. I am now trying to do some interesting work, but I have encountered some problems. My idea is to perform topic modeling using product i…
-
Overview
When I download and parse an article, I'll include one here from CNN, it stops at the "Read More" in the HTML and doesn't parse the entire body. Similarly, it includes the highlights as p…
-
sherpa-onnx-offline-tts --debug --sid=102 --vits-model=vits-zh-hf-fanchen-C\vits-zh-hf-fanchen-C.onnx --vits-dict-dir=vits-zh-hf-fanchen-C\dict --vits-lexicon=vits-zh-hf-fanchen-C\lexicon.txt --vits-t…
-
前两天用电脑训练了一个《鬼吹灯》的文本生成模型,不生用题主的代码,基于“抱抱脸(Huggingface)”发布的GPT2生成模型改的,文本组成:
- 鬼吹灯 1 精绝古城
- 鬼吹灯 2 龙岭迷窟
- 鬼吹灯 3 云南虫谷
- 鬼吹灯 4 昆仑神宫
- 鬼吹灯 5 黄皮子坟
- 鬼吹灯 6 南海归墟
- 鬼吹灯 7 怒晴湘西
- 鬼吹灯 8 巫峡棺山
…
-
基于之前的电影语料,训练600w次,也是只回答固定的毫无逻辑的话或者表情符号
换了黄鸡语料也只回答简单的表情符号或者=号
求问需要参数特殊设置吗?
以及黄鸡训练成如图的效果花了多久时间?
(我是基于windows开发的,将遇到的gbk问题都改为了utf-8)
-
Chinese poses several unique challenges not present in other language pairs. I will start this mega-issue and update the individual points that need to happen for those languages to be fully supported…
-
您好,读了您的文章有两个问题想要请教一下,方便告知吗
1. 请问您得分词工具和词性标注工具用的是什么呢?
2.您得数据集是自己标注的还是公开的数据集呀?如果是公开数据集可否给出公开数据集的下载网址?
-
当我标注的时候,选择文本内容,并未自动弹出标签,这是为什么呢?
![image](https://github.com/doccano/doccano/assets/110662274/024cdcbc-4592-4417-b2cb-c16627f96502)
-
文件尾部添加:
if __name__ == '__main__':
generate(
'谷歌旗下的YouTube表示,自去年以来,已有13万个视频从其平台上删除,当时它禁止传播有关Covid疫苗的错误信息的内容。在一篇博客文章中,该公司表示,它已经看到有关Covid疫苗的虚假声明“蔓延到有关疫苗的错误信息中”。“我们正在扩大我们在YouTube上的医疗错误信息…