-
### 请提出你的问题
使用Taskflow进行信息抽取时,我的schema长度有500左右,每个文本抽取时间大概1分钟左右,怎样才能提升效率?
-
### 请提出你的问题
请问uie-senta-base模型输出的结果中的probability应当如何理解?
举例:
from paddlenlp import Taskflow
schema = ["情感分析[正向,负向]"]
senta = Taskflow("sentiment_analysis",model="uie-senta-base",schema=schema)
…
-
版本、环境信息
1)PaddleNLP和PaddlePaddle版本:paddlenlp 2.3.3,paddlepaddle-gpu 2.3.0
2)系统环境:Linux-ubuntu,python 3.8.13
是在uie上做的finetune
运行的命令是复制的官网给的例子
```
python -u -m paddle.distributed.launch --gpus "…
-
您好,
我准备用UIE解决一个多分类or多标签问题,但是标签类别特别多,有100多类,如果将prompt构造成:
XX分类[类别1,类别2,类别3,...],那么整个prompt的长度就会非常长,甚至达到或超过512,不知道有没有好的解决方法
-
uie-medical-base目前是否无法微调?
-
您好,请问UIE能否进行文档级别的信息抽取?如果可以的话,是否需要对输入做一些处理,比如句子间用类似[SEP]的特殊字符隔开?
直接将文档拆成单句输入的话效果会不理想,因为会存在一些跨句子的实体和属性。
-
### 软件环境
```Markdown
- paddlepaddle:2.4.0
- paddlepaddle-gpu:
- paddlenlp: 2.4.4
```
### 重复问题
- [X] I have searched the existing issues
### 错误描述
```Markdown
模型微调finetune.py,from paddlenlp.tr…
-
运行代码
str1="小区内有大量空置车位"
ner = Taskflow("ner")
print(ner(str1))
结果:[('小区', '场所类'), ('内', '词汇用语'), ('有', '肯定词'), ('大量', '修饰词'), ('空置', '场景事件'), ('车位', '位置方位')]
其中 “车位”的 WordTag标签有问题?
-
### 请提出你的问题
我在使用TaskFlow的定制训练模型中,加入自己的数据进行了模型的微调,但是在执行完下面这个命令后,
python finetune.py \
--device gpu \
--logging_steps 10 \
--save_steps 100 \
--eval_steps 100 \
--seed 42 \
…
-
有点不太理解这个验证集是如何去生成的,这是原始样本:
{
"id": 38,
"text": "百科名片你知道我要什么,是歌手高明骏演唱的一首歌曲,1989年发行,收录于个人专辑《丛林男孩》中",
"relations": [
{
"id": 20,
"from_id": 51,
…