Closed Minjuner-97 closed 3 years ago
或者作者能提供下源码吗? 不胜感激~
from transformers import AlbertTokenizer, AlbertForQuestionAnswering import torch from transformers import AutoModelForQuestionAnswering, BertTokenizer
model_path = "./model/albert-chinese-large-qa_git"
model = AutoModelForQuestionAnswering.from_pretrained(model_path) tokenizer = BertTokenizer.from_pretrained(model_path)
question, text = "鲁迅在哪上学", "鲁迅(1881年9月25日~1936年10月19日),原名周樟寿,后改名周树人,字豫山,后改字豫才,浙江绍兴人。著名文学家、思想家、革命家、民主战士,新文化运动的重要参与者,中国现代文学的奠基人之一。早年与厉绥之和钱均夫同赴日本公费留学,于日本仙台医科专门学校肄业。“鲁迅”,1918年发表《狂人日记》时所用的笔名,也是最为广泛的笔名"
inputs = tokenizer(question, text, return_tensors='pt')
outputs = model(**inputs) loss = outputs.loss start_logits = outputs.start_logits.detach().cpu().numpy() end_logits = outputs.end_logits.detach().cpu().numpy()
import numpy as np all_tokens = tokenizer.convert_ids_to_tokens(inputs["input_ids"].numpy()[0])
answer = ''.join(all_tokens[np.argmax(start_logits, 1)[0]:np.argmax(end_logits, 1)[0]+1])
print(answer)
is work
是的,几天前修复了这个问题,现在可以了 #3
1、使用pipeline方法出现了 Typeerror: not a string的情况,如何解决? 2、如果不能使用pipeline方法,现在我的数据里有问句+文本, 应该如何使用这个模型呢? 恳请赐教~~