PaddlePaddle / PaddleHub

Awesome pre-trained models toolkit based on PaddlePaddle. (400+ models including Image, Text, Audio, Video and Cross-Modal with Easy Inference & Serving)【安全加固,暂停交互,请耐心等待】
https://www.paddlepaddle.org.cn/hub
Apache License 2.0
12.72k stars 2.08k forks source link

Bert service 不同模型返回结果的格式不同 #1033

Open Echo0117 opened 3 years ago

Echo0117 commented 3 years ago

环境:

PaddleHub 1.8.1 PaddlePaddle 1.8.4 paddle-gpu-serving >=0.8.2 ujson >=1.35

# coding: utf8
from paddlehub.serving.bert_serving import bs_client

if __name__ == "__main__":
    # 初始化bert_service客户端BSClient
    bc = bs_client.BSClient(module_name="ernie", server="127.0.0.1:8866")

    # 输入要做embedding的文本
    # 文本格式为[["文本1"]]
    input_text = [
        ["西风吹老洞庭波"]
    ]

    # BSClient.get_result()获取结果
    result = bc.get_result(input_text=input_text)

    # 打印输入文本的embedding结果
    for item in result:
        print(item)

在使用 bert_service_client 时,引入erine 模型的 get_result是一个数组,但是 chinese-electra-base 就只有一个值, 请问是为什么呢?然后可以让 chinese-electra-base 模型的输出结果也是一个和 erine 结果维度一样的数组吗?

image image

Steffy-zxf commented 3 years ago

你好!目前bert-service 不支持获取PaddleHub electra module的embedding。如有需要可以参考 该module的get_embedding方法,参考:https://www.paddlepaddle.org.cn/hubdetail?name=chinese-electra-base&en_category=SemanticModel

image