Open wangshuang-jiayou opened 11 months ago
您好!我在利用自己的数据作训练的过程中发现了一个问题:比如当文本是truck . truck mixer . heavy truck;再比如文本是insulator . dirty insulator . damadge insulator等,这种多类别包含了相同词汇的文本时,得到的预测结果有很多是 truck truck mixer、insulator dirty insulator等。然后我改变了类别的定义,比如说truck . concrete mixer . heavy让它们不再包含相同词汇,识别率会提升很多。
起初我以为是模型对某两个类别的特征区分能力比较差 导致它认为某物体会同时是这两个物体。后来我想了下,跟文本特征提取模块也有关系吧?像yolo这种没有文本特征提取分支的模型,相同的训练和验证集识别率就相对高一点
麻烦帮忙分析一下!我应该如何有效地解决这个问题。
您好前辈@wangshuang-jiayou,请问自己的数据集是怎么准备的?
你好,请问你是怎么自己训练的,这个模型可以自己微调吗
您好!我在利用自己的数据作训练的过程中发现了一个问题:比如当文本是truck . truck mixer . heavy truck;再比如文本是insulator . dirty insulator . damadge insulator等,这种多类别包含了相同词汇的文本时,得到的预测结果有很多是 truck truck mixer、insulator dirty insulator等。然后我改变了类别的定义,比如说truck . concrete mixer . heavy让它们不再包含相同词汇,识别率会提升很多。
起初我以为是模型对某两个类别的特征区分能力比较差 导致它认为某物体会同时是这两个物体。后来我想了下,跟文本特征提取模块也有关系吧?像yolo这种没有文本特征提取分支的模型,相同的训练和验证集识别率就相对高一点
麻烦帮忙分析一下!我应该如何有效地解决这个问题。