ZhuiyiTechnology / simbert

a bert for retrieval and generation
Apache License 2.0
848 stars 150 forks source link

> 可以用PCA降维,参考:https://kexue.fm/archives/8069 #12

Open DaiJitao opened 3 years ago

DaiJitao commented 3 years ago

可以用PCA降维,参考:https://kexue.fm/archives/8069

好的,我后续试一下这个PCA降维度。 我目前做了一个实验,就是上面截图那样,下载了bert4keras源码,然后新增了一个Dense层,强制把维度修改为300了,然后我在自己的语料上fineturn了一下,计算cos相似度,对同一个句子对,前后对比发现整体cos值变高了

Originally posted by @TestNLP in https://github.com/ZhuiyiTechnology/simbert/issues/11#issuecomment-816367964

DaiJitao commented 3 years ago

cos需要输入句子1和句子2的向量吧?才能计算余弦相似度。不明白的地方在于,句子1的向量是直接通过simbert获取的吗?句子2的向量也是通过simbert获取的吗?请问句子1和句子2的向量是如何获取的?