Closed hrshy0629 closed 2 years ago
权重都是根据上下文自动算的,会根据“南京市”的embeddings 还有“南”字的hidden vector (forward LSTM中).
有一个重要的地方我想不通,就是第一次在句子1中计算“南京市”的权重和后面句子2中计算“南京市”的权重,这两个权重应该是不一样的吧?还是说都是一样的?如果是一样的,那“南京市”对应的权重应该是在整个样本空间中进行更新的?这样的话,它是如何来匹配这个权重呢,考虑到“南京市”在不同句子中的位置不同,这块让我很困扰。另外在跑模型之前,是否对每个词都要分配一个权重?然后全局进行维护更新?
权重都是根据上下文自动算
好吧,老哥。您有没有考虑多嵌入节点的情况?
你可能需要仔细阅读一下我们的论文:1)权重是根据上下文动态计算;2)多节点嵌入后对权重进行归一化处理。
不好意思,老哥,是我没说清楚。我的意思说,这种嵌入的方法,能不能在同一条嵌入的边上引入多个节点。比如嵌入的边为——“南京”——“市长”——,这样嵌入了2个节点,这样更新的话,是否也和lattice更新一致呢?
------------------ 原始邮件 ------------------ 发件人: "jiesutd/LatticeLSTM" @.>; 发送时间: 2022年3月28日(星期一) 下午3:00 @.>; @.**@.>; 主题: Re: [jiesutd/LatticeLSTM] 嵌入词的权重 (Issue #134)
Closed #134.
— Reply to this email directly, view it on GitHub, or unsubscribe. You are receiving this because you authored the thread.Message ID: @.***>
我在论文中看到嵌入词作为一个嵌入词(南京市)作为一个静态词,公式13中,也给这个静态词分配了一个权重,这个权重是依赖句子中“南”这个词存在的吗?因为这个句子中,嵌入的位置可能是随机的,也就是说“南京市”匹配的那部分权重并不是每次都起作用的?那么如何保证能够激活“南京市”这个静态词,或者说如何使用“南京市”对应的权重?这个权重可以直接放弃吗?反向传播的时候,如何更新这个权重?