bojone / bert4keras

keras implement of transformers for humans
https://kexue.fm/archives/6915
Apache License 2.0
5.33k stars 922 forks source link

build_transformer_model()传入的参数application #296

Open hjing100 opened 3 years ago

hjing100 commented 3 years ago

build_transformer_model()传入的参数application可以是encoder、lm、unilm,我看到你2020.3.5更新application=seq2seq为application=unilm,所以application=unilm是默认使用unilm进行seq2seq类型的任务吗?因为unilm是可以进行NLU任务的。

提问时请尽可能提供如下信息:

基本信息

核心代码

# 请在此处贴上你的核心代码。
# 请尽量只保留关键部分,不要无脑贴全部代码。

输出信息

# 请在此处贴上你的调试输出

自我尝试

不管什么问题,请先尝试自行解决,“万般努力”之下仍然无法解决再来提问。此处请贴上你的努力过程。

i4never commented 3 years ago

?叫seq2seq时候用的就不是unilm了吗?

bojone commented 3 years ago

这里的unilm是指做seq2seq时的一种attention mask,并不是一个特定的模型。