tensorflow / tensor2tensor

Library of deep learning models and datasets designed to make deep learning more accessible and accelerate ML research.
Apache License 2.0
15.44k stars 3.49k forks source link

Summarization extraction Poor effect #1509

Open Single430 opened 5 years ago

Single430 commented 5 years ago

Description

The result of my Chinese abstract extraction training using tensor2tensor is very poor. I have been looking for a long time, but I still can't find the problem, I hope I can get a reply.

Environment information

OS: Linux

$ pip freeze | grep tensor
# your output here
tensorboard==1.13.1
tensorflow-estimator==1.13.0
tensorflow-gpu==1.13.1

$ python -V
# your output here
Python 3.6.8

For bugs: reproduction and error logs

# Steps to reproduce:
#!/usr/bin/env bash

PROBLEMS_DATA_DIR=/mnt/data/bielin.zhuo/tensor2tensor/zh_summ

PROBLEM=zh_problem
MODEL=transformer
HPARAMS=transformer_prepend

DATA_DIR=${PROBLEMS_DATA_DIR}/zh_data/
TRAIN_DIR=zh_train/
USER_DIR=usr_dir/

echo "Starting t2t-decoder .."

# Train
# *  If you run out of memory, add --hparams='batch_size=1024'.
t2t-decoder \
  --data_dir=${DATA_DIR} \
  --problem=${PROBLEM} \
  --model=${MODEL} \
  --hparams_set=${HPARAMS} \
  --output_dir=${TRAIN_DIR} \
  --t2t_usr_dir=${USER_DIR} \
  --decode_hparams="beam_size=4,alpha=0.6" \
  --decode_from_file=zh_decoder/eval.txt \
  --decode_to_file=zh_decoder/result.txt
# Error logs:
INPUT:   南 方 都 市 报 2 0 1 5 - 0 8 - 0 2 < P a r a g r a p h > 1 2 : 4 6 南 都 讯 < P a r a g r a p h > 记 者 何 永 华 < P a r a g r a p h > 昨 日 晚 上 9 点 多 , 东 莞 厚 街 湖 光 路 上 的 一 栋 出 租 楼 内 , 两 名 男 女 被 发 现 死 在 了 房 间 里 。 其 中 女 死 者 的 脖 子 上 有 致 命 的 刀 伤 , 而 男 死 者 穿 戴 整 齐 , 身 上 并 无 外 伤 。 今 日 上 午 , 事 发 地 所 属 的 厚 街 派 出 所 的 负 责 人 向 南 都 记 者 证 实 , 两 名 死 者 系 情 人 关 系 , 因 感 情 纠 纷 , 男 子 用 刀 割 破 女 子 的 喉 咙 , 导 致 女 子 死 亡 。 男 子 随 后 喝 农 药 服 毒 自 杀 身 亡 。 涉 事 的 出 租 屋 。 < P a r a g r a p h > 南 都 记 者 < P a r a g r a p h > 何 永 华 < P a r a g r a p h > 摄 事 发 在 厚 街 湖 光 路 上 一 家 名 为 海 潮 酒 店 对 门 的 出 租 楼 内 , 具 体 的 房 间 是 3 0 8 号 房 。 据 曾 经 到 过 事 发 现 场 的 目 击 者 说 , 3 0 8 号 的 房 门 虚 掩 着 , 昨 日 晚 上 9 点 多 , 可 能 是 因 为 被 风 吹 开 了 , 有 住 在 同 一 层 楼 的 住 户 路 过 3 0 8 号 , 借 着 走 廊 上 的 灯 光 , 就 被 屋 内 眼 前 的 一 幕 吓 坏 了 , 连 忙 通 知 房 东 报 了 警 。 “ 女 死 者 仰 面 躺 在 出 租 房 里 , 喉 咙 处 有 刀 伤 , 身 边 有 一 大 滩 血 迹 。 而 男 死 者 则 穿 戴 整 齐 的 躺 在 身 边 , 身 上 没 有 任 何 的 外 伤 和 血 迹 。 ” 这 位 目 击 者 说 。 厚 街 派 出 所 的 民 警 很 快 就 赶 到 现 场 进 行 侦 查 。 到 今 天 凌 晨 , 才 将 两 具 尸 体 抬 离 现 场 。 据 上 述 曾 经 到 过 现 场 的 目 击 者 说 , 尸 体 微 微 有 些 发 臭 , 初 步 判 断 两 人 是 在 前 天 晚 上 死 的 。 “ 前 天 下 午 还 曾 见 过 那 个 男 的 。 ” 一 位 同 住 该 出 租 房 的 租 客 说 , 此 前 在 出 租 房 并 没 有 听 到 吵 闹 声 或 者 呼 救 声 。 “ 应 该 是 在 睡 梦 中 杀 人 , 否 则 肯 定 能 听 到 响 声 。 ” 今 日 上 午 , 南 都 记 者 来 到 事 发 的 现 场 , 看 到 事 发 房 间 的 阳 台 已 经 被 塑 料 布 盖 住 。 整 栋 出 租 房 楼 已 经 恢 复 了 平 静 。 出 租 房 的 二 手 房 东 对 此 事 已 不 愿 开 口 。 厚 街 派 出 所 的 负 责 人 向 南 都 记 者 确 认 , 两 名 死 者 系 情 人 关 系 , 因 感 情 纠 纷 , 男 子 用 刀 割 破 女 子 的 喉 咙 , 导 致 女 子 死 亡 。 男 子 随 后 喝 农 药 服 毒 自 杀 身 亡 。 “ 昨 天 发 现 的 死 亡 , 具 体 的 死 亡 时 间 还 有 待 确 认 。 ” 据 该 负 责 人 介 绍 , 两 名 死 者 均 是 附 近 沐 足 阁 的 员 工 , 都 来 自 广 西 。 其 中 男 死 者 姓 许 , 2 8 岁 。 女 死 者 姓 罗 , 3 4 岁 。 线 索 提 供 : UNK 名 < P a r a g r a p h > 1 0 0 元

OUTPUT:    南 方 都 市 报 < P a r a g r a p h > 2 0 1 5 - 0 8 - 0 1 < P a r a g r a p h > 1 0 : 0 0 南 方 都 市 报 < P a r a g r a p h > 显 示 图 片 本 报 讯 < P a r a g r a p h > ( 记 者 < P a r a g r a p h > 李 UNK ) < P a r a g r a p h > 8 月 1 日 下 午 1 4 时 许 , 广 州 天 河 区 天 河 区 天 河 区 天 河 区 天 河 区 天 然 气 公 司 天 然 气 公 司 发 生 爆 炸 事 故 , 造 成 天 然 气 公 司 工 作 人 员 受 伤 。 天 河 警 方 接 到 报 警 , 天 河 区 天 河 区 天 河 区 天 河 区 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 公 司 天 然 气 宣 布 , 天 然 气 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 , 天 然 气 集 团 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 宣 布 , 天 然 气 集 团 天 然 气 集 团 天 然 气 集 团 天 然 气 , 天 然 气 集 团 天 然 气 集 团 公 司 天 然 气 集 团 公 司 天 然 气 集 团 的 天 然 气 集 团 公 司 天 然 气 集 团 , 天 然 气 集 团 天 然 气 集 团 公 司 天 然 气 集 团 , 天 然 气 集 团 天 然 气 集 团 天 然 气 集 团 天 然 气 集 团 , 天 然 气 集 团 天 然 气 集 团 的 天 然 气 集 团 , 天 然 气 集 团 的 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 可 能 天 然 气 。

HOPE OUTPUT:    湖光路一出租楼内发现2名已死亡男女,警方称男死者因感情纠纷持刀割喉女子,随后喝农药自杀身亡(图)
Single430 commented 5 years ago

Global_steo, Learning_rate, Loss 2019-03-25 10-48-01 的屏幕截图

@lukaszkaiser

epurdy commented 5 years ago

Try not using prepending? I know the docs say to do that for summarization, but it's only given me weird results.

Single430 commented 5 years ago

How many steps did you train? @epurdy

domyounglee commented 5 years ago

Did you set the "prepend_mode" to none ? unless you would concat the encoder input to the decoder input

PROBLEM=summarize_cnn_dailymail32k MODEL=transformer HPARAMS=transformer_prepend

t2t-trainer --data_dir=$DATA_DIR --problem=$PROBLEM --model=$MODEL --hparams_set=$HPARAMS --output_dir=$TRAIN_DIR --worker_gpu=4 --hparams='batch_size=4096,prepend_mode=none,max_input_seq_length=512,max_target_seq_length=100' --train_steps=200000 --keep_checkpoint_max=10 --local_eval_frequency=5000 --eval_steps=30 --eval_run_autoregressive=False