yongyehuang / zhihu-text-classification

[2017知乎看山杯 多标签 文本分类] ye组(第六名) 解题方案
https://biendata.com/competition/zhihu/
405 stars 156 forks source link

char2id.py中na_title_indexs的那些值是怎么来的? #8

Open FinIoT opened 6 years ago

FinIoT commented 6 years ago

char2id.py中na_title_indexs的那些值是怎么来的?

na_title_indexs = [328877, 422123, 633584, 768738, 818616, 876828, 1273673, 1527297, 1636237, 1682969, 2052477, 2628516, 2657464, 2904162, 2993517]

yongyehuang commented 6 years ago

@FinIoT 你好,这个是我自己分析数据统计出来。

FinIoT commented 6 years ago

@yongyehuang 非常感谢!但是我运行后,只发现df_train.at[1682969,'char_title']是没有title的,其它几个都不是啊。看来你在程序背后,还做了不少其它工作啊 !

hexj314159 commented 6 years ago

你好,请教一个问题,关于cnn文本分类的时候我看到大部分人用的是 conv2d,包括你的代码也是这样,为什么不用conv1d,conv1d就可以解决这样的问题了?谢谢!