ueqt / aoi-hana

human in China history
MIT License
9 stars 2 forks source link

希望可以online玩,不需要下载 #14

Open e2tox opened 8 years ago

e2tox commented 8 years ago

如题

ueqt commented 8 years ago

不提供web版主要基于三点考虑 1.我希望加入所有的历史人物,所以可能会有几万甚至几十万人,每个人都有图片头像,显示关系图之类时加载图片可能会比较耗时。单机的体验会好很多。 2.数据是否共享的问题,每个人独立维护自己的一套数据,还是所有人共同维护一套数据,如果共同维护,谁为准呢?要审核机制还是我独立维护,别人只是只读。独立维护的话,数据量又会非常大。做这个的主要目的是为了我个人整理历史人物思路用的,所以希望尽可能地独立。 3.online要提供服务器,麻烦。。。

其实这个改web非常简单,前后端分得很干净的

e2tox commented 8 years ago

做成web基于以下一点考虑:

  1. 可以赚钱
e2tox commented 8 years ago

如果设计一个AI来维护人物数据,应该会比较合理,AI整天爬网站,到时候可能会有意外惊喜

e2tox commented 8 years ago

比如爬到这样一个句子: 张郃与张飞战于宕渠,不能取胜,后刘备攻张郃,夏侯渊战死,张郃稳住阵脚。

你就自动获得以下关系:

张飞 -> 战胜 -> 张郃 ^ 位置: 宕渠

e2tox commented 8 years ago

然后你设计一个决策系统来判断各个关系的权重,如果是大网站爬到的,更可信的,如果是民科发表的,可信度低一些。如果是从著作中爬到了,那就板上定钉钉了。

e2tox commented 8 years ago

到时候,你这个系统就成为历史界的百科全书

e2tox commented 8 years ago

流芳百世

e2tox commented 8 years ago

至于钱么,就沦落到要赚多少全看你心情了

ueqt commented 8 years ago

句法分析很吃力呢,大部分有参考价值的文章都是古文的 郃别督诸军下巴西,欲徙其民于汉中,近军宕渠、蒙头、荡石,与飞相拒五十余日。 像这样一句句子很难分析出是张郃和张飞

e2tox commented 8 years ago

要是不吃力,做了还有啥意义。如果遇到人工智能解不出来的情况,你可以选择直接告诉他郃就是张郃,飞就是张飞。算是作弊,但是很有效。

基本要做的事情

  1. 计算语义向量
  2. 计算相似度
  3. 语义向量加减运算。 比如:爸爸+爸爸=爷爷

推导过程 http://cpmarkchang.logdown.com/posts/277349-neural-network-backward-propagation

java写的库 http://deeplearning4j.org/word2vec