-
Hi @jwijffels . I found interesting dataset and decent paper which compares different techniques:
1. website - https://summari.es/
2. [Article](https://github.com/bnosac/textrank/files/1969949/new…
-
Hi, first of all thanks for this library, you are awesome 🚀
I'm having an issue ranking text that contains abbreviation such as `U.S.A` (short for United States of America) or `No. 7` (short for N…
-
请看这两个相关的issue和PR.
https://github.com/yanyiwu/cppjieba/pull/42
https://github.com/yanyiwu/cppjieba/issues/41
原理请看这里: https://github.com/fxsjy/jieba#基于-textrank-算法的关键词抽取
-
重新规划新的 API,让大家用起来方便一些。下面是一些想法:
1、分离 Cppjieba 中的分词,关键词提取,Simhash 的方法为小的模块,不相互依赖。Cppjieba 5.0 增加了 Textrank 的模块,现有的接口想把这个模块整合起来,使用起来感觉可能会不方便。
在原有的 Cppjieba 的代码中,关键词提取和Simhash 的步骤是包含了分词步骤的,而这两个步骤其实可…
qinwf updated
8 years ago
-
假如我现在要使用该模型做文章搜索的功能,搜索相似的文章。首先通过一些TextRank、Ner的等模块提取了特征,然后是不是要和已有库中的所有文章都调用一次模型,这样的效率是不是太慢了
-
你好,非常喜欢你在文本分类中所说的框架,整体非常清晰。
请教下楼主,无监督单文本关键词提取有没有研究过,
我所知道的只有一个textrank,貌似效果不太好,
如果有什么好的blog或者开源项目,求推荐,谢谢!
-
### Intro
I am getting `TypeError: can not serialize 'BaseTextRank' object` when trying to use spaCy's multiprocessing in `nlp.pipe` with a `textrank` pipeline component.
Sorry if this a known/…
-
**描述你想要的功能**
能够提供具体例子更好
TextRank 得到的是摘要性的句子而非短语,TopicRank 可以实现这一点,这算一个新功能。
而且从 paper 的对比试验来看,短语抽取是比 TextRank 会更高些(作者对比可英文和法语)。
**是否有自己想过的可能解决方案?**
其实有解决方案了,见 pke,但是这个包实在是太多 bug 了
1. 基本上是…
-
### 개요
참고 방법론 : https://devocean.sk.com/blog/techBoardDetail.do?ID=164033
위의 서비스는 실제 상업적으로 사용하는 서비스이며 또한 TextRank 알고리즘 보다 높은 점수를 확인할 수 있다
따라서 좋은 성능을 기대할 수 있으며 위의 참고 방법론을 따라 구현하려고 한다
### 작업 목록
…
-
## Knowledge source
- wikipedia, use https://dumps.wikimedia.org/ , enwiki is around 12G
- zhihu, use https://github.com/egrcc/zhihu-python , see also https://github.com/simoncos/zhihu-analysis-pyth…