wuhan2020 / wuhan2020.github.io

Wuhan2020 Community Website
https://wuhan2020.github.io
MIT License
78 stars 84 forks source link

搜索引擎优化 #269

Open iLtc opened 4 years ago

iLtc commented 4 years ago

看了一下谷歌百度后台的搜索记录,我们社区的索引量不是很理想。直接在谷歌百度搜索 wuhan2020,能看到大量报道,但真正链接到社区的少之又少。

通过 site: 关键词来筛选结果,谷歌只有两页,还全是中文的,百度直接为空。

谷歌结果 百度结果

分析了可能的几个原因,大家一起讨论一下。

针对谷歌百度排名靠后的情况

目前我们的社区页面向外链接了各个项目,但几乎没有任何外界的页面链接回了社区。互联网上各大针对我们社区的报道都是链接到 github 或者 shimo 上,github 上仅用少数几处链接到社区网站。这就导致了搜索引擎在评估我们社区页面时认为它不重要(有越多的网站同时链接到一个网站,表示这个网站越重要)。

改进计划

首先是请求我们社区网站上外链的其他网站/项目给予回链。特别是以下三个项目:

其次是与宣传组沟通,在后期的对外宣传中加上社区的链接,而不是 github 的链接(社区页面上也有每个项目 GitHub 地址)。需要注意的是,在微信公众号中的宣传对搜索引擎的优化作用不大,因为公众号本身是屏蔽搜索引擎的。

针对百度收录为空的情况

鉴于百度上用 site: 筛选结果为空的情况,我怀疑是 GitHub Pages 屏蔽了百度爬虫。我们之前试图在百度后台提交站点地图,结果被告知 403 错误,这是一个证明。

如果上述的外链计划和后面提到的关键词优化等都没有达到效果的话,我们可能需要更换网页的托管平台。不过这个短期内不会执行。

针对谷歌只收录了中文页面的情况

谷歌的搜索结果 可以看到,谷歌只收录了中文页面,其他语言页面缺失。

通过检查页面源代码,我注意到我们的站点除了右上角的语言切换按钮外,没有明显的超链接到其他语言。右上角的语言切换按钮是 JavaScript 的,这就意味着搜索引擎不一定能检测到我们其他语言的存在。事实上,几乎所有用 JavaScript/React/Ajax 来切换内容的网页都是搜索引擎不友好的,因为爬虫没有办法像人一样去和页面上的各个元素交互。

改进计划

我们之前已经提交了 sitemap,里面包含各个语言的页面链接,应该能帮助搜索引擎定位页面。

下一步,可以考虑将切换语言的代码转换成链接。

其他

上面说了这么多,其实也就描述了 增加外链提供搜索引擎可访问性改善内部链接站点地图 这四个点。

搜索引擎能做的还有很多,比如关键词优化等等。大家可以一起讨论。

reclusive-neural-network commented 4 years ago

其它项目也是初显苗头,大家都缺流量。互链应该帮助不大(但是还是要链,应该说好是链)。

国内可以在知乎做些问答,比如“程序员能为抗击新冠做些什么”,推荐自己的项目,顺便把别人的项目也推荐下,比如: https://feiyan.help/ https://gitee.com/dcloud/xinguan2020

国外方面可以在可以在quora上做类似的问答。 还可编辑维基百科武汉疫情的页面,介绍志愿者的行动,顺便附上链接。 在SO上问些技术问题,比如我们的网站应该如何设置**之类。

还有,主动联系媒体,讲自己既有的成就,讲未来的计划,请求帮助招募人才实现未来的计划。

这个建立医院床位队列系统也许是一个媒体会感兴趣的计划。

还有我昨天发现的#看见女性劳动者#,可以做一个各医院女性工作者人数的数据库,请求媒体曝光下让各医院或者志愿者帮忙填表,统计出日需求量,同时让有捐赠意向的人或者企业知道往哪提供,怎么提供。

对了,还有个主意: 搜索引擎衡量一个网站重要程度的标杆是信息量(字数)。字数不够多大概是排名上不去的一个原因(至少是google这)。怎么样产生字数?不妨建个Blog页把别处(github和slack)的重要(我们在/要解决什么跟疫情有关的问题)讨论搬过去。OR,干脆把讨论搬到可以支持讨论的站上去。比如如果谁在SO上的点数够多,可以新开专用tag。reddit上鱼龙混杂,但是可以新开subreddit。别人顺着讨论就能找到网站。国内这招可能困难些。

jeremy0519 commented 4 years ago

可以考虑将github迁移到gitee或coding或gitcafe,github pages确实会屏蔽百度爬虫

reclusive-neural-network commented 4 years ago

可以考虑将github迁移到gitee或coding或gitcafe,github pages确实会屏蔽百度爬虫

对。

即使开发仍在github,也最好把页面和数据同步过去(gitee 应该是支持静态页面的)。国内的访问速度也会提高不少。

另外考虑到“众所周知”门槛,最好把新项目也开设在国内的平台上,也就是大多数人可以直接接触到的地方。

但是无论怎样,还是应该把主要精力集中在解决实际问题上。

Elon Musk的话:we don't buy advertising. 酒香不怕巷子深。

根据我一段时间的观察,wuhan2020的“主营业务”医用物资筹集系统实际上同质化很严重,比如https://feiyan.help/ http://charity.foodblockchain.com.cn/?from=timeline&isappinstalled=0 连京东也来了: http://yingji-h5.chanye.jdcloud.com/index.html#/pagesA/protect/protect_index

物资一紧张大家都意识到了这个问题,想帮着解决,但是看上去解决方案都还停留在初始状态。

Wuhan2020能不能做的更好?

比如现在的重要物资应该是按需分配,怎么样客观公平的衡量“需”?

能不能既解决分配问题,又解决一线人员治病救人关怀群众还要开会填表做报告的困难,解决信息逐层传达误差大效率低的问题,解决捐赠物资流向不明的问题,解决不知道谁最需要该给谁捐和捐多少的问题?

这方面dcloud有很多值得借鉴的经验,比如他们一开始就专注于为基层提供定制的解决方案。

当然他们的技术是有优势的:既有前端丰富的UI组件,可以一次开发多平台部署,又有后端(serverless)功能可观的数据库。

但是我们也有优势:类似excel的表格系统。录入信息更容易。数据分析更容易。

当然如果不想通过政府部而门直接服务大众也有很多值得考虑的项目,比如单位复工的信息,比如买口罩的信息。

现在应该很多学校还没开学,是招募志愿者的好时候,只要wuhan2020有一个看起来值得为之努力的目标。

还有如果准备长期发展因该注册一个nonprofit。

最后必须强调一点,如果各位百帮之中没有时间刷新闻:

Wuhan2020 已经被官媒关注了!!!

抗击疫情,软件和技术信息行业在行动 (中华人民共和国工业和信息化部的转载)

:thumbsup: :thumbsup: :thumbsup:

希望各位再接再厉!

jeremy0519 commented 4 years ago

我己经测试了,gitee用baidu抓取没有问题

iLtc commented 4 years ago

有没有人在其他地区测试 gitee?我这里(美国纽约)有几个网络打不开 gitee

reclusive-neural-network commented 4 years ago

gitee在湾区访问正常(延迟稍长)。

jeremy0519 commented 4 years ago

可以参考这个测速结果,http://tool.chinaz.com/speedworld/gitee.com

iLtc commented 4 years ago

迁移社区页面项目请移步 #280 讨论。

其他可以做的: