lottons / chacha

1 stars 0 forks source link

chacha

目标

通过分析安卓应用市场的应用数据,并进行分析后,提供应用、游戏的最新趋势,并通过数据挖掘分析推荐有趣的、好玩的应用和游戏。

架构

总体分为以下几个部分:

图片

网络数据处理部分

用于从网络上抓取数据,基于Python实现。通过爬取应用市场的网页数据,并对数据进行分析,抓取需要的数据。

主要包括以下模块:

parser针对需要解析的内容,支持配置化的数据信息的分析和抓取 详细信息

当前,parser可以针对以下的页面进行配置化的解析处理 详细信息

图片

图片

图片

以上的的解析器,按照对应的分类提供独立的解析过程和对应的配置。每一个app应用市场,可以包含以上所有的解析器和对应的配置。

对于文件类的输出,一个解析器可能输出的文件可能会是多个,因为一个解析器分析得到的数据会有多个分类。每一个分类的数据,会有输出器输出成对应的文件

数据分析处理部分 [todo]

这部分用于对数据抓取后的输出进行分析处理。

  1. 走势分析和排行分析
  1. 图表:柱状图、折线图(不同的维度:下载增量、总下载量、口碑评分)

  2. 数据解析、清洗、计算

对抓取的数据进行处理的过程,目的是为了格式化数据,为后续的数据分析做准备。

服务 [todo]

提供相关的服务功能:

  1. 账号服务:账号注册、注销、修改密码、绑定email、绑定社交账号、偏好设定等功能;

  2. 推送服务:开启、关闭,推送信息(email推送、社交账号推送)等功能;

  3. 推荐:账号访问页面,根据账号的偏好设定,集合数据分析的结果在访问页面提供推荐信息。同时,结合推送服务,在推送时增加推荐的内容;

  4. 行为分析:账号在访问页面时,根据访问页面的交互行文,推断和分析客户的偏好是否有变化,以及刷新客户的偏好数据。