szdxdxdx/count_people - Githubissues

介绍

本项目为学校大数据实训课程的作业

工地作业环境的人数考勤统计

任务类型：实时数据处理、批量数据处理

开发平台：Hadoop、HBase，Mapreduce等

开发语言：Java，Python

现有的工地人数统计通常通过负责人手动数，为了加快智慧工地的进程，设计基于大数据分析的智慧工地人数统计算法。

要求：

本项目的开发语言只有 python

爬虫使用 requests 库

人员目标检测使用 yolo v8

检测结果统计使用 pyspark

后端使用 flask

前端仅使用单页面 html 作展示

确保使用 3.8 版本的 python
在项目根目录 /count_people 下，创建名为 venv 的 python 虚拟环境
激活虚拟环境
安装依赖，详见项目根目录下的 requirements.txt
修改 /src/config.py 中的 APP_ROOT，指向项目的根目录
修改 /src/config.py 中的 JAVA_HOME，指向一个能用的 java8 jdk 目录
在根目录创建目录 /env，下载 hadoop-3.3.0 和 spark-3.1.2-bin-hadoop3.2 到 /env 中下载链接： spark、 hadoop
在系统环境变量中设置 HADOOP_HOME，指向刚刚下载的 /hadoop-3.3.0 目录
在系统环境变量中设置 SPARK_HOME，指向刚刚下载的 /spark-3.1.2-bin-hadoop3.2 目录
在系统环境变量 Path 中添加 %HADOOP_HOME%\bin 和 %SPARK_HOME%\bin

使用 flask 运行 /src/app.py，访问http://127.0.0.1:5000，如果看到 hello world!和一个随机数字，说明 flask 可以正常运行。然后退出程序
运行 /src/count_people_processor.py 中的 main，会执行一次人数统计操作
使用 flask 运行 /src/app.py，然后用浏览器打开 /web/index.html 查看刚刚统计的结果