Watemlifts / Python-100-Days

Python - 100天从新手到大师
1 stars 0 forks source link

Python - 100天从新手到大师

作者:骆昊

说明:最近有很多想学习Python的小伙伴申请单独加我微信和QQ,因为我自己平时也很忙,没办法一一解答大家的问题,我创建了Python100天学习交流1群Python100天学习交流2群两个交流群,群号分别为680701107213132758,二维码在下方。我的同事和朋友很多也在这个群里,他们都是优秀的Python开发者,有丰富的商业项目经验,我们在时间充足的时候会及时解答大家的问题,而且从Python语言入门到Web应用开发,从数据分析到机器学习,每个领域都有技术大咖为大家解惑答疑。以后我们争取每周做一次视频直播,以专题的形式分享Python开发的点点滴滴,同时还会不定期的举办线上和线下的技术交流和分享活动,小伙伴们可以加群进行交流。感谢千锋教育Python教学部对本群的支持。

Python应用领域和就业形势分析

简单的说,Python是一个“优雅”、“明确”、“简单”的编程语言。

目前几个比较流行的领域,Python都有用武之地。

作为一名Python开发者,主要的就业领域包括:

下图显示了主要城市Python招聘需求量及薪资待遇排行榜(截止到2018年5月)。

Python招聘需求及薪资待遇Top 10

给初学者的几个建议:

Day01~15 - Python语言基础

Day01 - 初识Python

Day02 - 语言元素

Day03 - 分支结构

Day04 - 循环结构

Day05 - 总结和练习

Day06 - 函数和模块的使用

Day07 - 字符串和常用数据结构

Day08 - 面向对象编程基础

Day09 - 面向对象进阶

Day10 - 图形用户界面和游戏开发

Day11 - 文件和异常

Day12 - 字符串和正则表达式

Day13 - 进程和线程

Day14-A - 网络编程入门

Day14-B - 网络应用开发

Day15 - 图像和文档处理

Day16~Day20 - Python语言进阶

Day21~30 - Web前端入门

Day31~35 - 玩转Linux操作系统

Day36~40 - 数据库基础和进阶

Day41~55 - 实战Django

Day41 - 快速上手

Day42 - 深入模型

Day43 - 静态资源和Ajax请求

Day44 - 表单的应用

Day45 - Cookie和Session

Day46 - 中间件的应用

Day47 - 日志和调试

Day48 - 文件上传和富文本编辑

Day49 - 文件下载和报表

Day50 - RESTful架构和DRF入门

Day51 - RESTful架构和DRF进阶

Day52 - 使用缓存

Day53 - 短信和邮件

Day54 - 异步任务和定时任务

Day55 - 单元测试和项目上线

Day56~60 - 实战Flask

Day56 - Flask入门

Day57 - 模板的使用

Day58 - 表单的处理

Day59 - 数据库操作

Day60 - 项目实战

Day61~65 - 实战Tornado

Day61 - 预备知识

Day62 - Tornado入门

Day63 - 异步化

Day64 - WebSocket的应用

Day65 - 项目实战

Day66~75 - 爬虫开发

Day66 - 网络爬虫和相关工具

Day67 - 数据采集和解析

Day68 - 存储数据

Day69 - 并发下载

Day70 - 解析动态内容

Day71 - 表单交互和验证码处理

Day72 - Scrapy入门

Day73 - Scrapy高级应用

Day74 - Scrapy分布式实现

Day75 - 爬虫项目实战

Day76~90 - 数据处理和机器学习

Day76 - 机器学习基础

Day77 - Pandas的应用

Day78 - NumPy和SciPy的应用

Day79 - Matplotlib和数据可视化

Day80 - k最近邻(KNN)分类

Day81 - 决策树

Day82 - 贝叶斯分类

Day83 - 支持向量机(SVM)

Day84 - K-均值聚类

Day85 - 回归分析

Day86 - 大数据分析入门

Day87 - 大数据分析进阶

Day88 - Tensorflow入门

Day89 - Tensorflow实战

Day90 - 推荐系统

Day91~100 - 团队项目开发

第91天:团队开发和项目选题

  1. 软件过程模型

    • 经典过程模型(瀑布模型)
      • 可行性分析(研究做还是不做),输出《可行性分析报告》。
      • 需求分析(研究做什么),输出《需求规格说明书》和产品界面原型图。
      • 概要设计和详细设计,输出概念模型图、物理模型图、类图、时序图等。
      • 编码 / 测试。
      • 上线 / 维护。
    • 敏捷开发(Scrum)- 产品所有者、Scrum Master、研发人员 - Sprint

      • 产品的Backlog(用户故事、产品原型)。
      • 计划会议(评估和预算)。
      • 日常开发(站立会议、番茄工作法、结对编程、测试先行、代码重构……)。
      • 修复bug(问题描述、重现步骤、测试人员、被指派人)。
      • 评审会议(Showcase)。
      • 回顾会议(当前周期做得好和不好的地方)。

      补充:敏捷软件开发宣言

      • 个体和互动 高于 流程和工具
      • 工作的软件 高于 详尽的文档
      • 客户合作 高于 合同谈判
      • 响应变化 高于 遵循计划

      角色:产品所有者(决定做什么,能对需求拍板的人)、团队负责人(解决各种问题,专注如何更好的工作,屏蔽外部对开发团队的影响)、开发团队(项目执行人员,具体指开发人员和测试人员)。

      准备工作:商业案例和资金、合同、憧憬、初始产品需求、初始发布计划、入股、组建团队。

      敏捷团队通常人数为8-10人。

      工作量估算:将开发任务量化,包括原型、Logo设计、UI设计、前端开发等,尽量把每个工作分解到最小任务量,最小任务量标准为工作时间不能超过两天,然后估算总体项目时间。把每个任务都贴在白板上面,白板上分三部分:to do(待完成)、in progress(进行中)和done(已完成)。

  2. 项目团队组建

    • 团队的构成和角色

      说明:谢谢付祥英女士绘制了下面这张精美的公司组织架构图。

      company_architecture

    • 编程规范和代码审查(flake8、pylint)

    • Python中的一些“惯例”(请参考《Python惯例-如何编写Pythonic的代码》

    • 影响代码可读性的原因:

      • 代码注释太少或者没有注释
      • 代码破坏了语言的最佳实践
      • 反模式编程(意大利面代码、复制-黏贴编程、自负编程、……)
  3. 团队开发工具介绍

    请参考《团队项目开发》

项目选题和理解业务
  1. 选题范围设定

    • CMS(用户端):新闻聚合网站、问答/分享社区、影评/书评网站等。

    • MIS(用户端+管理端):KMS、KPI考核系统、HRS、CRM系统、供应链系统、仓储管理系统等。

    • App后台(管理端+数据接口):二手交易类、报刊杂志类、小众电商类、新闻资讯类、旅游类、社交类、阅读类等。

    • 其他类型:自身行业背景和工作经验、业务容易理解和把控。

  2. 需求理解、模块划分和任务分配

    • 需求理解:头脑风暴和竞品分析。
    • 模块划分:画思维导图(XMind),每个模块是一个枝节点,每个具体的功能是一个叶节点(用动词表述),需要确保每个叶节点无法再生出新节点,确定每个叶子节点的重要性、优先级和工作量。
    • 任务分配:由项目负责人根据上面的指标为每个团队成员分配任务。

  3. 制定项目进度表(每日更新)

    模块 功能 人员 状态 完成 工时 计划开始 实际开始 计划结束 实际结束 备注
    评论 添加评论 王大锤 正在进行 50% 4 2018/8/7 2018/8/7
    删除评论 王大锤 等待 0% 2 2018/8/7 2018/8/7
    查看评论 白元芳 正在进行 20% 4 2018/8/7 2018/8/7 需要进行代码审查
    评论投票 白元芳 等待 0% 4 2018/8/8 2018/8/8

第92天:数据库设计和OOAD

概念模型和正向工程
  1. UML(统一建模语言)的类图

    uml

  2. 通过模型创建表(正向工程)

    python manage.py makemigrations app
    python manage.py migrate
物理模型和反向工程
  1. PowerDesigner

  2. 通过数据表创建模型(反向工程)

    python manage.py inspectdb > app/models.py

第93-98天:使用Django开发项目

说明:具体内容请参考《Django知识点概述》

项目开发中的公共问题
  1. 数据库的配置(多数据库、主从复制、数据库路由)
  2. 缓存的配置(分区缓存、键设置、超时设置、主从复制、故障恢复(哨兵))
  3. 日志的配置
  4. 分析和调试(Django-Debug-ToolBar)
  5. 好用的Python模块(日期计算、图像处理、数据加密、三方API)
REST API设计
  1. RESTful架构
  2. API接口文档的撰写(《网络API接口设计》
  3. django-REST-framework的应用
项目中的重点难点剖析
  1. 使用缓存缓解数据库压力 - Redis
  2. 使用消息队列做解耦合和削峰 - Celery + RabbitMQ

第99-100天:测试和部署

单元测试
  1. 测试的种类
  2. 编写单元测试(unittest、pytest、nose2、tox、ddt、……)
  3. 测试覆盖率(coverage)
项目部署

说明:请参考《项目部署上线指南》

  1. 部署前的准备工作
    • 关键设置(SECRET_KEY / DEBUG / ALLOWED_HOSTS / 缓存 / 数据库)
    • HTTPS / CSRF_COOKIE_SECUR / SESSION_COOKIE_SECURE
    • 日志相关配置
  2. Linux常用命令回顾
  3. Linux常用服务的安装和配置
  4. uWSGI/Gunicorn和Nginx的使用
    • Gunicorn和uWSGI的比较
      • 对于不需要大量定制化的简单应用程序,Gunicorn是一个不错的选择,uWSGI的学习曲线比Gunicorn要陡峭得多,Gunicorn的默认参数就已经能够适应大多数应用程序。
      • uWSGI支持异构部署。
      • 由于Nginx本身支持uWSGI,在线上一般都将Nginx和uWSGI捆绑在一起部署,而且uWSGI属于功能齐全且高度定制的WSGI中间件。
      • 在性能上,Gunicorn和uWSGI其实表现相当。
  5. 虚拟化技术(Docker)
性能测试

说明:具体内容请参考《Django知识点概述》

  1. AB的使用
  2. SQLslap的使用
  3. sysbench的使用
自动化测试
  1. 使用Shell和Python进行自动化测试
  2. 使用Selenium实现自动化测试
    • Selenium IDE
    • Selenium WebDriver
    • Selenium Remote Control
  3. 测试工具Robot Framework介绍
项目性能调优
  1. 数据库性能调优 - 请参考《MySQL相关知识》

    • 软硬件优化

    • SQL优化

    • 架构优化

      • 分表分库

      • 主从复制,读写分离

      • 集群架构

  2. Web服务器性能优化

    • Nginx负载均衡配置

    • Keepalived实现高可用

  3. 代码性能调优

    • 多线程
    • 异步化
  4. 静态资源访问优化

    • 云存储
    • CDN

致谢:感谢的我的同事古晔、张旭、肖世荣、王海飞、荣佳伟、路丰坤等在技术上给予的指导和帮助。