目录
关于SoAI-About The School of AI
An international educational non-profit platform dedicated to studying, teaching and creating AI to help solve the world’s most difficult problems. Our mission is to offer a world-class AI education to anyone on Earth for free.
Siraj对SoAI的介绍
北京分部有中文、英文两个版本,详情:
英语分支,每周一晚在朝阳,Max 主讲,github en
中文分支,每周末下午17:00,清华大学,海淀区双清路双清大厦4号楼4层清华数据科学研究院,王奇文 等主讲,采用翻转课堂方式
,
SoAI-北京
Fast.AI
开发环境-Dev environment
多种方式:本地、云环境,由于不少项目需要GPU支持,建议采用云环境
本地环境-Local env
为什么大家都用jupyter notebook?深度学习代码只能在notebook上跑吗?
非也,notebook主要用于教学展示,代码分享,工程落地时,必须转成单个的python文件,按照机器学习的基本流程划分文件及目录,常见的结构如下:
data:数据目录,包含:
train.txt
test.txt
validation.txt(可选)
bin:核心代码,主要包含:
model.py:模型定义
feature.py:特征工程部分,离线训练和在线评估都有
train.py:模型训练代码
predict.py:在线预测(inference,推断)
model:模型存放
log:日志目录
conf:配置文件
common:公共库、组件
云环境-Cloud env
学习资料-Learning material
入门必读-Must read for beginners
知识体系(参考第一次课:深度学习入门指南 )
如何高效学习
数学基础:(选读,如果想深入学习,就必读)
Python生态圈
numpy, 矩阵运算工具,资料如下:
pandas,表格数据分析工具,资料如下:
matplotlib,画图工具,资料如下:
机器学习入门:
深度学习入门:
神经网络讲解【3Blue1Brown优质讲解 】,该系列一共4个视频,第一个如下:
神经网络3D仿真特效(多种网络结构对比)
手写数字识别在线体验
课程列表-Syllabus
Fast.AI系列速成实战课程,时间安排如下:
注意:这是github page搭建的主页,如想进入github,请点击“View on Github”,示例如下:
历次ppt课件资源
时间-Date
章节-Chapter
题目-Topic
预习资源-Resources
正式解读-Interpretation
作业-Homework
2019-04-21
介绍
深度学习入门指南
请完成ppt里提到的作业,长期
这节课长达2h,内容非常多,覆盖深度学习入门几乎全部知识点
完整看完80+页的ppt,并预习第二课
2018-04-27
第一课
宠物图片分类,英文视频 ,中文版笔记
Github代码
安装fastai环境并动手实现,代码解析:Github本地 ,Colab ,Kaggle
亲手执行本次代码,熟悉fastai环境
2018-05-12
第二课
特征工程及SGD,英文视频 ,中文版笔记
Github代码
github ,colab ,kaggle示例
①熟悉fastai+kaggle环境②执行scikit-learn代码,github库里,code/lecture_2 目录下 ③学完google机器学习速成课速成课(地址见本页面的入门必读) ④预习神经网络fastai第五课-反向传播与神经网络
2018-05-*
第三课
多标签分类,英文视频 ,中文版笔记
Github代码
-
作业
2018-05-*
第四课
NLP&推荐系统,英文视频 ,中文版笔记
Github代码
-
作业
2018-05-*
第五课
从反向传播到神经网络,英文视频 ,中文版笔记
Github代码
github代码 ,ppt
作业
2018-05-*
第六课
正则化卷积,英文视频 ,中文版笔记
Github代码
-
作业
2018-05-*
第七课
Resnets、GAN等,英文视频 ,中文版笔记
Github代码
-
作业
-
-
-
-
-
-
作业
最新课程安排见project区 ,Fastai中文笔记 ,kaggle中文代码
课程内容-Contents
本教程以fastai的速成课 为蓝本(注意:需要vpn,如果没有,请往下看,找bilibili上的视频)
ppt资源
第一课 深度学习入门指南-Intro to Deep Learning
深度学习入门全貌,请仔细看
第二课 图像分类-Image Classification
主题:fastai课程的第一课进行讨论:图像分类。
时间:于4月27日星期日下午5点举行
地点:双清路77号院双清大厦4号楼4层清华数据科学研究院
议程:
介绍fastai第1课的必要资源,如何获取fastai的资源
学生现场演示第一课作业
自由问答, 遇到困难
视频资料:(来自哔哩哔哩 )
作业汇总-Homework Summary
参考资料-References
CNN和CV
iris数据集+机器学习实战
CNN简介
应用
反思
结业答辩-Graduation presentations
介绍 Introduction
时间:2019-06-16
中文分支的往期内容及课件,见地址
答辩现场,由于学员较多,时间长,从16:00-19:40,衷心感谢各位坚持到最后
中文分支 Chinese branch
第一位 邢畅, xingchang, 16:07,学习总结,在地理信息系统里的应用
介绍了GIS领域的应用,整理了详细的学习笔记、脑图
第二位 张天奇,Tianqi.Zhang,16:27,kaggle比赛,基于新闻语料的股价涨跌预测,Eric Zhang
成绩:356/2800, ≈13%,4个人的团队,负责特征工程+多线程实现,xgboost主要负责分类
提问:
xGBoost的原理,既可以用于分类,还可以用于回归
代码里将的metric用的是MSE,而xgb导入的是分类器,看似矛盾?
第三位 五个人,推荐资料:数学基础张宇36讲,课程内容回顾;
蒋宝尚,mnist的python实现,文本分析(大爆炸+华为+五月天)
周启红,学术文章关键词提取,学习过程中遇到的坑儿
王瑞华,视频汇报
第四位 黄安付,17:15,专题报告:fit_one_cycle()详解
第五位 李靖华,17:36,学习总结
git,学习方法总结
实习经历,4w张图片分类,用代码1天完成,做事情时先别急着动手
成功拿到创新工场的实习机会,新人到职场的华丽蜕变
总结
答辩里的几个技术点可以继续深挖:
①sgd各种算法演化,动量和梯度分别对应哪一块?这道题是新手的进阶题,打怪升级的典型门槛
②kaggle项目里的矛盾点要必要澄清下,基于新闻预测股价,为什么用xgb分类?特征工程部分可以继续系统化,不满足于简单的数据处理
③实习经历里的4w张图像标注任务可以补充描述下,说不定有更好的办法
英文分支 English branch
资料汇总-Resources
部分学员的答辩整理已收集到目录 , 欢迎大家积极分享自己的资料,共同学习,添加方式,回复本帖
Part of the resources have been collected to this address , it's recommended to share your own ppt/code/post here by reply bellow, learn from each other
大部分基础知识以及扩展资料都在之前的课程ppt中,多看SoAI主页The School of AI Beijing ,毕业了并不代表学完了,或者真的学好了,请大家有空多温习,少走弯路
交流分享-Share
欢迎大家入群分享、交流!
合作方-Partners
举办地点:清华大学
时间:每周末一次,如想参加,请先文摘助手微信,往期海报如下:
评论区
为正常使用来必力评论功能请激活JavaScript