ccc013 / Study-Notes

算法、编程学习笔记
43 stars 11 forks source link

机器学习&深度学习 资源&教程&文章&项目 #8

Open ccc013 opened 5 years ago

ccc013 commented 5 years ago

汇总目录:

ccc013 commented 5 years ago

综合资源

  1. Awesome Computer Vision--Github 上的一个9000+星的资源,包含书籍、课程、教程、论文、数据集、博客等等
  2. 资源汇总 | 200多个最好的机器学习、NLP和Python相关教程
  3. AI算法工程师手册--包含数学基础、机器学习、深度学习、计算机视觉和NLP等知识
  4. StateOfTheArt.ai --AI 界的 State of the Art都在这里了
  5. awesome-fashion-ai--有关 fashion 和 e-commerce 方面的研究论文、数据集等
  6. AlphaTree-graphic-deep-neural-network--介绍了深度学习的一些模型,并且有图示,包含了图像分类、物体检测、人脸检测与识别等方向
  7. AiLearning: 机器学习 - MachineLearning - ML、深度学习 - DeepLearning - DL、自然语言处理 NLP
  8. A complete ML study path, focused on TensorFlow and Scikit-Learn--机器学习的学习路线
ccc013 commented 5 years ago

网上教程

机器学习

深度学习

CNN

RNN & LSTM

人脸

ccc013 commented 5 years ago

视频课程

机器学习

机器学习基石 [课程主页] [b站视频] 配套书籍:Learning From Data 笔记和习题

机器学习技法 [b站视频]

深度学习

ccc013 commented 5 years ago

书籍

机器学习

代码:https://github.com/wzyonggege/statistical-learning-method

https://github.com/WenDesi/lihang_book_algorithm

https://blog.csdn.net/tudaodiaozhale

https://github.com/fengdu78/lihang-code

https://github.com/SmirkCao/Lihang

南瓜书: https://github.com/datawhalechina/pumpkin-book 对书中公式的补充推导

深度学习

ccc013 commented 5 years ago

网站

国内

国外

ccc013 commented 5 years ago

论文

顶会

2019年accepted paper:

https://aaai.org/Conferences/AAAI-19/wp-content/uploads/2018/11/AAAI-19_Accepted_Papers.pdf

2018年accepted paper:

https://aaai.org/Conferences/AAAI-18/wp-content/uploads/2017/12/AAAI-18-Accepted-Paper-List.Web_.pdf

2017年accepted paper:

https://www.aaai.org/Conferences/AAAI/2017/aaai17accepted-papers.pdf

2018年accepted paper:

http://www.ijcai-18.org/accepted-papers/index.html

2017年accepted paper:

https://ijcai-17.org/accepted-papers.html

2018年accepted paper:

https://icml.cc/Conferences/2018/Schedule?type=Poster

2017年accepted paper:

https://icml.cc/Conferences/2017/Schedule?type=Poster

2018年accepted paper:

https://nips.cc/Conferences/2018/Schedule?type=Poster

2017年accepted paper:

https://nips.cc/Conferences/2017/Schedule?type=Poster

CVPR 2018 accepted paper:http://openaccess.thecvf.com/CVPR2018.py

CVPR 2017 accepted paper:http://openaccess.thecvf.com/CVPR2017.py

ICCV 2017 accepted paper:http://openaccess.thecvf.com/ICCV2017.py

ECCV 2018 accepted paper:http://openaccess.thecvf.com/ECCV2018.py

综合资源

ccc013 commented 5 years ago

项目 & Github

人脸

计算机视觉

ccc013 commented 5 years ago

博客

国内

  1. 机器学习--tornadomeet--这是别人学习机器学习和深度学习做下笔记的博客,有好几十篇博文呢。
  2. zouxy09的专栏--这个博客不只有机器学习内容,还有一个深度学习的系列。
  3. Machine Learning--也是有关机器学习的一个博客。
  4. 美团技术团队
  5. 苏剑林的博客
  6. 火光摇曳:腾讯技术大牛们的博客

国外

公司&组织
  1. OpenAI--OpenAI
  2. Distill--Distill
  3. Google AI Blog--谷歌AI的博客
  4. Notes on machine learning
  5. BAIR Blog--伯克利大学AI小组博客
  6. DeepMind Blog--DeepMind的博客
  7. FAIR Blog--Facebook AI博客
  8. Netflix:Netflix技术博客
  9. Towards Data Science
个人
  1. SALu--有关于 GAN 方面的文章
  2. Colah’s Blog--神经网络理解方面的入门,以及深度学习知识
  3. Ruder’s Blog--多任务学习、迁移学习
  4. inFERENCe
  5. Andrew Trask’s Blog
  6. Adit Deshpande’s Blog--比较适合入门神经网络
  7. Graduate Descent
ccc013 commented 5 years ago

比赛

比赛网站

  1. Kaggle
  2. 天池
  3. DataFountain
  4. FlyAI
  5. JData

比赛经验

ccc013 commented 5 years ago

数据集

八大机器学习数据集

文章介绍:[原文][翻译]

1. Kaggle 数据集

数据集地址:

https://www.kaggle.com/datasets

每个数据集都是一个小型社区,用户可以在其中讨论数据、查找公共代码或在内核中创建自己的项目。包含各式各样的真实数据集。

用户还可以看到与每个数据集相关的“内核”,许多数据科学家还提供了相关手册来分析数据集。

2. Amazon 数据集

数据集地址:

https://registry.opendata.aws/

该数据源包含多个不同领域的数据集,如:公共交通、生态资源、卫星图像等。

网页中也有一个搜索框来帮助用户寻找想要的数据集,还有所有数据集的描述和使用示例,这些数据集信息丰富且易于使用!

数据集存储在Amazon Web Services (AWS)资源中,比如Amazon S3——云中的一个高度可伸缩的对象存储服务。

如果用户正在使用AWS进行机器学习实验和开发,这将非常方便,由于它是AWS网络的本地数据,因此数据集的传输将非常快。

3. UCI机器学习资源库

数据集地址:

https://archive.ics.uci.edu/ml/datasets.html

另一个来自加州大学信息与计算机科学学院的大型资源库,包含100多个数据集。

用户可以找到单变量和多变量时间序列数据集,分类、回归或推荐系统的数据集。

有些UCI的数据集已经是被清洗过的。

4. 谷歌数据集搜索引擎

数据集地址:

https://toolbox.google.com/datasetsearch

在2018年末,谷歌做了他们最擅长的事情,推出了另一项伟大的服务——它是一个可以按名称搜索数据集的工具箱。

他们的目标是统一成千上万个不同的数据集存储库,使这些数据能够且易被发现。

5. 微软数据集

数据集地址:

https://msropendata.com/

2018年7月,微软与外部研究社区共同宣布推出“Microsoft Research Open Data”。

它在云中包含一个数据存储库,用于促进全球研究社区之间的协作。它提供了一系列用于已发表研究的、经过处理的数据集。

6. Awesome Public Datasets Collection

数据集地址:

https://github.com/awesomedata/awesome-public-datasets

这是一个按“主题”组织的数据集,比如生物学、经济学、教育学等。

这里列出的大多数数据集都是免费的,但是在使用任何数据集之前,用户需要检查一下许可要求。

7. 政府数据集

政府相关数据集也很容易找到的。

许多国家为了提高透明度,向公众分享了各种数据集。以下是一些例子:

欧盟开放数据门户:欧洲政府数据集。

数据集地址:

https://data.europa.eu/euodp/data/dataset

美国政府数据:目前由于一些非政治性原因,暂时无法访问。

数据集地址:

https://www.data.gov/

新西兰政府数据集:

数据集地址:

https://catalogue.data.govt.nz/dataset

印度政府数据集:

数据集地址:

https://data.gov.in/

8. 计算机视觉数据集

数据集地址:

https://www.visualdata.io/

Visual Data包含一些可以用来构建计算机视觉(CV)模型的大型数据集。

用户可以通过特定的CV主题查找特定的数据集,如语义分割、图像标题、图像生成,甚至可以通过解决方案(自动驾驶汽车数据集)查找特定的数据集。


常用数据集

  1. Mnist:手写数字数据集,包含 60000 张训练集和 10000 张测试集。
  2. fashion-mnist [官网] [Github]
  3. Cifar:分为 Cifar10 和 Cifar100。前者包含 60000 张图片,总共10个类别,每类 6000 张图片。后者是 100 个类别,每个类别 600 张图片。类别包括猫狗鸟等动物、飞机汽车船等交通工具。
  4. Imagenet:应该是目前最大的开源图像数据集,包含 1500 万张图片,2.2 万个类别。
  5. lsun [官网] [Github]
  6. Open Images V4[Description][Download][Paper]--包含 600 个类别,900w 张数据集,包含图片标签、物体检测框以及视觉关系的标注信息。

人脸数据集

  1. LFW
  2. CelebA

数据集介绍:https://blog.csdn.net/Cloudox_/article/details/78432517

百度云下载:https://pan.baidu.com/s/1eSNpdRG#list/path=%2FCelebA%2FImg

  1. MS-Celeb-1M

  2. CASIA-WebFace

  3. FaceScrub

  4. MegaFace

衣服数据集

  1. Fashion Detection in the Wild (Deep Clothes Detector)

数据集:Large-scale Fashion (DeepFashion) Database

论文:DeepFashion: Powering Robust Clothes Recognition and Retrieval with Rich Annotations.

作者介绍[Home][PPT]

文章:

  1. MULTI-VIEW CLOTHING DATASET

论文:MVC: A Dataset for View-Invariant Clothing Retrieval and Attribute Prediction

数据集:数据集

ccc013 commented 5 years ago

面试资料

综合

题目