data-com / discussions

http://data-com.github.io
5 stars 0 forks source link

Random_forest #10

Open necogy opened 5 years ago

necogy commented 5 years ago

random forest简介

在机器学习中,ensemble的意思大概分两种,一是algorithm,比如说我们使用同一组数据,用不同方法来跑。或者反过来,只用一种方法,但把数据分为很多组,单独训练。最后把所有结果集中起来。虽然单独的子集训练结果bias是比拿所有数据来训练要高的(抽样误差),然而最后通过这种方式bias和variance都可以同时被降低。

image

7

emptymalei commented 5 years ago

我有一个问题唉,这个对数据集大小的要求是不是比分一次 training set 要更大呢?

necogy commented 5 years ago

当然理论上越大会越好,然而这最后也需要配合别的参数来调整。

emptymalei commented 5 years ago

Published in Issue 7