首页 1 2 3 4 5 6 7

机器学习算法10_决策树+CART(回归树)

机器学习算法第十篇

主要内容:决策树算法+CART(回归树)

$\$

CART算法概念

CART(classification and regression tree) 故英文名思意:分类和回归树.
CART算法包含决策树生成和决策树剪枝两部分
CART决策生成树部分主要分为生成回归树和生成分类树
本篇主要讲生成回归树
$\$

算法目的

构建一棵可以对输入样本进行很好预测,并输出预测值的二叉决策回归树

$\$

恩, 开始测试的时候,它是这样做的…

把一个样本放入节点
比较自身与节点的特征,选择一个分支: ‘下去’
循环 ‘下去’ , 直到叶子节点为止
当一个测试样本a落入某叶子时, 该叶子的c值作为该样本a的预测值输出
(某叶子的c值是该树在训练时候, 训练集划分到该叶子的所有样本的输出值的平均值)
(每个节点都有一个特征选择,如:长头发向左分支,短头发向右分支,该选择是决策树生成的时候遗留的)

$\$

那问题来了, 训练的时候如何生成一棵树?

算法一开始将所有训练样本丢到根节点
然后通过某准则将它们切成两份,分别丢入左节点与右节点
然后对每个节点按照该准则继续切分,直到某个情况发生,停止切分,直接生成叶子节点
(某情况是指:例如节点内样本数不能低于10个,树的层数不超过11层…参数设置的问题啊)

$\$

那问题又来了,什么准则可以很好的切分?

算法这样做滴:
我们针对一个节点D, 定义一个误差函数J 它可以计算该节点内所有样本的的总误差J(D)
然后取节点内某特征m与该特征的某个取值n,
再按照每个样本的的 $\le n与m>n$

$\$

那问题又又来了,误差函数怎么定才好?

算法说:单个节点所有样本的预测值与平均值之差的平方的和(总方差)作为该叶子节点误差
$即:单个节点误差=\sum^{节点样本总数}_{i=1}(y_i-\bar y)^2$

$\$

这个式子可以很好表达我们对误差的定义,
同时每个叶子内部所有样本输出值y的总方差越小,其平均值c的代表性就越高
(在样本容量相同的情况下，方差越大，说明数据的波动越大，越不稳定)

$\$

$\$

$\$

Gson源码解析（二）

Gson源码解析（二）反射机制详解接着上篇留下来的问题，Gson是怎么序列化我们自己创建的JavaBean对象？还记得在gson初始化时添加的一系列Factory吗，我们可以看到它添加了一个 facto

PNG图片位深度转换

一、导言在嵌入式设备的开发中，有一些嵌入式设备对于图片的格式和大小有限制，有些在项目中使用到的图片资源需要严格限制图片的位深度。但常规方式压缩图片会使得图片质量下降严重，我们需要效率同时又能最大程度保留图片质量的方法。通过这篇文章你能简

原生js和vue使用websocket

项目效果共两个页面

jsonp跨域请求出现问题

最近遇到一个问题，jsonp跨域请求时，报错：客户端代码：

大数据之 Zookeeper（Zookeeper入门及安装）

文章目录大数据

javascript实现复制内容到用户的剪贴板中

js封装复制内容到剪切板上代码 /** ** text:需要复制的文

标注工具labelimg的安装和使用

window端安装和使用

Caffe学习笔记1：初识caffe篇（caffe介绍）

小菜一开始学习caffe的时候，是去网上找了一些有关caffe的介绍的资料和一些博客，还看了caffe的创建者贾扬清对caffe的一个简单介绍，如果英语比较好的人，你们可以去贾扬清的主页上去看看caffe的介绍。下面介绍的内容也是小菜查找了许多博客选了一篇比较好的博

Unity --- 枪类与子弹类的设计初探与 Physics Material

1.类的设计方法 --- 首先将不同的对象相同的行为和方法做到一个类A中，然后再给每个对象各创建一个类，并且都继承大类A，同时在自己的类中创建自己独有的方法或者属性

rabbitmq菜鸟教程,搭建rabbitmq

一、前言 RabbitMQ是一个开源的遵循 AMQP协议实现的基于 Erlang