做封面的地图网站,wordpress会员中心vip收费,杭州富阳网站建设,湘潭网站建设 搜搜磐石网络炼数成金数据分析课程---16、机器学习中的分类算法#xff08;交叉内容#xff0c;后面要重点看#xff09; 一、总结 一句话总结#xff1a; 大纲实例快速学习法 主要讲解常用分类算法(如Knn、决策树、贝叶斯分类器等)的原理及python代码实现 1、什么是分类#xff1f; 分… 炼数成金数据分析课程---16、机器学习中的分类算法交叉内容后面要重点看 一、总结 一句话总结 大纲实例快速学习法 主要讲解常用分类算法(如Knn、决策树、贝叶斯分类器等)的原理及python代码实现 1、什么是分类 分类模型输入样本的属性值输出对应的类别将每个样本映射到预先定义好的类别 2、常用分类算法 -Knn算法 -决策树 -贝叶斯分类器 -神经网络 -Knn算法
-决策树
-贝叶斯分类器
-支持向量机
-神经网络 3、分类算法中的决策树的主要思想是什么 空间划分看图 4、分类算法中的决策树的介绍 树中每一个非叶节点表示一个决策该决策的值导致不同的决策结果叶节点或者影响后面的决策选择。 根据给定的未知分类的元组X根据其属性值跟踪一条由根节点到叶节点的路径该叶节点就是该元组的分类结果预测。 5、构建决策树的算法的本质是什么 贪心在构建决策树时这两类算法的流程基本一样都采用贪心方法自顶而下递归构建决 策树 6、贪心算法如何构建决策树 1.创建一个结点N。如果D中的元组都在同一个类别C中则N作为叶结点以C标记如果属性列表为空则N作为叶节点以D中最多的类别C作为标记。 2.根据分裂准则找出“最好”的分裂属性A并用该分裂属性标记N。1A是离散的则A的每个已知值都产生一个分支2A是连续的则产生Ass和As两个分支3若A是连续的并且必须产生二叉树则产生AEA1和AEA2两个分支其中A1A2非空且A1UA2A 3.若给定的分支中的元组非空对于D的每一个分支Dj重复步骤12 7、分类算法中的决策树的 属性选择 如何度量 如果我们根据分裂准则把D划分为较小的分区最好的情况是每个分区都是纯的即落在一个给定分区的所有元组都是相同的类。最好的分裂准则就是令到每个分区尽量的纯。 属性选择度量给学习集中的每个属性提供了评定。具有最好度量得分的属性被选为分裂属性。 8、决策树的剪枝的两种常用方法是什么 先剪枝通过设定一定的阀值来停止树的生长例如在构建树模型时使用信息增益、基尼指数来度量划分的优劣。可以预先设定一个阀值当划分一个结点的元组到时低于预设的阀值时停止改子集的划分 后剪枝等树完全生成后再通过删除结点去修剪决策树。由于先剪枝中选择合适的阀值存在一定的困难所以后剪枝更加常用 9、python中使用决策分类算法常需要借助哪些包 主要是python的sklearn库 import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import precision_recall_curve
from sklearn.metrics import classification_report
from sklearn.naive_bayes import BernoulliNB
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.cross_validation import train_test_split
import matplotlib.pyplot as plt
import pandas as pd 二、内容在总结中 决策树--空间分割 week13 转载于:https://www.cnblogs.com/Renyi-Fan/p/10989866.html