当前位置: 首页 > news >正文

汕头网站安全开发系统应聘ui设计师自我介绍

汕头网站安全开发系统,应聘ui设计师自我介绍,沈阳网络建网站,长沙网站制作app开发公司ROC曲线与AUC值 1.概述AUC#xff08;Area Under roc Curve#xff09;是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多#xff0c;例如#xff1a;大约10年前在machine learning文献中一统天下的标准#xff1a;分类精度#xff1b;在信息检索(IR)领域中常… ROC曲线与AUC值 1.概述 AUCArea Under roc Curve是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多例如大约10年前在machine learning文献中一统天下的标准分类精度在信息检索(IR)领域中常用的recall和precision等等。其实度量反应了人们对”好”的分类结果的追求同一时期的不同的度量反映了人们对什么是”好”这个最根本问题的不同认识而不同时期流行的度量则反映了人们认识事物的深度的变化。 近年来随着machine learning的相关技术从实验室走向实际应用一些实际的问题对度量标准提出了新的需求。特别的现实中样本在不同类别上的不均衡分布(class distribution imbalance problem)。使得accuracy这样的传统的度量标准不能恰当的反应分类器的performance。举个例子测试样本中有A类样本90个B 类样本10个。分类器C1把所有的测试样本都分成了A类分类器C2把A类的90个样本分对了70个B类的10个样本分对了5个。则C1的分类精度为 90%C2的分类精度为75%。但是显然C2更有用些。另外在一些分类问题中犯不同的错误代价是不同的(cost sensitive learning)。这样默认0.5为分类阈值的传统做法也显得不恰当了。 为了解决上述问题人们从医疗分析领域引入了一种新的分类模型performance评判方法——ROC分析。ROC分析本身就是一个很丰富的内容有兴趣的读者可以自行Google这里只做些简单的概念性的介绍。 ROC的全名叫做Receiver Operating Characteristic其主要分析工具是一个画在二维平面上的曲线——ROC curve。平面的横坐标是false positive rate(FPR)纵坐标是true positive rate(TPR)。对某个分类器而言我们可以根据其在测试样本上的表现得到一个TPR和FPR点对。这样此分类器就可以映射成ROC平面上的一个点。调整这个分类器分类时候使用的阈值我们就可以得到一个经过(0, 0)(1, 1)的曲线这就是此分类器的ROC曲线。一般情况下这个曲线都应该处于(0, 0)和(1, 1)连线的上方。因为(0, 0)和(1, 1)连线形成的ROC曲线实际上代表的是一个随机分类器。如果很不幸你得到一个位于此直线下方的分类器的话一个直观的补救办法就是把所有的预测结果反向即分类器输出结果为正类则最终分类的结果为负类反之则为正类。虽然用ROC curve来表示分类器的performance很直观好用。可是人们总是希望能有一个数值来标志分类器的好坏。于是Area Under roc Curve(AUC)就出现了。顾名思义AUC的值就是处于ROC curve下方的那部分面积的大小。通常AUC的值介于0.5到1.0之间较大的AUC代表了较好的performance。 2.ROC曲线 2.1ROC的动机 对于01两类分类问题一些分类器得到的结果往往不是01这样的标签如神经网络得到诸如0.50.8这样的分类结果。这时我们人为取一个阈值比如0.4那么小于0.4的归为0类大于等于0.4的归为1类可以得到一个分类结果。同样这个阈值我们可以取0.1或0.2等等。取不同的阈值最后得到的分类情况也就不同。如下面这幅图 蓝色表示原始为负类分类得到的统计图红色表示原始为正类得到的统计图。那么我们取一条直线直线左边分为负类直线右边分为正类这条直线也就是我们所取的阈值。阈值不同可以得到不同的结果但是由分类器决定的统计图始终是不变的。这时候就需要一个独立于阈值只与分类器有关的评价指标来衡量特定分类器的好坏。还有在类不平衡的情况下如正样本有90个负样本有10个直接把所有样本分类为正样本得到识别率为90%但这显然是没有意义的。如上就是ROC曲线的动机。 2.2ROC的定义 关于两类分类问题原始类为positive、negative分类后的类别为p、n。排列组合后得到4种结果如下图所示 于是我们得到四个指标分别为真阳、伪阳、伪阴、真阴。ROC空间将伪阳性率FPR定义为 X 轴真阳性率TPR定义为 Y 轴。这两个值由上面四个值计算得到公式如下 TPR在所有实际为阳性的样本中被正确地判断为阳性之比率。TPRTP/(TPFN) FPR在所有实际为阴性的样本中被错误地判断为阳性之比率。FPRFP/(FPTN) 放在具体领域来理解上述两个指标。如在医学诊断中判断有病的样本。那么尽量把有病的揪出来是主要任务也就是第一个指标TPR要越高越好。而把没病的样本误诊为有病的也就是第二个指标FPR要越低越好。不难发现这两个指标之间是相互制约的。如果某个医生对于有病的症状比较敏感稍微的小症状都判断为有病那么他的第一个指标应该会很高但是第二个指标也就相应地变高。最极端的情况下他把所有的样本都看做有病那么第一个指标达到1第二个指标也为1。 2.3ROC的图形化表示 我们以FPR为横轴TPR为纵轴得到如下ROC空间 我们可以看出左上角的点TPR1FPR0为完美分类也就是这个医生医术高明诊断全对点ATPRFPR医生A的判断大体是正确的。中线上的点BTPRFPR也就是医生B全都是蒙的蒙对一半蒙错一半下半平面的点CTPRFPR这个医生说你有病那么你很可能没有病医生C的话我们要反着听为真庸医。 上图中一个阈值得到一个点。现在我们需要一个独立于阈值的评价指标来衡量这个医生的医术如何也就是遍历所有的阈值得到ROC曲线。还是一开始的那幅图假设如下就是某个医生的诊断统计图直线代表阈值。我们遍历所有的阈值能够在ROC平面上得到如下的ROC曲线。   曲线距离左上角越近证明分类器效果越好。 如上是三条ROC曲线在0.23处取一条直线。那么在同样的FPR0.23的情况下红色分类器得到更高的TPR。也就表明ROC越往上分类器效果越好。我们用一个标量值AUC来量化他。 3.AUC值 3.1AUC值的定义 AUC值为ROC曲线所覆盖的区域面积显然AUC越大分类器分类效果越好。 AUC 1是完美分类器采用这个预测模型时不管设定什么阈值都能得出完美预测。绝大多数预测的场合不存在完美分类器。 0.5 AUC 1优于随机猜测。这个分类器模型妥善设定阈值的话能有预测价值。 AUC 0.5跟随机猜测一样例丢铜板模型没有预测价值。 AUC 0.5比随机猜测还差但只要总是反预测而行就优于随机猜测。 3.2AUC值的物理意义 假设分类器的输出是样本属于正类的socre置信度则AUC的物理意义为任取一对正、负样本正样本的score大于负样本的score的概率。 3.3AUC值的计算 1第一种方法AUC为ROC曲线下的面积那我们直接计算面积可得。面积为一个个小的梯形面积之和计算的精度与阈值的精度有关。 2第二种方法根据AUC的物理意义我们计算正样本score大于负样本的score的概率。取N*MN为正样本数M为负样本数个二元组比较score最后得到AUC。时间复杂度为O(N*M)。 3第三种方法与第二种方法相似直接计算正样本score大于负样本的score的概率。我们首先把所有样本按照score排序依次用rank表示他们如最大score的样本rankn(nNM)其次为n-1。那么对于正样本中rank最大的样本rank_max有M-1个其他正样本比他score小那么就有(rank_max-1)-(M-1)个负样本比他score小。其次为(rank_second-1)-(M-2)。最后我们得到正样本大于负样本的概率为 时间复杂度为O(NM)。
http://www.yutouwan.com/news/215602/

相关文章:

  • 西安做网站的云阔简约网站欣赏
  • 校级特色专业建设网站网站嵌入js
  • 做海报用什么网站工商公司注册核名查询
  • gta买办公室网站建设中谷歌翻译做多语言网站
  • 网站开发语言对比微网站 服务器
  • 下载手机app悟空建站seo服务
  • 怎么查询网站的外链作文网投稿
  • 昆明网站建设开发东莞网络推广
  • 做网站用小公司还是大公司好wordpress notfound
  • 鞍山人才网站商城网站的开发怎么做
  • 三好街 做网站建设一个网站需要什么人员
  • 网站前端后端分开做可以吗分类目录的作用
  • 网站开发 工资高吗如何弄自己的网站
  • 网站推广应注意哪些事项自己创建小程序
  • 各大网站名称wordpress更新的文章编辑器不好用
  • 梧州专业网站推广网站开发工资一般多少
  • 招商网站如何做推广小程序的推广方法
  • 购物网站开发和运行环境汕头有几个区
  • 东莞一站式网站推广运营wordpress添加媒体
  • 互动网站建设公司网站建设代码标签大全
  • 网站综合建设笔记网站开发报价文件
  • iis7 静态网站网页制作面试自我介绍
  • 长沙网站建设icp备推广引流渠道
  • wordpress king新乡seo公司
  • 如何把做的网站与域名连接不上瑞金网站建设光龙
  • 服务器做网站空间东莞人才网最新招聘信息
  • 网站推广优势做i网站
  • 网站建设优化教程手机优化怎么得100分
  • 网站分析 工具注册安全工程师需要什么条件
  • 接做效果图网站怎么生成域名做网站