搜索

分享

QQ空间 QQ好友新浪微博微信

ML基础－理解ROC和AUC

520jefferson 2015-11-11

展开全文

前言

作为一个MLer，你一定听过同事或朋友提到过ROC和AUC，作为一个重要的分类器的评价指标，这篇文章带大家简要了解一下。

背景

在分类问题中，最常用的评价指标就是precision、recall和f-score，还有就是accuracy，注意precision和accuracy是不一样的。但是当样本分布不平衡的时候，precision和recall看起来就不是很合理了。比如说正样本占90％，那么分类器完全预测所有样本为正，precision都有90％了，但是并不一定比另precision为80％的分类器好，因为它有可能能分对5％的负样本。

那么这个时候ROC和AUC就派上用场了，对于一个特定的分类器，ROC和AUC并不随着样本集的变化而变化，其是稳定的。

ROC

Receiver Operating Characteristic，其横坐标表示False Positive Rate，纵坐标表示True Positive Rate，关于FPR喝TPR，分享下面一张图片给大家。
这里写图片描述

通常来说我们只有一个样本集合，那么怎么得到不同组的FPR和TPR内，我们可以枚举正样本判定的阈值，这样一个阈值对应一组FPR合TPR，如果阈值取得足够多，那么显然就能绘制一条ROC曲线了。

AUC

顾名思义，Area Under Curve，就是指ROC曲线下方的面积。这个面积通常是大于等于0.5，小于等于1.0的。AUC的值越大越好。

有一种理解是说AUC表示的是，当来一个正样本和一个负样本，正样本被预测的值大于负样本预测的值的概率。这里我们默认值越大越倾向于为正例

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： 520jefferson > 《ML/NLP》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

520jefferson

关注对话

TA的最新馆藏

一些通用的Makefile文件模板
领域/场景大模型也太难训了吧
PEFT | Transformer参数量、计算量、显存占用分析
Broadcast,Scatter,Gather,Reduce,All
浅析 | 大语言模型细节、训练及微调
[转] LLMs之InternLM：InternLM/InternLM-7B模型的简介、安装、使用方法之详细攻略

喜欢该文的人也喜欢更多

热门阅读换一换