ML-week6: PrecisionとRecall

先週一週間は学会のため、MLの勉強はほとんどできなかったんですが
今日から再開。

Week6の確認問題で2回も躓いてしまったので、
RecallとPrecisionについてまとめてみました。

Recall:
コースでは再現率と訳されていた。
実際に陽性なデータ(真陽性と偽陰性を含む)のうち、モデルによって陽性だと判断されたデータ(真陽性)の割合。
二項分類問題ではTPR (True Positive Rate)あるいはSensitivity(感度)と呼ばれるらしい。
統計学では検出力(1-β)にあたるものですかね。

Precision:
コースでは精度と訳されていたもの。
モデルによって陽性だと判断されたデータ(真陽性と偽陽性)に対する真陽性の割合。
二項分類問題ではPPV (Positive Predictive Value)と呼ばれるらしい。

week6では上記の二つの指標を用いて、ゆがみのあるデータを分類するモデル(たとえばかなり低頻度で現れる疾患の診断するときの学習モデル)を評価する方法を解説していました。


感度や特異度、FDRなんかはたまに耳(目)にする用語なので
これを機会にスライドにまとめてみました。

Ng博士をまねて、パワーポイントのペン機能をつかって
スライドにいろいろ書き込んだのですが
SlideShareにアップしたらペンで書き込んだ部分が消えてました。
ざんねん。

ペン機能にはまだ慣れが必要ですが
使っていて楽しいです。

僕が使っているのはワコムの無線型タッチパッドです。
薄くて持ち運びも便利。
http://www.wacom.com/en-gb/products/navigation/bamboo-pad-wireless

コメント

このブログの人気の投稿

TightVNCでリモートデスクトップ

firefoxからmidoriちゃんにのりかえ

2016.09.30 Psychopy 日本語改行できない問題