ML-week6: PrecisionとRecall
先週一週間は学会のため、MLの勉強はほとんどできなかったんですが
今日から再開。
Week6の確認問題で2回も躓いてしまったので、
RecallとPrecisionについてまとめてみました。
Recall:
コースでは再現率と訳されていた。
実際に陽性なデータ(真陽性と偽陰性を含む)のうち、モデルによって陽性だと判断されたデータ(真陽性)の割合。
二項分類問題ではTPR (True Positive Rate)あるいはSensitivity(感度)と呼ばれるらしい。
統計学では検出力(1-β)にあたるものですかね。
Precision:
コースでは精度と訳されていたもの。
モデルによって陽性だと判断されたデータ(真陽性と偽陽性)に対する真陽性の割合。
二項分類問題ではPPV (Positive Predictive Value)と呼ばれるらしい。
week6では上記の二つの指標を用いて、ゆがみのあるデータを分類するモデル(たとえばかなり低頻度で現れる疾患の診断するときの学習モデル)を評価する方法を解説していました。
感度や特異度、FDRなんかはたまに耳(目)にする用語なので
これを機会にスライドにまとめてみました。
Ng博士をまねて、パワーポイントのペン機能をつかって
スライドにいろいろ書き込んだのですが
SlideShareにアップしたらペンで書き込んだ部分が消えてました。
ざんねん。
ペン機能にはまだ慣れが必要ですが
使っていて楽しいです。
僕が使っているのはワコムの無線型タッチパッドです。
薄くて持ち運びも便利。
http://www.wacom.com/en-gb/products/navigation/bamboo-pad-wireless
今日から再開。
Week6の確認問題で2回も躓いてしまったので、
RecallとPrecisionについてまとめてみました。
Recall:
コースでは再現率と訳されていた。
実際に陽性なデータ(真陽性と偽陰性を含む)のうち、モデルによって陽性だと判断されたデータ(真陽性)の割合。
二項分類問題ではTPR (True Positive Rate)あるいはSensitivity(感度)と呼ばれるらしい。
統計学では検出力(1-β)にあたるものですかね。
Precision:
コースでは精度と訳されていたもの。
モデルによって陽性だと判断されたデータ(真陽性と偽陽性)に対する真陽性の割合。
二項分類問題ではPPV (Positive Predictive Value)と呼ばれるらしい。
week6では上記の二つの指標を用いて、ゆがみのあるデータを分類するモデル(たとえばかなり低頻度で現れる疾患の診断するときの学習モデル)を評価する方法を解説していました。
感度や特異度、FDRなんかはたまに耳(目)にする用語なので
これを機会にスライドにまとめてみました。
Ng博士をまねて、パワーポイントのペン機能をつかって
スライドにいろいろ書き込んだのですが
SlideShareにアップしたらペンで書き込んだ部分が消えてました。
ざんねん。
ペン機能にはまだ慣れが必要ですが
使っていて楽しいです。
僕が使っているのはワコムの無線型タッチパッドです。
薄くて持ち運びも便利。
http://www.wacom.com/en-gb/products/navigation/bamboo-pad-wireless
コメント
コメントを投稿