投稿

8月, 2015の投稿を表示しています

夏休み

先週の水曜日からちょっと遅めの夏休み。 その前の安達太良登山も含めるとわりとしっかり夏休みました。 1日目:仙台うみの杜水族館 このなつにできたばかりの水族館。偵察がてらいってきましたが まわりをだだっぴろい空き地に囲まれて、ぽつんと建っていました。 ちょっとさびしい。 特筆すべき展示はというと、カキの養殖とかかな。 アシカとイルカのショーもけっこう盛り上がったな。 基本的に東北の人たちというのは、いいお客さんだと思う。 一生懸命盛り上がってくれようとしている、と感じる。 2日目:越後妻有・大地の芸術祭 今回で2回目の参加となる芸術祭。 とても好き。今回も大変たのしめた。 今回は松之山温泉に宿をとって、1泊2日の日程でしっかりとめぐることにしました。 津南町エリアを廻ったのですが、どれもよかったです。 廃校になった小学校とか廃屋になった古民家をつかったインスタレーション、たのしかった。 あと、松之山温泉がとてもよかった。 こじんまりとした温泉街ですが、人里はなれたところでゆっくりと湯につかり 200メートルくらいしかない温泉街をぶらぶらするのは ぼくの趣味によくあう。 「山愛」という定食屋でたべたカツ丼が壮絶にうまかった。 分厚いカツなんですが、肉に味がしっかりとして まるで良いステーキを食べてるみたいでした。 脂身は全然なく、赤身だけですが、筋張ったところなどなく 適度な肉の弾力が素敵でした。 ああ、思い出しただけで幸せになれる。 また行きたい。 3日目:引き続き大地の芸術祭 松之山エリアから十日町エリアに移動して芸術祭を楽しみました。 あと一泊ほしかったかなー。 長岡市内のホテルで一泊。 駅近くで立ち寄った居酒屋がめっちゃうまかった。 たしか、昨年遊びに行ったとき現地の友達につれてってもらったとこ。 うまい。太る。 4日目:ラファエル前派展@新潟市美術館+音楽と髭達@ハードオフスタジアム 午前中は長岡から移動して、新潟市美術館でラファエル前派展。 フレデリック・ワッツの「『希望』のためのスケッチ」にしばし釘付けになった。 ほしい。これはほしい。 失明した女性が、一本しか弦のないハープを懸命に奏でる姿を描いたもの。 希望とは何たるかをドラマチックに表した傑作だと思う。 ...

Week7: SVM

今日はサポートベクターマシン(SVM)。 率直に言ってなんだか狐につままれたような気分です。 あいかわらずDr. Ngの解説は健在なのですが、 「これでSVMを使えるようになった!」という実感を得られませんでした。 最後のクイズや宿題をやれば、使える気分になるのかなーと思いながら 説明を聞いていったのですが、最後までなんだか腑に落ちない感覚がぬぐえませんでした。 現時点におけるSVMに対する理解は以下のようなものです。 ・ロジスティック回帰の改良版(?) ・コスト関数にmarginを設けた ・SVMはmarginを最大にするようにDecision boundaryを決定するため、直感的に「もっともらしい」分類が可能(そのためにはパラメータCをうまく設定してやる必要がある) 自分で書いていても、他人に説明できる気がしません。 marginが導入されたあたりから、僕の理解がいまいち追いついていないような気がします。 時間があるときにもう一度見直してみようと思います。 そんな読者の不安を察してか、Dr. Ngは終盤で 「アルゴリズムよりもデータの量や実装面でのスキル(エラー分析やデバッグ、フィーチャーのデザイン)のほうが重要」なんて言い出します。 それをいうと元も子もないような気がしますが 金言であるような気もします。 データがないのに解析方法ばかり気にしててもしょうがないですもんね。 実験屋としてはいかにきれいなデータ(実験計画も含めて)とってくるかっていうのが肝です。 Dr. Ngは上述の金言を踏まえて ロジスティック、ニューラルネットワーク、SVMを機械学習(教師あり)の3大アルゴリズムとして 習得することをお勧めしていました。 このレクチャーのいいところはDr. Ngがどこが大切で、なにがそんなに大切でないかということを わりときっぱりといってくれるところです。 初学者にはたいへんありがたい。

ML-week6: PrecisionとRecall

先週一週間は学会のため、MLの勉強はほとんどできなかったんですが 今日から再開。 Week6の確認問題で2回も躓いてしまったので、 RecallとPrecisionについてまとめてみました。 Recall: コースでは再現率と訳されていた。 実際に陽性なデータ(真陽性と偽陰性を含む)のうち、モデルによって陽性だと判断されたデータ(真陽性)の割合。 二項分類問題ではTPR (True Positive Rate)あるいはSensitivity(感度)と呼ばれるらしい。 統計学では検出力(1-β)にあたるものですかね。 Precision: コースでは精度と訳されていたもの。 モデルによって陽性だと判断されたデータ(真陽性と偽陽性)に対する真陽性の割合。 二項分類問題ではPPV (Positive Predictive Value)と呼ばれるらしい。 week6では上記の二つの指標を用いて、ゆがみのあるデータを分類するモデル(たとえばかなり低頻度で現れる疾患の診断するときの学習モデル)を評価する方法を解説していました。 感度や特異度、FDRなんかはたまに耳(目)にする用語なので これを機会にスライドにまとめてみました。 Ng博士をまねて、パワーポイントのペン機能をつかって スライドにいろいろ書き込んだのですが SlideShareにアップ したらペンで書き込んだ部分が消えてました。 ざんねん。 ペン機能にはまだ慣れが必要ですが 使っていて楽しいです。 僕が使っているのはワコムの無線型タッチパッドです。 薄くて持ち運びも便利。 http://www.wacom.com/en-gb/products/navigation/bamboo-pad-wireless

Don't give up!

ちょっと体調崩れ気味です。 日曜日の夜に土湯温泉で湯に入ったあたりから からだがふわふわして、 昨日は暑いんだか寒いんだかよくわからんくなっていました。 んで、ML Week6の最後の問題をやりかけたまま 途中で放っておいたら、さきほどこんなメールが届きました。 Hi Masahiro Okamoto, We noticed that you didn’t pass Machine Learning System Design in Machine Learning yet! We wanted to remind you that there’s no penalty, so feel free to try again. Research shows testing will help you remember and apply the information more easily, so this exam is not only a way to gauge how well you’ve mastered the material - it will actually help you learn! 試験が難しくてへこたれてたわけではないんですが なんか元気がでました。 つくづくよくできたシステムです。 今日もがんばろう。

ニューラルネットワーク(Week5)とモデル診断(Week6)

金曜日から土曜日にかけてWeek5のニューラルネットワークにトライしました。 難しかったです。。。 複数のステップがあり、それぞれのステップがわりと込み入っていたので 全体像を把握するのに時間がかかりました。 ビデオを見返し、宿題をやってなんとかコードを理解することができた(気がします)。 僕自身の問題はこれらを使いこなすことにあるので そこまでいたるには、 手持ちのデータやらをつかって練習していかんといかんなと感じております。 んで、昨晩から今朝にかけてはWeek6のモデル診断(Machine Learning Diagnostic)をやっているのですが、 ちょっと感動してます。 機械学習で採用する(した)モデルの妥当性を検証する手順を説明してくれています。 あらためて、ほんとに、コードを使えるようになるための講義を用意してくれてるんだな、と感じました。 Ng博士やプロジェクト関係者の至れり尽くせりなサービス精神に感銘しております。 あー、たのしい。 そろそろ自分のデータでいろいろいじりたくなってきました。 たのしみ。 そういえばWeek6のビデオ「Model selection and training/validataion/test sets1」の日本語字幕がずれていました。スライド一枚分ほどずれてしまっていたので、字幕を見てるとむしろ混乱してしまいました。字幕OFFで何度か見返して対応しました。あと、日本語字幕のテキストをダウンロードできるので、それも参考にしたんですが、最後のほうはなぜか訳されてなかったです。 そんなに難しいことをいってないのでとりあえずなんとかなりました(たぶん)。

TANOSHII

Couseraで受講しているAndrew Ng氏のMachine Learning courseが楽しい。 わかりやすい(わかった気にさせてくれる)し、 課題の難易度もいい感で適度な達成感を味あわせてくれるので かなり気に入っています。 あと、Ng氏がたまにビデオで"Congratulation!!"とかいってほめてくれます。 ほめられるのが大好きな僕は、にやにやしながら動画を見ています。 Machine Learningの学習にとてもよいと思うのですが、 英語の勉強にもなるなーと感じてます。 とくに専門的な内容を英語で伝えるープレゼンするーときのリズムやイントネーションが 身についているような。。。 コースが終わったら 公開されている動画をiPodに入れて、通勤中の車内でシャドウイングしてみようと思う。 神経科学のコースを受講すると、実践的なプレゼン力が身につきそうなので 時間をみつけてやってみます。

2015年8月7日

これからの研究のために機械学習を勉強しようと思ったです。 機械学習学習、あるいはメタ機械学習。 以下の書籍(またはオンライン講座)で機械学習について学んで行く予定です。 実践を意識して、できるだけ自分の手でコードを書いて身につけられる教材を選んだつもりです。 プログラミングのための線形代数 Machine Learning by Andrew NG@Stanford フリーソフトで作る音声認識システム フリーソフトではじめる機械学習入門 はじめてのパターン認識 プログラミングのための確立統計 データ解析のための統計モデリング入門 2は Coursera というオンライン講座(MOOC)で開講されています。 スタンフォードのAndrew Ngが教えてくれるそうです。たのしみ。 上記の教材をこなしたら、ビショップ本も読めるようになるのかしらん。 とりあえず、次の実験の解析法を具体的に考えられるくらいになるのが 当面の到達目標。 あと、以下の本も時間があるときに読んでおきたい。 深層学習(岡谷貴之) パターン・記号統合 基礎と応用―ペットロボットのペットらしさを求めて( 不確実情報利用技術調査専門委員会, 電気学会不完全) 余裕があれば、随時、教材の感想を書いていく予定です。