HOMEビジネス ベイズの識別規則は、これを見て学べ!- 第3回「はじめてのパターン認識」読書会まとめ【CodeIQ提供】 #はじパタ

ベイズの識別規則は、これを見て学べ!- 第3回「はじめてのパターン認識」読書会まとめ【CodeIQ提供】 #はじパタ

U-NOTE編集部

2013/07/31(最終更新日:2013/07/31)


このエントリーをはてなブックマークに追加

[{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30851","time":"2013-07-24 09:45:50","post":" 2013年7月16日(火)にグラントウキョウサウスタワーにて、u003Ca href="https://twitter.com/Prunus1350" target="_blank"u003Eu003Cuu003Eu003Cbu003E@Prunus1350u003C/bu003Eu003C/uu003Eu003C/au003Eさん主催のu003Ca href="http://atnd.org/events/41119" target="_blank"u003Eu003Cuu003Eu003Cbu003E第3回「はじめてのパターン認識」読書会u003C/bu003Eu003C/uu003Eu003C/au003Eが開催されました。 ","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31478","time":"2013-07-26 13:43:06","post":" 当日は、書籍「u003Ca href="http://www.amazon.co.jp/dp/4627849710" target="_blank"u003Eu003Cuu003Eu003Cbu003Eはじめてのパターン認識u003C/bu003Eu003C/uu003Eu003C/au003E」の第3章「ベイズの識別規則」を読み進めていき、最後にはライトニングトークで締めくくられました。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30852","time":"2013-07-24 09:45:52","post":" こちらでは第3回 「はじめてのパターン認識」 読書会にお邪魔し、約2時間に渡るアツい内容をまとめてお届けします。 u003Cbru003Enu003Cuu003Eu003Cbu003Eu003Ca href="https://codeiq.jp/"u003Eまた今回の勉強会のまとめ記事は、株式会社リクルートキャリアが運営する、ITエンジニアのための実務スキル評価サービス「CodeIQ」nの提供で運営されています。ぜひ、一度アクセスしてみて下さい!u003C/au003Eu003C/bu003Eu003C/uu003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003Cdiv class="ResultImage"u003Eu003Cimg src="https://imgs.u-note.me/note/uploadimage/47485572.png"/u003Eu003C/divu003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30854","time":"2013-07-24 09:51:09","post":"(当日の会場の様子)","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30855","time":"2013-07-24 09:51:39","post":"u003Ch4u003E第3章「ベイズの識別規則」前半u003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31474","time":"2013-07-26 13:40:52","post":"nまず、始めにu003Ca href="https://twitter.com/_kobacky" style="text-decoration: underline; font-weight: bold;" target="_blank"u003E@_kobackyu003C/au003Eさんによる、第3章「ベイズの識別規則」前半のセッションが行われました。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30856","time":"2013-07-24 10:00:56","post":"u003Cbu003E<ベイズの定理>u003C/bu003Eu003Cbru003Enu003Cbru003Ex:観測データnCi:nn識別クラスnu003Cbru003Eベイズの識別規則は、ベイズの定理で定義される最大事後確率が最も大きなクラスに観測データを分類するnn。ベイズの定理は「事前確率」「事後確率」「クラス条件つき確率(尤度)」「周辺確率」の4つからなる。u003Cbr/u003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30864","time":"2013-07-24 10:07:54","post":"u003Cbu003E<事後確率>u003C/bu003Eu003Cbru003E観測データxが与えられた下で、それがクラスCiに属する条件付き確率u003Cbru003Eu003Cbru003Eu003Cbu003E<事前確率>u003C/bu003Eu003Cbru003ECiの生起確率で、データを観測する前から分かっている確率nnnnnu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30865","time":"2013-07-24 10:08:34","post":"u003Cbu003E<尤度>u003C/bu003Eu003Cbru003EクラスCiが与えられた下での観測データxの確率分布nu003Cbr/u003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30870","time":"2013-07-24 10:10:57","post":"u003Cbu003E<周辺確率>u003C/bu003Eu003Cbru003E観測データxの生起確率。全てのクラスに対する観測データxの同時確率を合計(周辺化)することで得られる。nnu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30874","time":"2013-07-24 10:13:41","post":"u003Cbu003E<最大事後確率基準による識別>u003C/bu003Eu003Cbru003Eu003Cbru003E識別においては、観測データxに対して事後確率が一番大きなクラスを採用する。事前確率p(x)はクラスが異なっても一定であるため、識別においては無視できる。nnu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30876","time":"2013-07-24 10:15:34","post":"u003Ch4u003Eベイズ識別規則の例u003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30878","time":"2013-07-24 10:16:54","post":"u003Cbu003E<状況設定>nu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30882","time":"2013-07-24 10:20:18","post":" 上記の観測データから「健康な人(G=1)」「健康でない人(G=0)」を識別したい。u003Cbru003E・「喫煙している(S=1)」or「喫煙してない(S=0)」u003Cbru003E・「飲酒している(T=1)」or「飲酒していない(T=0)」u003Cbru003Eある街の住人からランダムに(識別モデル作成用に)1000人サンプリング。nnnu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30884","time":"2013-07-24 10:22:16","post":"u003Cbu003E<演算の目標>u003C/bu003Eu003Cbru003E 最終的に求めたいものはS、T、G全ての組み合わせ(8通り)における事後確率。右辺の確率を順番に演算していく。nu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30887","time":"2013-07-24 10:25:47","post":"u003Cbu003E<事前確率の演算>u003C/bu003Eu003Cbru003EP(G=1)=800/1000=4/5u003Cbru003EP(G=0)=200/1000=1/5nnu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30888","time":"2013-07-24 10:26:26","post":"u003Cbu003E<尤度の演算>u003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30890","time":"2013-07-24 10:28:14","post":"条件付き独立 P(S,T|G)= P(S|G)P(T|G)を仮定する。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30891","time":"2013-07-24 10:29:09","post":"u003Cbu003E<周辺確率の演算>nnu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30895","time":"2013-07-24 10:33:05","post":" 周辺化によりP(S,T)を演算。u003Cbru003E①→②:P(S,T,G)= P(S,T|G)X P(G)u003Cbru003E②→③:P(S,T)= P(S,T,G=0)+ P(S,T,G=1)(←周辺化)nnu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30896","time":"2013-07-24 10:33:36","post":"u003Cbu003E<事後確率の演算>nu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30899","time":"2013-07-24 10:34:41","post":" ベイズの定理より事後確率を演算し、観測データS,Tに対して事後確率の大きい方のクラスとして判定される。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30900","time":"2013-07-24 10:35:53","post":"u003Cbu003E<尤度>u003C/bu003Eu003Cbru003E ある観測データxが2つのクラスのどちらであるかを識別する際、n尤度の比と事前確率の比を比べれば識別ができるというだけのお話。u003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30902","time":"2013-07-24 10:38:56","post":"u003Ch4u003Eベイズの識別規則は誤り率最小u003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30904","time":"2013-07-24 10:41:45","post":"u003Cbu003E<条件付きベイズ誤り率>u003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30903","time":"2013-07-24 10:41:40","post":"u003Cspan style="font-size: 14px;"u003Eある観測データxが与えられた時、ベイズの識別規則に従って識別を行った場合に誤識別する確率。 u003C/spanu003Eu003Cbr/u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30906","time":"2013-07-24 10:42:50","post":"u003Cbu003E<ベイズ誤り率>u003C/bu003Eu003Cbru003E条件付きベイズ誤り率の(xに関する)期待値。nu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30914","time":"2013-07-24 10:47:10","post":"u003Ch4u003E最小損失基準に基づくベイズの識別規則u003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30915","time":"2013-07-24 10:57:37","post":"u003Cbu003E<損失の考え方>u003C/bu003Eu003Cbru003E 「病気の人を健康であると誤識別するリスク」は「健康な人を病気であると誤識別するリスク」よりも高い。危険性を考慮した識別が必要。u003Cbru003E・損失:Liju003Cbru003E 真のクラスがCjであるサンプルをCiと判断することによって被る損失。一般にi=jの時の損失は小さい。u003Cbru003E識別対象のクラスがK個ある場合、K×Kの損失行列が定義できる。nu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30918","time":"2013-07-24 10:59:05","post":"u003Cbu003E<最小損失基準に基づく識別>u003C/bu003Eu003Cbru003E観測データxをクラスCiと判断した時に被る損失を定義。nu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30920","time":"2013-07-24 10:59:52","post":"観測データxに対して損失が最も小さいクラスに識別する。","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30923","time":"2013-07-24 11:01:47","post":"u003Cbu003E<最小損失基準に基づく識別の例(2クラス)>u003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30927","time":"2013-07-24 11:05:09","post":" 事後確率は下記の通りにする。u003Cbru003EnP(C1|x)= 0.6nu003Cbru003EnnnP(C2|x)= 0.4nu003Cbru003En最大事後確率基準では観測データxはC1と判定される。下記の損失行列を定義する。nu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30929","time":"2013-07-24 11:05:41","post":"u003Cbu003E<損失>nu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30932","time":"2013-07-24 11:07:47","post":"C2をC1と識別した時の損失が大きいので、最小損失基準に基づく識別ではC2と判定","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30933","time":"2013-07-24 11:08:23","post":"u003Cbu003E<損失の定義による識別境界の移動>nnu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30936","time":"2013-07-24 11:10:19","post":"健康(C1)と病気(C2)に対して、「健康な人を病気と判断する時の損失が大きい」損失行列を定義。識別境界が左方に移動し、健康と判断されにくくなる。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30937","time":"2013-07-24 11:10:38","post":"u003Ch4u003Eリジェクトu003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30941","time":"2013-07-24 11:16:32","post":"u003Cbu003E<リジェクトの概念>u003C/bu003Eu003Cbru003E・誤り率の大きな領域で判断を避ける(リジェクトする)u003Cbru003Eε(x)>=tとなるxの領域u003Cbru003Et:しきい値u003Cbru003E・リジェクトを含めた識別規則u003Cbru003En最大事後確率が1-tより大きい場合識別を行うnnn。t全てのクラスの事後確率が1-t以下の場合リジェクト。u003Cbru003Enu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30943","time":"2013-07-24 11:17:45","post":"u003Cbu003E<例:t=0.3、K=3の場合の事後確率と識別結果>u003C/bu003Eu003Cbr/u003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30946","time":"2013-07-24 11:21:33","post":"u003Cbu003E<リジェクト率と(誤)認識率の関係>u003C/bu003Eu003Cbru003E・認識率u003Cbru003E「正答数」/(「全テストデータ数」nnー「リジェクトされたデータ数」)u003Cbru003E・誤認識率u003Cbru003E「誤り数」/(「全テストデータ数」ー「リジェクトされたデータ数」)nnu003Cbru003E・しきい値との関係nu003Cbru003Enしきい値を下げるとリジェクト率が上がる。しきい値を上げると認識率は上がり誤認識率は下がるnnu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31472","time":"2013-07-26 13:37:31","post":"第3章「ベイズの識別規則」前半の資料は、u003Cuu003Eu003Ca href="http://www.slideshare.net/kojiono507/20130716-24442753"u003Eu003Cbu003Eこちらu003C/bu003Eu003C/au003Eu003C/uu003Eです。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"30950","time":"2013-07-24 11:31:03","post":"u003Ch4u003E第3章「ベイズの識別規則」後半u003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31476","time":"2013-07-26 13:41:50","post":"続いて、u003Ca href="https://twitter.com/millionsmile" target="_blank"u003Eu003Cbu003Eu003Cuu003E@millionsmileu003C/uu003Eu003C/bu003Eu003C/au003Eさんによる、第3章「ベイズの識別規則」後半のセッションが行われました。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31093","time":"2013-07-24 19:39:21","post":"u003Cbu003E<受信者動作特性曲線>u003C/bu003Eu003Cbru003Eu003Cbru003E 受信者動作特性曲線は、もともとレーダー技術で雑音の中から敵機の存在を検出するための方法として開発された。そのため「受信者動作特性」というレーダーっぽい感じの名前がついているようだが、この計算方法は、分類アルゴリズムの性能評価法として医療分野でよく使われている。u003Cbr/u003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultBox"u003Eu003Cdiv class="title"u003Eu003Ca href="http://ja.wikipedia.org/wiki/%25E5%258F%2597%25E4%25BF%25A1%25E8%2580%2585%25E6%2593%258D%25E4%25BD%259C%25E7%2589%25B9%25E6%2580%25A7" target="_blank"u003Eu003Cbu003E受信者u003C/bu003E操作u003Cbu003E特性u003C/bu003E - Wikipediau003C/au003Eu003C/divu003Eu003Cdiv class="content"u003Eu003Cbu003E受信者u003C/bu003E操作u003Cbu003E特性u003C/bu003E(じゅしんしゃそうさとくせい、英 Receiver Operating Characteristic, ROC)は、信号処理の概念で、観測された信号 u003Cbu003E...u003C/bu003E し、カットオフポイントを媒介変数 として大から小へと変化させると、下の図のようなu003Cbu003E曲線u003C/bu003Eが描かれる(ROCu003Cbu003E曲線u003C/bu003Eと呼ばれる )。u003C/divu003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31094","time":"2013-07-24 19:43:45","post":"u003Cbu003E<ROC曲線の言葉の定義>u003C/bu003Eu003Cbru003Eu003Cbru003E 2クラスの問題の場合、対象xが一つのクラスに属しているかどうかという問題になる。u003Cbru003E属していると判断→p(陽性:postive )u003Cbru003En属していないと判断→n(陰性:negative)u003Cbru003Eu003Cbru003E正しく分類されている→真(True)u003Cbru003E間違って分類されている→偽(False)nnnnnnu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31096","time":"2013-07-24 19:44:58","post":"u003Ch4u003EROC曲線の求め方u003C/h4u003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31097","time":"2013-07-24 19:52:14","post":"偽陽性→偽のものを真と判断した割合u003Cbru003Enu003Cbru003E真陽性n→真のものを真と正しく識別した割合u003Cbru003Enu003Cbru003E正確度→真と偽を正しく識別した割合u003Cbr/u003Eu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31098","time":"2013-07-24 19:52:33","post":" 適合率→検索された文書中の適合文書の割合。u003Cbru003En例:検索エンジンで100件表示されたとき、100件のうち検索者が必要とするページ数の割合nu003Cbru003Eu003Cbru003E 再現率→適合している全文書から、どれだけ検索できているか(網羅生)nu003Cbru003En例:検索エンジンで100件表示されたとき、検索者が必要とする全ページのうち何件が100件に含まれているかという割合。ただし、検索者が必要とする全ページ数は分からないので、真陽性率を使って推定を行う。真陽性率だと正しいものの数が正確に分かっているため。nnnnu003C/bru003Eu003C/bru003Eu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31099","time":"2013-07-24 19:53:53","post":"u003Cbu003E<例題>u003C/bu003Eu003Cbru003Eu003Cbru003E適合率と再現率は、なぜトレードオフの関係になるのかを検索エンジンを例に答えよ。nnu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31100","time":"2013-07-24 19:57:20","post":"u003Cbu003E<解答>u003C/bu003Eu003Cbru003Eu003Cbru003E 検索エンジンで100件検索されて80件正しかった状況でnn、さらに適合率を上げるために誤りを減らそうとすると、必要なページまで検索対象から外すことになるので、80件検索されて75件正しいというようなことになり、結果として再現率が下がる。u003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31101","time":"2013-07-24 19:58:29","post":"ROC曲線は、偽陽性率と真陽性率の関係をグラフにしたもの。","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31103","time":"2013-07-24 20:01:54","post":" 良いところは、偽陽性率や真陽性率のの計算はそれぞれの偽と真のクラス内で計算するため、クラスのデータ数に大きな差があってもROC曲線には影響を受けない。活用例として、医療では病気のクラスは健康なクラスに比べてデータ数が極端に少ないが、それでも安定した性能評価が期待できる。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31104","time":"2013-07-24 20:02:59","post":"u003Cbu003E<陽性と陰性のクラス分布>nnu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31106","time":"2013-07-24 20:04:27","post":"p(x|p*)が陽性のクラス尤度。u003Cbru003Ep(x|n*)が陰性のクラス尤度n。u003Cbru003En識別境界がBのとき、R1の領域が陽性、R2が陰性。陽性クラスのうち、ε1が陰性と判断(偽陽性)、ε2が陽性と判断(偽陽性)と判断されたもの。nu003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31107","time":"2013-07-24 20:08:41","post":"ε1を第1種の誤り(miss)、ε2が第2種の誤り。陽性クラスのうち、陽性と判断される場合は1-ε1となる。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31108","time":"2013-07-24 20:09:08","post":"u003Ch4u003EROC曲線による性能評価u003C/h4u003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31110","time":"2013-07-24 20:12:33","post":" ROC曲線は、クラス間の重なりが少ないほど左上にシフトする。ROC曲線の下側の面積をROC曲線下面積(AUC;area under ROC curve)といい、識別器の性能をあらわす評価尺度として使われる。AUCは1.0〜0.5の間を取り、1.0に近いほど性能が良いと判断できる。1.0(左上の位置)だと、完全な識別器であり、0.5(右上から左下への線)だとランダムな識別器となる。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31160","time":"2013-07-25 10:37:13","post":" ROC曲線が便利なのは、クラスの分布が分からない場合でも構成できる点。ROC曲線はしきい値より大きいと陽性(p)、小さいと陰性(n)と判断する。しきい値をいくつか設定していくことでROC曲線が描かれる。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31225","time":"2013-07-25 14:23:16","post":"u003Cbu003E<AUCはマーケティングにも使える>u003C/bu003Eu003Cbru003Eu003Cbru003E 例えば、あるECサイトで高額購入者が何の要素で分類できるか知りたいとする。2クラスにするため、高額購入者グループを1、通常購入者グループを0とし、2項ロジスティック回帰分析にかけてみる。2項ロジスティックだと、オッズ比が求められやすいので、これによってどちらのグループに属しやすいのかがn分かる。例えば、オッズ比が1.5だと1のグループに1.5倍の確率で属しやすくなるといったようなこと。u003C/bru003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31226","time":"2013-07-25 14:23:55","post":" ただ、属しやすさが分かったものの、精度がどのくらいかがいまいち分からない。そこでAUCをn使ってみると、より注目して調査する説明変数を絞り込むことができる。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31227","time":"2013-07-25 14:26:16","post":"u003Cbu003E<Rではこう書く>nu003C/bu003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31229","time":"2013-07-25 14:28:06","post":" 2項ロジスティック回帰の求め方。AUCは、caTools、ROCR、Epiなどたくさんあるのだが、ライブラリーによって計算ロジックが異なる。状況に合わせて使った方が良さそう。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31470","time":"2013-07-26 13:37:08","post":"第3章「ベイズの識別規則」後半の資料は、u003Ca href="http://www.slideshare.net/hirokoonari/20130716" target="_blank"u003Eu003Cuu003Eu003Cbu003Eこちらu003C/bu003Eu003C/uu003Eu003C/au003Eです。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31230","time":"2013-07-25 14:28:36","post":"u003Ch4u003ELT(ライトニングトーク)u003C/h4u003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31231","time":"2013-07-25 14:32:12","post":" そして最後に4人から1人10分のLT(ライトニングトーク)が行われた。u003Cbru003Eそこでは、「ジャックナイフ法n」についてや「Rで学ぶデータサイエンス」、また「scikit-learn」のサービスについての説明が行われるなど、参加者は様々な知識を得ることが出来たであろう。u003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31233","time":"2013-07-25 14:35:07","post":"scikit-learnで始める機械学習の講演資料は、u003Ca href="nhttp://www.slideshare.net/moa108/20130715-lt-scikitlearn" target="_blank"u003Eu003Cbu003Eu003Cuu003Eこちらu003C/uu003Eu003C/bu003Eu003C/au003Eです。u003Cbru003Eジャックナイフ法を補足説明してみるの講演資料は、u003Ca href="http://www.slideshare.net/yamakatu/ss-24300114" target="_blank"u003Eu003Cbu003Eu003Cuu003Eこちらu003C/uu003Eu003C/bu003Eu003C/au003Eです。u003Cbr/u003Eu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31469","time":"2013-07-26 13:36:22","post":"グラフデータベース「Neo4j」の導入の導入の講演資料は、u003Ca href="http://www.slideshare.net/who_you_me/neo4j-24294061" target="_blank"u003Eu003Cuu003Eu003Cbu003Eこちらu003C/bu003Eu003C/uu003Eu003C/au003Eです。 nnu003Cbru003Enパターン認識 (Rで学ぶデータサイエンス 5)第3章の講演資料は、u003Ca href="http://www.slideshare.net/tadayukionishi/lt3-24324898" target="_blank"u003Eu003Cuu003Eu003Cbu003Eこちらu003C/bu003Eu003C/uu003Eu003C/au003Eです。nu003C/bru003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31235","time":"2013-07-25 14:37:15","post":"u003Ch4u003E問題を解くだけで、あなたのエンジニアスキルが分かるu003C/h4u003E","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31238","time":"2013-07-25 14:38:57","post":"「u003Ca href="https://codeiq.jp/" target="_blank"u003Eu003Cuu003Eu003Cbu003ECodeIQ(コードアイキュー)u003C/bu003Eu003C/uu003Eu003C/au003E」は、第一線で活躍するITエンジニアが出題した問題に一般ユーザーが無料で“挑戦”し、そのアンサーに対して出題エンジニアから評価フィードバックをもらえるサービスです。  ","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31239","time":"2013-07-25 14:39:02","post":"これまでに「u003Cbu003E1.4万人u003C/bu003E」以上が問題に挑戦済み。","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31240","time":"2013-07-25 14:39:04","post":"社会一般から見たITスキルではなく、その出題エンジニアに自分のスキルがどのように評価されるのかを知ることができます。","order":"0","renote":"0","row":"0"},{"post":"u003Cdiv class="ResultImageBox"u003Eu003C/divu003E","type":"memo"},{"post":"u003Cdiv class="ResultBox"u003Eu003Cdiv class="title"u003Eu003Ca href="https://codeiq.jp/" target="_blank"u003Eu003Cbu003ECodeIQu003C/bu003E|ITエンジニアのための実務スキル評価サービスu003C/au003Eu003C/divu003Eu003Cdiv class="content"u003E自分のITエンジニアとしての能力や市場価値の可視化って難しい。u003Cbu003ECodeIQu003C/bu003Eで、企業の 第一線で活躍するエンジニアによる実践的な問題に挑戦!その企業におけるリアルな 評価がフィードバックされます。自分のスキルの価値が気になる方は、トライしてみて u003Cbu003E...u003C/bu003Eu003C/divu003Eu003C/divu003E","type":"memo"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31241","time":"2013-07-25 14:39:27","post":"u003Ch4u003ECodeIQ運営事務局よりu003C/h4u003E","order":"0","renote":"0","row":"0"},{"user_id":"1404002924","event_id":"1451","enabled":"1","id":"31242","time":"2013-07-25 14:39:47","post":"サイト上で出題希望者受付も行っています。 また、IT勉強会のスポンサー受付も行っています。nIT勉強会の主催者の方は、 u003Cuu003Eu003Cbu003Eu003Ca href="https://codeiq.jp/inquiry.php"u003Eお問い合わせページu003C/au003Eu003C/bu003Eu003C/uu003Eからご連絡ください。nu003Cbru003En※ご希望に添えない場合もございます。あらかじめご了承ください。u003C/bru003E","order":"0","renote":"0","row":"0"}]

hatenaはてブ


この記事の関連キーワード