50代ITエンジニアの積み上げ日記

50代からの学び直しブログ

DS黒本の第2章をやりました。

今日の積み上げ

  • AI学習
    • DS検定問題集
      • 第2章(データサイエンス力-機械学習):22/36(正解率61%)

 

AI学習

今日は昨日の反省を活かして、通勤中にUdemyの統計検定2級講座の動画を見ながら、決定係数条件付き確率のところを復習しました。

やっぱり、こちらの方がわかった感が得られてよかったです。

Udemy講座は動画をダウンロードしておけば、ストレスフリーでいつでも見ることができるのがすごくいいですよね。

この調子で、統計学で詰まることがあったら、まずはUdemyをふりかえる、これを徹底してみようと思います。

 

そして、今日はDS黒本の第2章をやりきりました。

機械学習ということでちょっと身構える気持ちもありましたが、特に複雑な計算問題のようなものはなく、専門用語を知ってるか否かで正解率が変わるような問題が大半でした。

 

気になったところを書き残しておきます。

  • 混同行列について
    • 適合率Precision):TP/TP+FP
    • 再現率(Recall):TP/TP+FN
  • リフト値について
    • 商品同士の購買の関係性を見ることができる
    • このとき、条件付き確率を用いる
    • ある商品Aから見た商品Bのリフト値が大きいほど、Aを買った人はついでにBも買う傾向にある、と言える
  • アンサンブル学習の代表的な手法ついて
    • バギング
      • 各モデルを並列的に学習させる手法
      • 代表例)ランダムフォレスト
    • ブースティング
      • 各モデルを直列的に学習させる手法
      • バギングより高い精度が見込めるが、学習時間が長くなる
      • 代表例)XGBoost、LightGBM

 

明日は今日やった範囲を復習しつつ、次の第3章に進めたいと思います。

それでは、また。