50代アプリエンジニアのAWS学習日記

50代からの学び直しブログ

金融データ活用チャレンジのチュートリアルがすごかった!

今日の積み上げ

 

機械学習

signate.jp

このコンペ、どんなものか気になっていましたが、今日初めてデータ定義書を見てみたり、チュートリアルを覗いてみたりしました。

特に、チュートリアルはかなり丁寧に作り込まれていて、機械学習初学者が取り組みやすいよう工夫されていて、驚きました。

databricks環境でPythonでコーディングしていくわけですが、GUIイメージで簡単にグラフを表示できたり、AutoMLを活用して自動で機械学習を適用することもできるようです。

今回のチュートリアルを見て、データ分析の魅力にハマってしまいました。

これはぜひ身に付けたい!

 

コンペ参加者が書かれたこちらの記事を読むと、どんな感じでやっているのかイメージがつかめると思いますので、参考までに書き残しておきます。

qiita.com

 

それでは、また。

線形回帰入門講座を受講中。

今日の積み上げ

 

機械学習

www.codexa.net

この講座、わかりやすい。しかも無料というのが、本当にありがたい!

機械学習初学者にとって、最初に知っておくべき概念が適度な粒度で解説されているので、いきなり線形代数の理論とかから入っていくより全然わかりやすい。

機械学習って、学習コストが結構高いって言われているけど、学ぶ順序って本当に大事だなと思った。

 

英語学習

今日2日目はリピーティングとオーバーラッピングでひたすら音読。

徹底して口が回るようになる練習をやってみたが、結構手ごわい。

滑らかに、詰まらずに音読できるようになるのは、早くて明日あたりか。

聴こえた音を再現する以前に、目で見た文章を詰まらずに読むことすら覚束ないのが現時点。

1日目、2日目は本当にパワーというか、忍耐強さが必要だとつくづく思った。

 

あと余談ですが、いま話題のChatGPTを英語学習にどうやって活用できるか、についてタニケイさんが自身のYouTubeチャンネルで紹介されているので、備忘的に書き残しておきます。

www.youtube.com

 

時代の波に乗って、こういった学びを効率化するツールを使いこなそうとされるタニケイさんは本当に凄い。

この動画見たら、英語学習の方法論は大きく変わる、今はまさに時代の転換点なんだとつくづく思った。

 

それでは、また。

codexaの無料講座がわかりやすかった。

今日の積み上げ

  • 機械学習
    • codexa(コデクサ)の無料講座を受講した
    • DSL輪読会の第2回に参加した
    • 「G検定最強の合格問題集」出版記念のZoom勉強会に参加した
  • 英語学習

 

機械学習

www.codexa.net

こちらの「線形代数入門」「統計入門(前編)」「統計入門(後編)」を受講。

線形代数はヨビノリたくみさんのYouTube動画で、統計入門はかめさんのUdemy講座で一度解説を聞いていたこともあって、割とすんなり理解することができました。

機械学習初学者はこちらのコースから入っていくのがよさそう。

わかりやすいのと、最後に簡単な確認テストが設けられていて、自分の理解度をチェックできるがよかった。

Pythonライブラリ(numpy、pandas、matplotlib)の入門コースもあるので、ぜひ受講しようと思う。

 

DSL輪読会>

輪読本の「3.3 確率」「3.4 統計」を学習。

確率は専門用語がまだしっくりきてない(慣れてない)ので、とりあえず「見た」という状態。

統計はかめさんの講座やcodexaで予習していたこともあり、割とすんなり理解できた。

相関係数の話に関して、ヨビノリたくみさんのこの動画からの引用として、「相関があるからといって、因果があるわけではない」というのが勉強になった。

www.youtube.com

 

<G検定>

b.picaca.jp

G検定に興味があったので、どんな試験なのかを知る目的で参加。

かなり大量の問題を1分弱で解きまくらないといけない、ということを知った。

これはかなりきつそうなイメージだなぁ。

暗記しまくらないとダメな感じですもんね。

とりあえず、どんな問題が出るのか知りたくて、勉強会が終わった後、即ポチしてしまった。。

各章末にある「重要 押さえておきたいポイント」をパラパラとチェックするだけでも、どんなキーワードが重要なのかがわかるので、まずはそうした言葉を見慣れていくことからゆるーく始めてみようかな。

 

英語学習

今日から新しいスクリプトにTry。

初日はまたしても撃沈。(もう慣れっこになってきた)

各文3回まで聞き直せる縛りでやってみると、ディクテーションは全体の半分ぐらいしか書き取れない状態。

こういう状態からある種「過学習」(機械学習用語。詳細はこちら)により、スラスラシャドーイングできるまで持っていきます。これがタニケイ式シャドーイング

良し悪しについてはいまは深く考えず、まずは3ヶ月間やってみることに注力してこうと思います。

また明日からコツコツ頑張ります!

 

それでは、また。

深層学習についてのヨビノリたくみさんの解説がわかりやすかった。

今日の積み上げ

  • 機械学習
    • 深層学習についてヨビノリたくみさんの解説動画を視聴した

 

機械学習

昨日のブログに書いた深層学習本にも関連しますが、下記記事のリンクに貼られていたヨビノリたくみさんが解説動画がわかりやすかったので、書き残しておこうと思います。

kurauzaaa.com

 

youtu.be

 

入力層、出力層の間の中間層が複数以上あることを深層学習と言い、各層を繋ぐ経路の重要性や組み合わせの方法を重みで変えていき、正解を導き出すためにこの重みを調整することを学習と言うことを学んだ。

 

解説では、数字の文字を5×5のマスに分割し、その1マス1マスの情報を読み取って、合計25個のマス情報(=入力パラメータ)を分析していたが、これを金融データ活用チャレンジ課題にあてはめるとどうなるか、考えてみた。

 

まず最初に思い浮かぶのは、預金残高、借入残高、月々の返済金額、返済期間、住宅ローン利率といった金額に関する情報。

そして、その住宅ローンを組んでる顧客がどんな顧客なのかを知るための属性情報(年齢、職業、勤続年数、年収など)もパラメータとして必要だろう。

これらを分析し、どういうパターンのときに住宅ローン返済を延滞する可能性があるのか、パラメータ間の関係性の重みを調整していくイメージなのかな、と思った。

 

具体的な分析手法は全くの未知数だが、自分が作ったモデル(パラメータ間の重みづけをプログラミングしたもの)で、対象データを分析したときに正解を導き出す確率を競う、というのが金融データ活用チャレンジでやりたいこと、そんなふうに今のところは理解した。(ゼロベースから半歩前進できた感あり)

 

それでは、また。

Kaggleについていろいろ調べてみた。

今日の積み上げ

 

機械学習

www.amazon.co.jp

Twitter界隈でこの本が話題になっていたので、ここからKaggleについて興味が湧いていろいろ調べてみた。

 

Kaggleマスターのカレーちゃん(@currypurin)のnote記事を見つけました。

初心者向けのロードマップがトップにドンっと書かれているので、まずは最初の本が挿入としてよさそうです。

note.com

 

共著者のU++さん(@upura)もKaggleマスターのようです。

www.amazon.co.jp

 

発刊記念のラジオトークも聴いてみた。

open.spotify.com

 

で、結局、「Kaggleって何?」って疑問に対しては、こちらのスライドがわかりやすかったです。

speakerdeck.com

 

Kaggelerは、「与えられたお題を、どれだけ正確に予測できるかを競う」ことに楽しさ、やりがいを感じるようです。

どうやって予測するのかの手法を身に付けることさえできれば、自分もハマってしまいそうな、そんな面白さを感じました。

 

英語学習

今日7日目は教材File10の最終日。

音読は1回も詰まることなく、かつ、スピードも変えてやりきることができた。

オーバーラッピングも1.0倍速で特に詰まることなく、バッチリできた。

シャドーイングも順調だったが、余裕かまして意味を意識し出してしまうと、途端にリズムが崩れることがあった。

つまり、音を聴いて何を言ってるか瞬時に判断することはできていないってこと。

それでも、2日目に記録した時点から比べると、成長の実感が味わえてるのが心地よい。

明日からの新しい教材11も頑張ろう!

 

それでは、また。

データサイエンス系学部新設のニュースに接して思ったこと。

今日の積み上げ

 

機械学習

ヨビノリの線形代数入門講座全14編を視聴し、ひとまず「見た」というベースはできた。

再生リストの中には昔の動画も含まれていたので何本か見たが、基本的な行列の意味を解説しているこの動画は最初の導入としてとてもわかりやすかった。

www.youtube.com

 

いま盛り上がっている金融データ活用チャレンジにおいても、各パラメータの情報を「ある法則」で変換することで、新しい情報を生み出していく、その際にこの線形代数の知識が活かせそうな気がしてきた。

(あくまでイメージとしてであって、具体的なやり方とかは全く不明のまま)

 

余談ですが、データサイエンス系学部の新設について、今日のイブニングニュースに取り上げられてました。

www.nikkei.com

いまAIやデータ分析界隈が盛り上がってきているし、人材育成の潮流ができつつある。

そして、昨年末にChatGPTがリリースされ、AIブームが巻き起こっている。

 

いま、まさに次代の潮目を目撃している。

この分野に全く知見がなく、ゼロベースではあるものの、好奇心をモチベーションに変えて、学びを継続していく価値は本当に高いと感じる。

未来を担う英才達といっしょにプロジェクトを推進できたらと考えるだけでもワクワクする。

そんな未来を引き寄せるのも日々の小さな積み上げがあればこそ。

これはやるしかない、そう決意を新たにした。

 

英語学習

今日はシャドーイングをやりながら、聴こえた音に集中して発音できてる感覚を味わう体験を初めてした。

「あっ、できた!」と嬉しくなったのも束の間、パフォーマンスが安定しない。

感覚的なものだが、シャドーのように追いかける際、自分にとって心地よいタイムラグ時間がありそうだ。

長過ぎても短過ぎてもダメというのがやっかいなところ。

(慣れてくれば融通が利くと思うが、いまの自分にとってはラグ幅が広すぎると、途端に対応できなくなってしまう、というのが課題)

 

心地よいラグ時間は、今後試行錯誤しながら探っていくことになるだろう。

今日はひとまず昨日の0.90倍速から標準スピード(1.0倍速)にUPした状態で、オーバーラッピングやシャドーイングを実践することができたことを良しとしましょう。

 

それでは、また。

【祝】ブログ開設1周年!

今日の積み上げ

 

ブログ開設1周年ということで、記念のツイート。

 

Twitterもちょうど同じ頃にアカウントを作成して1周年の節目を迎えましたが、ブログとTwitterのおかげでめちゃくちゃ世界が広がった1年になりました!

ブログってマネタイズ目的でやっている人も多いと思いますが、自分はそういうのはOut of 頭中なので、気楽にやらせてもらってます。

これからもはてぶでは同じようなペースでやっていこうと思っていますので、ま、こんな50代もいるんだな、ぐらいのノリで温かく見守っていただけたら幸いです。

どうぞよろしくお願いいたします。

 

機械学習

今日視聴したところは、逆行列固有値ベクトル、対角化といった1回聞いたぐらいじゃとても理解できない内容だった。

深入りするとハマりそうなので、ひとまず「見た」ということで先に進んでみようと思う。

この手の概念が、今後どういうところで活かされるのかが皆目見当つかない、というのが一番のツラミ。(富士山麓青木ヶ原樹海を彷徨っているようなイメージ)

 

全体像を掴む、森を見てから木を見る。

 

まずは、高いところに登ってみるべく、足を運んでみるしかない。

ヨビノリの線形代数入門講座も今日でちょうど折り返し地点。

まだ下山するのは早すぎるので、頂上(というと大袈裟すぎるけど)目指して歩みを進めるのみ!

 

英語学習

今日からシャドーイング

聴こえた音をそのまま発音する、という単純なことがすっごく難しい。

次から次へと入ってくる音を、キューに蓄えて、それをポーリングして取り出す、みたいなことをやってると一気にオーバーフローしてしまう。(AWSのSQSをイメージして書いてみたが、わかる人にしかわからない表現ですみません。。)

きっとポーリング型ではなく、プッシュ型(入ってきたものをそのまま出す)でいかないと脳内処理がおっつかないんだろうなぁ。(AWSSNSをイメージして書いてみたけど、これもわかる人にしかわからないですね。。重ね重ねすみません)

自身の脳内回路を、ポーリング型からプッシュ型にどうやったらできるのだろうか?

ひたすら数をこなせばそのうちできるようになるのか?

何か特別なことを意識する必要があるのか?

 

ここで、はたと気づいたこと。

スクリプトをすべて頭に入れ、何度も音読やオーバーラッピングで口を動かしている、言わば、個々のスクリプトに関してネイティブとほぼ変わらない状態を擬似的に作り出す、というのがタニケイ式シャドーイングのコンセプトなのではないか。

おーっ、なるほど。

こういう環境を擬似的にせよ作り出せるのであれば、この環境上でいかに立ち回るか、を考えた方がよさそうだ。

(これまでの実践から、タニケイ式シャドーイングによってなんちゃって環境は作り出せてる感覚が実感としてある。これは間違いない!)

 

一旦、さっきのポーリング型からプッシュ型へ戻そう。

 

ひとまずはタニケイ式シャドーイングの実践をベースにトレーニングをしながら、プッシュできる語彙を少しずつ増やしていく(最初から100%は狙わない。60~70%をひとまず狙ってみる)というスタンスでやってみるのがよいかもしれない。

しばらく試してみて、効果を探ってみよう。

 

それでは、また。