マナビDXQのPBL01の演習でAIモデルを構築する課題、そろそろ進めたいと思いながら、なかなか進められていません。。
Pythonでコードを書くことはSIGNATE Cloudで少しずつ進めていますが、まだまだ知らないことばかりで、ChatGPTにおんぶにだっこの状態。
うーん、果たしてこの状態で課題ができるのか。
正直、二の足を踏んでしまっている、といった感じでした。
そんな中、今日マナビの受講生有志が開いてくれたオンライン勉強会に参加。
皆さんがどうやってChallenge Missionを攻略しているのかを学び合うことが目的の会でした。
コードレベルの難しい話もあって、内容についていけない場面も結構ありました。
それでも、データ分析をデータ可視化の技(seabornやmatplotlibのPythonライブラリを活用)をうまく使っていくことが大事なんだな、ということがわかりました。
頭ではわかっていても、それを実際にコードで書きつつ、自分が立てた仮説を検証する、というプロセスを回せるかどうか。
ここが今回AI課題に取り組むにあたって、経験値を蓄えたいと思っているところです。
そんな風に思っていたところ、勉強会の中でPyGWalkerというライブラリがあるよ、と紹介してくださった方がいました。
実際にデモも見せてくれて、「こんなことができるのか!」と衝撃を受けました。
PyGWalkerについて、perplexityに聞いてみたところ、以下のような回答でした。
PyGWalkerは、Pythonでデータをインタラクティブに可視化するためのライブラリです。特に、Jupyter Notebook上でPandasやPolars、Modinのデータフレームを可視化することができ、コーディングのスキルを必要とせずにデータの視覚的な探索を行うことができます。
### 特徴と機能
- **インタラクティブな可視化**: PyGWalkerは、データをインタラクティブに可視化するためのビジュアルインターフェースを提供します。これにより、ユーザーはドラッグアンドドロップ操作で簡単に散布図、折れ線グラフ、棒グラフ、ヒストグラムなどを生成できます。
- **TableauスタイルのUI**: PyGWalkerは、Tableauのようなユーザインタフェースを提供し、データ分析と可視化を直感的に行うことができます。
- **Streamlitとの統合**: PyGWalkerは、Streamlitと組み合わせて使用することで、データの探索と情報共有を容易にします。Streamlitを使用することで、データスクリプトをウェブアプリに変換し、視覚的な探索アプリを作成することができます。
- **多機能で直感的な操作**: PyGWalkerは、他の可視化ライブラリと比較して、多機能でありながら直感的な操作が可能です。特に、グラフを作成するためのUIを提供する点が特徴です。
平たく言えば、serbornやmatplotlibを使ってゴリゴリコードを書かなくても、マウスでぽちぽちするだけで簡単にビジュアライズができる、という何とも素敵なUIを提供してくれるのが、PyGWalkerなわけです。
比較しているサイトの表から引用するとこんな感じ。
これはぜひ使ってみたい!!
perplexityで探索的データ分析について調べてみました。
探索的データ分析(Exploratory Data Analysis, EDA)は、データセットを調査し、その主な特徴を要約するための統計的手法です。EDAは、データのパターンを発見し、異常を特定し、仮説を検証するために用いられ、データサイエンスの初期段階で重要な役割を果たします。
PyGWalkerという新しい技を知ったことで、AI課題に挑戦してみる意欲も高まってきました!
熱しやすく冷めやすい性格なので、この後早速試してみようと思います!
(試した感想はまた後日書きます)