ChatGPTの音声入力がすごく使いやすかった!
今日の積み上げ
- AI学習
- Generative AI Business Dayのオンラインセッション視聴
- ChatGPTの音声入力を試してみた
- DS検定対策講座(DS編)の統計学入門:6/7テーマ済
AI学習
generativeai-businessday.studio.site
このイベント、お昼休みのセッションと夕方のシュンスケさんのセッションをリアルタイム視聴しました。
- ChatGPTと生成AIを活用した高速プロダクト開発の裏側と学び
- 生成系AIの限界
- プロンプトアーティストという新職種と可能性
どのセッションも学びがあり、面白かったです!
「高速プロダクト開発の裏側」ではサービスを早く作るだけではなく、リリース後のPR活動であったり、サービススケーリングへの備えだったり、そういう生の声を聞くことができ、とても勉強になりました。
「生成系AIの限界」では、人間の問題解決プロセスになぞらえて、System1とSystem2という立て分けをした上で、ChatGPTは超最強のSystem1マシンであり、ゆえにSystem2的な問題も解ける、という分析結果を披露。
このことを踏まえた上で、現状のChatGPTの限界は、未知で既知のパターンを複雑に組み合わせないと解けない問題(System2をフル稼働させる問題)と結論づけている点に感心しました。
そして、「プロンプトアーティスト」であるシュンスケ先生の登壇。
私もシュンスケさんのLINEオープンチャットや、Voicy、stand.fmを通じてたくさんの情報を入手させていただいています。
シュンスケさん、なんとChatGPTのプロンプトを使ってのプレゼンテーション。
普段、ChatGPTを使ってる人が見ても、まさか音声でプロンプトを入力しているのを見るだけでも驚愕したと思います。
私もシュンスケさんのこの発表を聞いて、自分でもやってみたくなり、iPadから音声入力やってみました。
参考にしたのは、こちらの記事です。
一応、PC環境に合わせて、Google Chromeのアプリを入れ、拡張機能のVoiceInも入れました。
実際に入力する際は、下図の赤丸で囲った音声入力ボタンを押して、しゃべるだけ。
誤変換された場合は、適宜修正することを忘れずに。
結構やり出したら楽しくなってきて、夢中で2時間近くChatしてました(笑)
GPT-4は割と長い文章を吐き出す上、スピードも遅いので、ちょっとイラつきますね。
「文字数を300文字以内で」とか指示しながらだと、結構テンポよく進められました。
今日の成果はマークダウン形式で吐き出してもらったので、これを次回以降、プロンプトとして投入していくことで、成果の積み上げが可能。
これ、すごくいいと思いました。
ビジネスの提案資料とか、たたき台を作る際にめちゃくちゃ使えそうなイメージを掴めたのが今日の一番の収穫でした。
そして、ChatGPTと音声入力の相性が超サイコーであることも、確信に変わりました。
使いやすいので、もう手入力には戻りたくない感じですw
これからのエンジニアは手を動かすだけでなく、口を動かすこともより重要になってくるかもしれませんね。
それでは、また。