◇この講座でできるようになること
・(中級者向け)ZOOMやTeamsなどのオンライン会議レコーディングファイルもしくは音声ファイルからの
議事録自動作成(Colab)をPythonでモジュールとAPIの呼び出しのみ(非常に少ないコード)で行います。
・(中~上級者向け)Python Flaskを用いてローカル環境(インターネット接続なし)で動作する本格的な音声認識システムを
構築できます。バックエンドはOpenAIのWhisperモデルなので、認識精度はかなり高いです。
◇この講座の構成
◇この講座でできるようになること
・(中級者向け)ZOOMやTeamsなどのオンライン会議レコーディングファイルもしくは音声ファイルからの
議事録自動作成(Colab)をPythonでモジュールとAPIの呼び出しのみ(非常に少ないコード)で行います。
・(中~上級者向け)Python Flaskを用いてローカル環境(インターネット接続なし)で動作する本格的な音声認識システムを
構築できます。バックエンドはOpenAIのWhisperモデルなので、認識精度はかなり高いです。
◇この講座の構成
動画ファイル or 音声ファイルのアップロード
動画ファイルからの音声ファイル作成
音声ファイルからのテキスト抽出(音声認識)
音声認識テキストからの要点抽出(自動要約)←ChatGPT(gpt3.5/gpt4.0)にプロンプト生成してもらいました。
要点抽出結果のダウンロード
Flask環境の構築
ミニマムなFlaskアプリ
Whisper_MIC
Flask画面パーツ
Stable Diffusionでfavicon
Bootstrap
Ajax
デモ
システム構成
Whisper_MICとファイル連携
仕上げ
レクチャー11でgit cloneするWhisper_MICが講座収録時からソースの構造が大幅に改定されています。講座を進めるために過去のバージョン(2023/1/2のコミット)に戻す必要がありますので、こちらの補講では戻す方法をご説明いたします。
git cloneした後に以下コマンドを実行することで講座収録時のバージョンに戻せます。
git checkout 91afa6b0523e59e5d396dc69c86aa3a07ccf156e
レクチャー11: Whisper_MICの動画と合わせてこちらもご確認ください。
仮想環境へ入るバッチの作成とシステム構成に従ったWebアプリのセットアップを行っていきます。
OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.
Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.
Find this site helpful? Tell a friend about us.
We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.
Your purchases help us maintain our catalog and keep our servers humming without ads.
Thank you for supporting OpenCourser.