本コースは、OpenAI APIを活用する方法が分かる!
はじめてOpenAI API使った開発を行う方向けの入門コースです。
仕様変更に対応するため、2024/3に全面リニューアルを実施しました。
AIの進化は目覚ましく、21世紀の技術として多くの業界でその効果を実感しています。
中でも、OpenAIのAPIはその最先端技術として注目を浴びており、多くの開発者やビジネスパーソンが新しい価値を創出する手段として利用しています。
本コースは、OpenAI APIを活用する方法が分かる!
はじめてOpenAI API使った開発を行う方向けの入門コースです。
仕様変更に対応するため、2024/3に全面リニューアルを実施しました。
AIの進化は目覚ましく、21世紀の技術として多くの業界でその効果を実感しています。
中でも、OpenAIのAPIはその最先端技術として注目を浴びており、多くの開発者やビジネスパーソンが新しい価値を創出する手段として利用しています。
このコースは、そんなOpenAI APIを最大限に活用したい方のための完全ガイドとして作成されました。
コースのハイライト:
ChatGPT入門とその先へ: AIチャットボットの最前線技術であるChatGPTを核に、基本的な実装方法から高度なカスタマイズまで、幅広い知識を網羅します。
DALL·Eとその魔法のような画像生成: OpenAIが誇る画像生成技術DALL·Eの使い心地を深堀り。AIによるクリエイティブな作品の生成方法から、その応用例まで詳細に解説します。
Whisper音声認識の全貌: 音声技術がもたらす新しいコミュニケーションの形を探る。Whisperの高精度な音声認識を活用したサービス開発の方法や、その多様な使用シーンを実例を交えて紹介します。
学ぶ内容の詳細:
OpenAI APIの基礎知識: APIの概要、OpenAIとは何か、APIの基本的な仕様、料金やトークンについての深い理解を目指します。
実践的APIの活用: 実際のプロジェクトを想定し、APIキーの生成と安全な利用、不正利用への対策、GPT-3.5とGPT-4の使い分け、料金の節約方法、パラメータ調整など、現場で直面する課題をクリアするための技術を習得します。
ChatBotの実装: 豊富なサンプルコードを通じて、効果的なChatBotの開発方法を学びます。履歴の管理やsystemメッセージの活用、敵対的プロンプティングへの対策など、実践的なテクニックを詰め込んでいます。
DALL·Eを駆使した画像生成: AIの持つ驚異的な画像生成能力を最大限に活用する方法を伝授。様々なパラメータの調整方法や、生成した画像の保存・利用方法などを徹底的に学べます。
Whisperによる音声認識: 今後の音声技術のトレンドを先取り。Whisperを利用した音声認識の基本から、高度な設定までを一通り網羅します。
Text to Speech APIによる音声合成:AIにスピーチさせる方法を学習します。英語はもちろんのこと、日本語のスピーチにも対応。
OpenAIのAPIに関する基本的な情報から、実際のアプリケーション開発に必要な高度なテクニックまで、このコースで一気に学べる内容となっています。
AI技術の活用を考える全ての方、新しいスキルや知識を身につけたい開発者の方々に、本コースを自信を持っておすすめします。
OpenAI APIの利用料について(2024/4/19現在):
基本的には有料です(詳細はコース内で説明)。
カリキュラム通りに学習するためには、基本的にはOpenAI APIの前払いクレジット(最小5ドル)を購入する必要があります。
例外として、OpenAIアカウントを作ってから、最初の3ヶ月間、5ドルの無料クレジットが使えます。ただし、新しいモデル(例:GPT-4, GPT-4 Turbo, DALL-E 3)が使えない等の制約がありますので、あらかじめご承知おきください。
学習環境
パソコン(macOS または Windows)
Google Chrome
Google Colab
Python 3系
Q&Aコーナーのご利用について
主に、カリキュラム通りに学習が進められない場合のアドバイスや、ディスカッションを行っております。
本コースの内容を超えるご質問にはお答えできませんので、あらかじめご了承ください。
旧版のカリキュラム(古いカリキュラム)について
既に学習を進めている方々にも配慮し、2024年4月末まで旧版のカリキュラムへアクセス可能にしております。
通常は旧版のカリキュラムを学習する必要はありません。
旧版のカリキュラムについては、メンテナンスとサポートを終了いたします。
受講するか迷っていますか?
コースにご満足いただけない場合は30日以内返金保証制度があるため安心です(Udemy マーケットプレイスよりコースを購入された場合)
更新履歴
2024/3/8 全面リニューアル(第2版)
2023/12/08 新セクション公開「Text to Speech APIで音声合成をしよう」
2023/10/18 コース公開
OpenAI API コースの学習目的について
OpenAI API コースカリキュラムの流れについて
API について
OpenAI の主な API
言語モデルとは
言語モデルの仕組みの概念について
OpenAI のアカウント作成の方法について
OpenAI API の料金について
OpenAI API の料金に関する注意点
トークンとは
トークンに関する補足
トークン数を調べる方法について
OpenAI API の基本的な使い方の概要
OpenAI API の基本的な使い方についての主な学習内容
学習環境について
Google Colab について
インデント幅 スペースについての補足
API キーについて
API キーについての注意点
はじめてのOpenAI API入門で利用したサンプルコードの紹介
OpenAI API へのリクエストについて
ChatCompletion について
model についての補足
GPT-3.5 についての補足
GPT-4 についての注意点
GPT-4 と GPT-4-Turbo の違いについて
API キーの非表示について
API キーに関する補足
エンターキーについての補足
ノートブックについての補足
API からの戻り値について
API からの戻り値に関する補足
トークン使用量の確認方法について
費用の計算例について
GPT-3.5 と GPT-4 の使い分けについて
Colab に関する補足
GPT-4 についての補足
パラメーター max_tokes について
トラブルシューティングの方法について
サービス公開時の注意点
一連の会話を指定する方法について
ChatBot を開発しようの概要
ChatBot を開発しようについての主な学習内容
連続してプロンプトの入力を求める機能について
ChatCompletion API へのリクエストについて
GPT-3.5 Turbo と GPT-4 の選択について
ChatBot コードの実装についての補足
過去の文脈を配列 messages に格納して、リクエストする方法について
動作確認について
新たな問題点について
例題)最新の3往復分のみ保持して API に渡すコードに変更
動作確認について
役割指定について
モデルの振る舞いの制限について
モデルの振る舞いの制限についての注意点
システムメッセージでの目的外利用の防止について
トークン(=コスト)を節約する方法について
システムメッセージを英語に変更する例について
max_tokens の設定に関する補足
GPT の様々なパラメータの使い方についての概要
パラメータ stop とは
ストップシーケンスについての補足
ストップシーケンスに関するまとめ
パラメーター n とは
トークンについての注意点
temperature、top_p とは
temperature、top_p についての注意点
DALL·E で画像を生成しようの概要
DALL·E 2 とは
DALL·E で画像を生成しようについての主な学習内容
DALL・E の利用についての注意点
料金表について
DALL·E に関する補足
基本的な API の使い方について
DALL·E の画像生成 API の料金体系について
DALL·E の画像生成 API の基本的な API の使い方
DALL·E の画像生成 API のサイズ指定と枚数指定について
DALL·E 3 の利用についての注意点
DALL·E 3を利用するためのパラメータについて
画像品質についての補足
DALL·E で生成した画像を保存する方法について
保存した画像を Colab 上に表示する方法について
生成した画像を Colab に表示する方法について
複数画像に、別々の名前をつけて保存する方法について
複数画像を Colab に表示する方法について
画像を保存する方法の、代替アプローチについて紹介
画像保存の方法について(base64、文字列形式に変換して保存)
Whisper で音声認識をしようの概要
音声認識とは
Whisper とは
Whisper の使い方を学ぶ理由
Whisper で音声認識をしようについての主な学習内容
Whisper の料金体系について
最も基本的なプログラムの動作確認
読み上げの内容について
レスポンスのフォーマットの設定について
サンプリング温度の設定方法について
言語を明示的に設定する方法について
文字起こしの精度を上げる方法について
文字起こしの精度を上げる方法についての注意点
音声ファイルの文字起こし後に翻訳をする方法について
Translation についての補足
Text to speech APIとは?
本セクションの学習トピック
声合成の基本的なコードの実装
APIの料金体系の説明
APIの利用規定についての注意
長いテキストのスピーチ実装
複数行にわたるテキストを一つの文字列として定義する方法(Python基礎)
パラメータの制限事項
音声タイプ(話者)の指定方法
利用可能な音声タイプの比較
音声タイプの特徴に関する考察
スピーチの速度調整を実装する
速度設定の範囲について
音声合成モデルの指定方法
指定できる音声合成モデルの種類
音声ファイルのフォーマットを指定する方法
指定できるフォーマット
フォーマット選択の観点
パラメータ stop について
ストップシーケンスについての補足
ストップシーケンスに関するまとめ
パラメータ n について
パラメータ n の例題
パラメータ n についての注意点
パラメータ temperature について
パラメータ top_n について
temperatureとtop_n の使い分けについて
パラメータの変更についての注意点
DALL·E のウェブインターフェイスの料金体系について
DALL·E のウェブインターフェイスの画像生成の例
DALL·E のウェブインターフェイスの制約事項について
OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.
Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.
Find this site helpful? Tell a friend about us.
We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.
Your purchases help us maintain our catalog and keep our servers humming without ads.
Thank you for supporting OpenCourser.