APIはアプリとシステムが直接やりとりできる窓口

ChatGPTは、OpenAIが開発したLLM(大規模言語モデル)GPT(Generative Pre-trained Transformer)にユーザーが対話型(Chat)でやりとりできる機能を載せたもの。従来のAIはコマンドを打ち込んでAIエンジンとやりとりしないと答えを引き出せなかったのに対し、自然言語を理解できる対話機能を備えることで、誰でも質問やディスカッションが可能になった。

業務で生成AIを使うとなると、定型的な質問が繰り返されることも多いだろう。利用者が適切なプロンプトを入力できるプロンプトエンジニアリングの知識を持っているわけではないし、決まり切ったやりとりで数十行のプロンプトを打ち込むのは面倒だ。

そこで、ユーザーインターフェイスはアプリケーションとして作成しておき、それを通じて生成AIとユーザーがやりとりできるようにすれば、定型業務を効率化できる。このユーザーインターフェイスとシステムが直接やりとりする機能がAPI(Application Programming Interface)だ。

APIはいろいろなシステム、サービスで用意されている。Google APIを使えばGoogle Mapの地図やGoogle Calendarのスケジュールを自社サイトの中で表示することができるし、Amazon APIを使えば商品の最新情報を表示することもできる。多くの会員制サイトでGoogleやFacebookのログイン認証を使ってログインできるのもAPIのおかげだ。

ChatGPT APIも、そのようなAPIの一種である。APIを使えばChatGPTのAIエンジンであるGPT-4o、 OpenAI o4-mini、OpenAI o1、DALE-Eなどとアプリケーションが直接やりとりできる。

ChatGPT APIの利用には別途費用がかかる

Open AIは、ChatGPT APIを従量制の課金モデルで提供しており、利用には別途申し込みが必要だ。従量制というのは、AIが処理する言語の単位数のことで、これをtoken(トークン)と呼んでいる。だいたい英語ならば1単語が1token、日本語の場合は1文字が0.5~3tokenに相当するという。利用料金は使うAIモデルによっても異なり、入力100万tokenあたりOpenAI o1だと15ドル、OpenAI o4-miniだと0.15ドルになる。100倍の違いが出ることに注意しないといけない。本書執筆時には最上位モデルであったOpenAI o1は複雑で多段階の問題を得意とする推論モデルであり、OpenAI o4-miniは軽量・高速を強みとするエントリーモデルである(現時点ではOpenAI o3がハイエンド)。出力も別途token数に応じた料金がかかる。

100万tokenは、192ページぐらいの単行本2、3冊分の文字量に相当するという。これだけのデータをGPT-4oモデルとやりとりすると入力で2.5ドル、出力で10ドル、合計12.5ドルの費用になる。それでも月額20ドルの固定料金であるChatGPT Plusの半額あまりで済むので、用途によってはChatGPT Plusを契約するよりChatGPT APIを使った方がお得ということになる。

ChatGPT APIを使うには

ChatGPT APIを使う手順は次の通り。

1)OpenAIアカウントを作成する
 ChatGPT APIは有料なので、まずはクレジットカードの登録などOpenAIアカウントを申し込まないといけない。初期チャージが完了するとAPIキーが発行される。APIキーはChatGPT APIにアクセスするための認証情報なので、絶対他人には漏らしてはいけない。

2)Google Colabにアクセスする
 ChatGPT APIは、何らかのプログラムからアクセスしないと使えない。パソコンにJavaやPythonなど開発環境をインストールしてプログラミングしてもいいのだが、まずはWeb上で開発できるGoogle Colaboratory(Colab)を使ってみる。プログラミング言語の環境設定は不要だし、Google Colab自体がAIを使って必要なコードを提示するなど、プログラミングを手助けしてくれる。Google Colabは無料で利用できる。

3)Pythonを使ってChatGPT APIアプリを開発する
 Google Colabは、さまざまなプログラミング言語に対応している。本書ではPythonを使ってAPIアプリを開発する場合を紹介している。Pythonはわかりやすい言語だが、それでも本書に掲載されているサンプルプログラムをすべて入力するのは面倒だ。本書の読者はサポートサイトにアクセスすることでサンプルプログラムをコピーできるので、これをColabにペーストすればよい。

事例をあげてChatGPT APIを利用する

本書ではいくつかの実例を挙げながらChatGPT APIを使ったアプリケーション開発を解説している。取り上げているのは下記のような事例だ。

・情報収集と競合分析で調査を楽にしよう
・セールスコピーを考えてもらおう
・SQL文を生成してデータを抽出しよう
・複雑なデータを簡単に分析しよう
・会議音声から議事録を自動生成しよう
・AIをStreamlitでWebアプリにしよう

情報収集では、Googleや政府統計ポータルサイトであるe-Statからそれぞれが用意しているAPIを使い、データを取得し、Pythonで整形し、ChatGPT APIを経由して要約するというアプリを作る。競合分析は取得したデータをChatGPT APIで業績の調査・要約をしたり比較したりする。

セールスコピーを考えるというのは、架空のスマートフォンゲームを題材に、ターゲットユーザーの設定、訴求ポイントの選定、ペルソナの定義、表現方法の指定まで行う。出力例として3×3の9個のマス目にテーマを記入し、それを広げていくことでテーマを膨らますマンダラート(目標達成シート)作成が挙げられている。

OpenAIが提供する画像生成AI、DALE-Eを使い、商品コンセプトからロゴなど画像を作成する手法も紹介されている。ただし、画像生成は利用料金が高く、1枚6円から12円程度かかる。大量に画像を生成させていると想定外の出費になるので注意が必要だという。

SQLは、データベース管理システムを操作するための標準言語。検索、追加、更新、削除、作成などを行うことができる。MySQLやPostgreSQLといったオープンソースのデータベース管理システムからOracle Database、IBM Db2、Microsoft SQL Serverといったプロプライエタリなデータベース管理システムまで、現在の主なデータベース管理システムはSQL文で操作する。通常は他のプログラミング言語にユーザーインターフェイスを任せ、SQL文はデータベース管理システムとのやりとりに特化する。

本書では架空の注文管理システムを対象にChatGPT APIを使って各注文の詳細情報を統合し、注文ごとに商品価格と数量を掛け合わせて合計金額を計算するといったSQL文を生成している。また、取得したデータをPythonのグラフ描画ライブラリと組み合わせ、グラフを描いて可視化するといった処理も紹介している。

会議音声から議事録を作成するというのは、かなりニーズが高い用途ではないだろうか。録音したデータをOpenAIの音声認識モデルWhisper APIで文字起こしし、さらにChatGPT APIで議事録にまとめるまでを自動化してくれる。Whisper APIの利用についてはChatGPT APIと同様のtokenに応じた利用料金がかかるが、文字起こしを外注に出すよりははるかに安く、素早く、情報漏洩の危険性も低くできる。

議事録作りの精度を上げるには、議事録のフォーマットに合わせた進行を考慮するのが良いという。各議題の最後に司会者が「ここはXXXXということですね。アクションアイテムはYYYYとZZZZである」と述べることでChatGPTに区切りをわかりやすくするなどの工夫が必要だという。

本書で取り上げているそれぞれの課題は、APIを使って定型化するのにあまり適しているとは思えず、ChatGPTにプロンプトを入力し、対話のやりとりを重ねていった方が早いような気がする。業務用システムのように個別企業・課題に応じたシステムを書籍で取り上げてしまうと、汎用性がなくなってしまうからだろう。

本書はChatGPT APIの活用入門書として、サンプルコードをコピーしながら概要を学び、ChatGPTと対話しながら実際の業務システムを構築していくといった使い方がいいだろう。

まだまだあります! 今月おすすめのビジネスブック

次のビジネスモデル、スマートな働き方、まだ見ぬ最新技術、etc... 今月ぜひとも押さえておきたい「おすすめビジネスブック」をPC-Webzine.comがピックアップ!

『ChatGPT API×Pythonで始める対話型AI実装入門(GPT-3.5&GPT-4 対応)』(古川渉一、荻原優衣 著/インプレス)

話題の対話型AI「ChatGPT」では、APIと呼ばれる、ChatGPTをアプリケーションに組み込んで利用するためのしくみが公開されています。ChatGPTのAPIを活用することで、ChatGPTを他のアプリケーションと連携でき、ブラウザ版のChatGPTを単独で使うよりも幅広い活用が可能になります。たとえば「音声認識サービスと連携し、会話の音声データを文字起こししてChatGPTで要約する」「Google検索の結果を取得して、ChatGPTでニュース記事を作成する」といった処理ができます。本書では、Pythonの具体的なコードを示しながら、ChatGPT APIを活用したサービスを実装する方法を解説します。(Amazon内容解説より)

『ChatGPT 誰でも1時間でできる! はじめてのGPTsのつくり方』(本郷喜千 著/standards)

GPTsはChatGPTをカスタマイズして作ることができる、特定のタスクに特化したAIアプリケーションです。特別なプログラミングの知識も必要なく、ノーコードでアプリを開発することができるので、誰でも簡単にオリジナルのAIアプリを作り出すことができるようになります。本書は、このような最新の生成AIアプリケーション=GPTsの作り方をステップバイステップでガイドする実践的な入門書です。面倒な仕事をAIアシスタントに任せてしまえば、あなたにしかできない仕事に集中するチャンスが生まれることでしょう。(Amazon内容解説より)

『【この1冊からはじめる】生成AIアプリ開発入門 Dify 徹底活用ガイド』(イサヤマセイタ 著/SBクリエイティブ)

本書は生成AIを利用したアプリケーション開発ツールDifyを使って、10分以内で作れる簡単なアプリから、複雑な仕事をこなす高度なアプリまで、たくさんの生成AIアプリを作りながら基本的な操作方法を身に付けていくことができます。はじめてアプリケーション開発に挑戦する人にとって、押さえておきたい知識をわかりやすく&詳しく解説しています。生成AIに関する知識と自分の仕事をアプリケーションに落とし込むコツが身につく1冊です。(Amazon内容解説より)

『ChatGPT API×Excel VBA 自動化仕事術』(植木悠二 著/インプレス)

本書はChatGPT APIとExcel VBAを組み合わせ、身近な業務を自動化する手法を解説した一冊です。例えば、Webブラウザーで「https://chat.openai.com/」にアクセスしてChatGPTを使う場合、テキストボックスに質問を入力後、それに対する回答が画面上にテキストで表示されるため、生成結果のコピー&ペーストなどに手間を要します。しかし、ChatGPT APIを利用すれば、そういった手間を掛けずにChatGPTの回答をExcelに出力することが可能です。目的や用途に合わせてChatGPTの挙動をカスタマイズしたり、大量の物事や調べものを一括で処理したりできるのはAPIならではの利点です。このようなAPIを使うからこそ発揮される利点を生かしたテクニックを解説しています。(Amazon内容解説より)

『作って学べるExcel VBA+ChatGPT APIの基本』(池谷京子 著/日経BP)

Microsoft Excelに付属しているExcel VBAを使って、Excel上で動作するプログラムを作成する手順を体験できる入門書です。全12章を順番に学習することで、Excel VBAによるアプリケーション作成に必要な基礎知識、開発環境の準備、ワークシートの操作、画面のデザイン、コードの書き方などを学習できます。また、本書では、AIのひとつであるChatGPT に、APIを使って接続するコードも学習できます。(Amazon内容解説より)