【GPT活用】Power AppsでGPTのAPIを使ったAIアプリを作る方法！

ミムチ

最近AIを使ったアプリが増えてますが、ミムチもGPTを使ったAIアプリを作りたいですぞ！

パワ実

この記事では、Power AppsでOpenAIのGPT APIを使ったAIアプリを実装する方法を解説するよ。

この記事では、Power AppsでGPTのAPIを使ったAIアプリを作る方法を解説します。

Power AutomateのHTTPアクション等を使うと、Azure OpenAIや、GPTのAPIを呼び出すことができます。

実際にテキストや、写真を入力して、GPTに応答してもらう実装方法を解説します。

この記事でわかること

Power AppsでGPTを使う３つの方法と違い
Power AutomateでGPTのAPIを呼び出す方法
GPTのAPIに、テキストや画像を入力する方法

Youtube動画で見たい方は、こちらからどうぞ！

Contents

Power AppsでGPTを使うと何ができる？
Power AppsでGPTを使う３つの方法
GPT APIでテキストを入力する方法
- 今回実現すること
- 実装方法
GPT APIで写真を入力する方法
- 今回実現すること
- 実装方法
最後に

Power AppsでGPTを使うと何ができる？

Power AppsでGPTを使うと、例えば以下のような、食材の写真や、テキストから、GPTにレシピを提案してもらうようなアプリも作れます！

パワ実

実際にGPTレシピで料理を作ってみましたが、とても美味しくできました！

ミムチ

これ以外にも、GPTを使うと色々なAIアプリが作れそうですな！

Power AppsでGPTを使う３つの方法

初めにPower AppsでGPTの機能を使う方法は、主に「Azure OpenAI Service」、「OpenAIのGPT API」、「AI Builder」の３つがあります。

それぞれについて、簡単に違いを説明します。

Azure OpenAI

「Azure OpenAI Service」は、MicrosoftのAzureで使うことができるサービスです。

Power Automateの「HTTP」アクション等を使って、GPTを呼び出すことができます。

※利用にはAzureライセンスが必要です。

2024年2月現在、まだ限定された企業のみ利用することができ、個人での利用はできません。

主にできることは、GPTによるテキスト生成、DALLEによる画像生成、ささやきでの音声からテキストへの変換、テキストの読み上げ等です。

Azure OpenAI Serviceが使える企業であれば、これを使うのが一番良いと思いますが、2024年2月現在、使える企業はMicrosoftとパートナーシップ関係がある企業等、限られています。

ミムチ

Azure OpenAI Serviceを使えない企業や、個人の場合は、別の方法を選択する必要がありますな…

OpenAIのGPT API

そこで次に候補にあがるのが、OpenAIのGPT APIを直接利用することです。

GPT APIはOpenAIのサイトで、APIキーを発行すれば誰でも自由に使うことができ、料金は、利用した分だけ課金される従量課金制になります。

GPT4のAPI利用は、ChatGPT Plusのサブスクリプションに加入している必要があり、場合によっては1ドル以上の課金設定も必要です。

GPTのAPIも、Power Automateの「HTTP」アクションや、OpenAIコネクタで利用することができます。

HTTPや、OpenAIコネクタは、Power AutomateのPremiumコネクタが必要なので、持っていない場合は、試用版ライセンス等を使いましょう。

パワ実

主にできることは、Azure OpenAI Serviceとほぼ同じなので、Azure OpenAI Serviceが使えない人は、GPTのAPIが有力な候補となります。

ミムチ

OpenAIのAPIを直接使う場合、セキュリティ面は大丈夫ですかな？

OpenAIのAPIデータのプライバシーページをみると、以下のように記載されているため、APIを使う場合は、入出力データを、勝手に使われることは無いようです。

ChatGPTを使う場合は、現時点ではオプトアウトしないとトレーニングに使われてしまうため、必要に応じてオプトアウトの設定をしておきましょう。

AI Builder

Power AutomateのAI Builderで使用できるGPTアクションも紹介します。

AI Builderで、「GPTでプロンプトを使用してテキストを作成する」アクションや、「画像の説明を生成する」アクションが使えるようになりました。

パワ実

AI Builderは、Power Automateで非常に簡単に使えますが、2024年2月現在では、おそらく出力等の制限があるようです。

例えば、材料から料理のレシピを作ってもらい、指定したJSON形式で出力してもらうプロンプトを入力したところ、以下のように期待した出力は得られませんでした…

また画像の説明を出力するアクションも、GPT4のAPIを直接使ったものより、かなり精度が低いように感じまし。

パワ実

もしかすると、私の設定やプロンプトが悪かったかもしれません…

またこれはあくまで、2024年2月現在の話のため、今後のアップデートで、精度の向上や、利用ケースの拡大が期待できるかもしれません。

現時点でのユースケースとしては、例えばドキュメントの要約や、請求書からの情報抽出等では、AI Builderが適しているのではないかと思います。

AI Builderを使うには、「AI Builderクレジット」が必要です。

必要なクレジットは、以下のようにいくつかのライセンスに付随して入手できます。

AI Builderの試用版ライセンスもありますが、GPTアクションは試用版ライセンスでは使えないので、有料版ライセンスが必要です。

パワ実

私の場合は、1カ月間に5,000クレジットがついている「Power Automate Premium」のライセンスを購入しています。

AI Builderクレジットを、利用する環境に割り当てることで、AI Builderで使った分だけクレジットが消費されるようになります。

どのサービスを選択するか？

これまであげた3つの、Power AppsでGPTを利用する方法について、それぞれの活用ケースをあげてみました。

まず自由度の高いAI活用をしたい場合は、Azure OpenAI Serviceか、OpenAIのGPT APIを使います。

Azure Open AIサービスが使える企業は、そちらを使い、使えない企業や個人の場合は、GPTのAPIを直接利用するとよいと思います。

一方で、文章要約や、データ集出等の、限定されたAI機能の活用をする場合は、AI Builderを使うのでもよいと思います。

パワ実

この記事では、誰でも使えて自由度の高いAI活用が可能な、「OpenAIのGPT API」を使ってみます！

GPT APIでテキストを入力する方法

今回実現すること

まずは、GPTのAPIを利用して「テキスト」を入力し、「テキスト」で出力する方法を解説します。

例えば以下のように、テキストで入力した材料をもとに、レシピを提案してもらうことができます。

今回実装する内容

Power Appsの画面で質問のテキストを入力し、ボタンをクリックしたら、Power Automateを実行する
Power AutomateのHTTPアクションで、GPTのAPIを呼び出し、テキスト生成し、その結果をPower Appsに渡す

実装方法

①Power Appsのコントロールを実装

１．Power Apps編集画面を開き「挿入」から、「テキスト入力」、「ボタン」、「テキストラベル」の3つのコントロールを追加します。

今回は簡単に質問内容をして、ボタンを押したら回答が表示されるという、ChatGPTのようなアプリを作ってみます。

ミムチ

基本的な内容ですが、これができれば色々と応用的なアプリ開発にも役立ちそうですな！

②Power Automateの実装

Power Appsで3つのコントロールを配置したら、次にPower Automateフローを作ります。

１．Power Apps編集画面の「Power Automate」タブから、「フローの追加」＞「フローを新規作成する」＞「フローを作成」をクリックします。

２．フローの編集画面が開きます。

最終的なフローの全体像は、以下のようになります。

３．トリガー「Power Apps（V2）」で、「入力の追加」＞「テキスト」をクリックし、以下のように設定します。

Power Appsでボタンをクリックし、Power Automateフローを実行する際にPower AppsからPower Automateへ、テキストやファイル等のデータを渡すことができます。

今回はPower Apps側で入力した質問をテキストで、Power Automateに渡します。

４．「新しいステップ」から、「変数の初期化」アクションを追加し、以下のようにGPTのAPIキーを文字列で設定します。

GPTのAPIキーの取得方法は、以下の記事も参考にしてください。

【ChatGPT×PowerAutomate】Power AutomateでChatGPTのAPIを使う方法この記事では、Power Automateの「OpenAI GPT」コネクタを使い、ChatGPTのAPIを利用する方法を解説します。 Power AutomateでOpenAI GPTコネクタを使うには、初めにOpenAIでアカウントを作成し、APIキーを発行する必要があります。発行したAPIキーを、PowerAutomateのOpenAI GPTコネクタで設定すれば、Power AutomateでChatGPTを使うことができます。...

APIキーは他の人に知られてしまうと、勝手にどんどん使われてしまう危険があるため、絶対に外部には漏らさないようにしましょう。

５．「新しいステップ」から、「HTTP」アクションを追加します。

※HTTPアクションでGPTのAPIを呼び出します

HTTPアクションはPremiumコネクタなので、持っていない場合は、試用版ライセンスを使いましょう。

６．HTTPアクションに以下のような設定をします。

方法：POST

URI：https://api.openai.com/v1/chat/completions

ヘッダー：
Content-Type：application/json

Authorization：Bearer <APIキーの変数>

本文：

{
“model”: “gpt-4-turbo-preview”,
“messages”: [
{
“role”: “user”,
“content”: “＜プロンプトを入力＞”
}
]
}

modelは、今回「gpt-4-turbo-preview」を使っていますが、GPT4を使えない場合は、GPT3.5ターボ等に置き換えます。

GPT APIで使えるモデルのリファレンスを参考にしてください。

“content”の部分は、Power Appsから渡したプロンプトを「動的なコンテンツ」から設定します。

７．最後に「新しいステップ」から、「Power Apps」を追加し、以下のように動的なコンテンツから、HTTPアクションの結果の「本文」を設定します。

「PowerAppsまたはFlowに応答する」アクションは、Power Automateフローで実行した出力結果等を、Power Appsへ渡すために使うアクションです。

８．これで一旦フローを保存します。

③Power AppsからPower Automateを呼び出す

１．Power Apps編集画面に戻ったら、ボタンの「OnSelect」プロパティに以下の関数式を入力します。

Set(OutputText, ＜Power Automateフロー名＞.Run(TextInput1.Text));

Power Automateを呼び出す関数式が「フロー名.Run」で、引数にはPower AppsからPower Automateに渡すプロンプト（TextInputコントロールに入力されたテキスト）を設定します。

Power Automateからの出力結果を格納するための変数（今回は”OutputText”）を、Set関数で用意します。

２．出力結果を表示するため、「テキストラベル」の「Text」プロパティに、以下のように記載します。

OutputText.output

※OutputTextは変数名、outputは、Power Automateで指定した出力のテキスト名です

３．ここで一旦、プレビューからテスト実行してみます。

質問を入力し、ボタンをクリックすると、以下のようにJSON形式でGPTからの回答が出力されます。

ミムチ

一応成功はしているようですが、JSON形式のままだと、よく分かりませんな…

そこで次に、JSON形式で出力された結果から、必要な部分を取り出して表示するように、Power Automateフローを修正します。

④Power Automateの修正

１．Power Automateフローを選択し、「実行履歴」からテスト実行したフローを選択し、「HTTP」を展開します。

２．「出力」の「本文」のJSONをコピーし、フローの「編集」をクリックします。

３．「HTTP」の後に「データ操作」＞「JSONの解析」のアクションを追加します。

４．「サンプルから生成」をクリックし、２．でコピーしたJSONを貼り付けた後、完了をクリックします。

５．すると、サンプルのJSONから自動でスキーマを作成してくれます。

先ほどHTTPで出力された本文のJSONを見ると、出力結果は、「choices」の中の「content」に入っています。

６．そのため、contentを格納するための変数を追加します。

最初のトリガーの後に「変数の初期化」を追加し、文字列変数「Output」を作成します。

７．JSON解析の後に「変数の設定」を追加し、変数「Output」に、動的なコンテンツから、「JSONの解析」結果の「content」を追加します。

オブジェクトを処理するため、自動的にApply to eachの中に入りますが、今回contentは1つしか出力されないため、気にしなくて大丈夫です。

８．最後に、Power Appsに応答するアクションでoutputに、変数「Output」を入れます。

９．これでフローの修正が完了したので、保存して、再度Power Appsで動作確認してみましょう。

※Power AppsのPower Automateタブで、一旦フローの更新をしておきましょう

以下のように、GPTからの出力結果のみ表示されれば成功です！

ミムチ

ついにPower Appsから、GPTを呼び出すことができましたぞ！

GPT APIで写真を入力する方法

今回実現すること

続いてGPTのAPIを利用して、「画像」を入力し、「テキスト」を出力する方法を解説します。

例えば以下のように、材料の写真をとって、写真から特定した材料を元に、レシピを提案してもらうことができます。

今回実現する内容

Power Appsの画面でカメラを起動して写真を撮り、ボタンをクリックしたら、Power Automateを実行する
Power AutomateのHTTPアクションで、GPTのAPIを呼び出し、写真の説明をテキストで生成し、Power Appsに渡します。

基本的に先ほどのテキストの入力から、テキストを出力する流れと同様ですが、入力するデータが画像データに変わる点と、APIで使うモデルが異なります。

実装方法

①Power Appsの実装

１．Power Appsで先ほど作成した画面を複製して、テキスト入力の代わりに、「挿入」から「メディア」と「カメラ」コントロールを追加します。

２．カメラのか「OnSelect」プロパティには、以下のような関数式を追加します。

Set(TakenPhoto, Camera1.Photo);

Set(imageJSON,JSON(TakenPhoto, JSONFormat.IncludeBinaryData));

Set(ltrim,Right(imageJSON,(Len(imageJSON) -Find (“base64,”,imageJSON)- 6 )));

Set(fbase64,Left(ltrim,(Len(ltrim)- 1 )));

変数「TakenPhoto」に、「カメラコントロール名.Photo」の値を入れると、カメラで撮った写真データを格納することができます。

関数式について詳しくは説明しませんが、画像のバイナリデータをJSON形式にして、余計な部分は除き整形されたものが、最終的にfbase64という変数に格納されます。

３．「挿入」＞メディアの「画像」を選択し、「Image」プロパティに変数「TakenPhoto」を入力します。

こうすると、撮影した写真をこの画像コントロールに表示することができます。

４．動作確認すると、ボタンクリックで、以下のように画像が表示されます。

カメラ付きでないPCの場合は動作確認できないため、スマホか、カメラ付きのPCで実行しましょう

②Power Automateの実装

１．先ほど作ったフローをコピーして一部編集します。

最終的なフローの全体像は、以下のようになります。

１．トリガーの入力は、分かりやすく「PhotoData」に変えます。

２．「HTTP」アクションの「本文」は、以下のように書き換えます。

{
“model”: “gpt-4-vision-preview”,
“messages”: [
{
“role”: “user”,
“content”: [
{
“type”: “text”,
“text”: “この画像について説明してください。”
},
{
“type”: “image_url”,
“image_url”: {
“url”: ＜concat(‘data:image/jpeg;base64,’ triggerBody()[‘text’])＞
}
}
]
}
],
“max_tokens”: 300
}