ChatGPT-4oになってすごいのか?〜画像処理の精度はあがったか?
対応スピードが上がってきたのはありがたいですね。嘘を付く頻度も減ってきたような気がしますし、今まで以上に自然に嘘をついてきている気もします。今回は画像処理について試してみました。
画像
画像をChatGPTにアップしてみました。まあ、実際はパワポで作った資料をJPGにしてアップしただけですが。
アップロードした画像を詳細に説明してください。
→出力結果は以下の通り、しっかり説明できていますね。
この画像は、「検索と生成AIはすでに融合し始めている」というテーマについて説明する図です。図は3つのセクションに分かれています。
- 検索(左側):
- タイトル: 「検索」
- 説明: 「Googleなど」
- プロセス:
- 検索ボックスにキーワードを入力して検索を行う。
- 検索エンジン(辞書のアイコンで示されている)がキーワードに応じたランキング化した結果を表示する。
- 最終的に検索結果が表示される(ピンク色のウィンドウで表現)。
- 生成AI(中央):
- タイトル: 「生成AI」
- 説明: 「ChatGPT」
- プロセス:
- ユーザーが質問をする。
- 生成AI(歯車のアイコンが入った頭のイラストで示されている)が事前に学習したデータを基に回答を生成する。
- 学習した内容から統計的に回答を生成する(ピンク色のウィンドウで表現)。
- 検索 + 生成AI(右側):
- タイトル: 「検索 + 生成AI」
- 説明: 「ChatGPT(有料版)やCoPilotProやGemini」
- プロセス:
- ユーザーが質問をする。
- 生成AIが質問に答える際、必要に応じて最新の情報を検索するために検索エンジンを使用する。
- 生成AIはブラウジング機能を持ち、検索エンジンと連携する。
- 生成AIは生成した内容と検索した内容を融合して回答を提供する(ピンク色のウィンドウで表現)。
この図は、従来の検索エンジンと生成AIがどのように異なるのか、またそれらがどのように組み合わさることでより高度な情報提供が可能になるのかを視覚的に説明しています。
上記の図表の説明内容をイラストにしてとお願いしてみました。
なんじゃこりゃーー
アップロードした画像をパワーポイントにしてください。
とお願いしたところ、単に画像を貼り付けたパワポになったので、改めて詳細にプロンプトで指示しました。
→ この画像をパワーポイントにしてください。画像のままではなく、パワーポイントのオブジェクトにしてください。画像内のテキストもテキストデータにしてください。
その結果ダウンロードできたパワポはこちらです。
文字のOCRはできていますね。パワーポイントの生成としてはちょっとデザインとか、オブジェクトとかが全然だめですが。
ただスキャナソフトでOCRするより、ChatGPTでやらせたほうがスムーズに行きそうな気もします。
そんなところで。