GPT-4Vで画像に書かれたテキストを読み出す方法を知っている

import base64
from openai import OpenAI

client = OpenAI()

with open("kanji.png", "rb") as fb:
    base64_image = base64.b64encode(fb.read()).decode()

response = client.chat.completions.create(
    model="gpt-4-vision-preview",
    temperature=0,
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "画像の中に日本語でなんと書いてありますか？"},
                {
                    "type": "image_url",
                    "image_url": f"data:image/png;base64,{base64_image}",
                },
            ],
        }
    ],
    max_tokens=1000,
)

# response.choices[0]

ftnext / ocroy

GPT-4Vで画像に書かれたテキストを読み出す方法を知っている #1