om-ai-lab / OmAgent

A multimodal agent framework for solving complex tasks
Apache License 2.0
282 stars 17 forks source link

竟然没有问题,我提一个,最后那个需要配置config.yaml说的不清楚,能给个例子么?另外,不太明白OmDet运行起来后,OmAgent是怎么连上OmDet的 #2

Closed chenxu126 closed 1 month ago

chenxu126 commented 1 month ago

竟然没有问题,我提一个,最后那个需要配置config.yaml说的不清楚,能给个例子么?另外,不太明白OmDet运行起来后,OmAgent是怎么连上OmDet的

XeonHis commented 1 month ago

config.yml配置

config.yml是用来配置workflows中的一些配置项,例如一些连接LLM/Vector DB的信息。 例如workflows/general/llms/gpt4o.json中的$<custom_openai_key::openai_api_key>,custom_openai_key就是一个配置项的名称。 以下是一个config.yml的示例

bing_api_key: your_bing_api_key
custom_openai_endpoint: http://xxx.com/v1
custom_openai_key: your_custom_openai_key
ovd_endpoint: http://xxx/inf_predict
ovd_model_id: OmDet-Turbo_tiny_SWIN_T
milvus_host_url: your_milvus_host_url
port: 19530
alias: default

OmDet运行

OmAgent和OmDet的运行进行了解耦,这两者是通过http请求的方式进行联通的。通过将OmDet启动成一个API服务的方式,向外暴露一个OmDet调用接口的方式让OmAgent进行调用。

chenxu126 commented 1 month ago

必须用openai么?换成其他的开源模型fastapi可以么?

XeonHis commented 1 month ago

只要是和调用OpenAI的请求格式和返回格式相同就可以。 修改custom_openai_endpoint为对应的base_url,程序会自动拼上/chat/completions,custom_openai_key为对应的api_key