支持在用户组维度设置模型的调用频次限制

songquanpeng / one-api

OpenAI 接口管理 & 分发系统，支持 Azure、Anthropic Claude、Google PaLM 2 & Gemini、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问、360 智脑以及腾讯混元，可用于二次分发管理 key，仅单可执行文件，已打包好 Docker 镜像，一键部署，开箱即用. OpenAI key management & redistribution system, using a single API for all LLMs, and features an English UI.

MIT License

19.2k stars 4.29k forks source link

背景

模型提供商openai、Azure、第三方等对模型的调用频次有软性设置。比如：https://platform.openai.com/account/rate-limits

很多第三方模型提供商，可以提供10w+/秒的GPT3.5接口请求，从费率上看，又可以放宽GPT3.5的频次。同时，对GPT4等高消耗Token的模型设置频次限制，也是对终端用户的保护。

需求

可以在用户维度（结合4.0版本特性，在用户分组（级别）维度似乎更有通用性），设置常用模型的调用频次。如：

default: {
   'gpt-3.5' : {2000, SECOND},
   'gpt4': {20, HOUR*3}
}

vip: {
   'gpt-3.5' : {2000, SECOND},
   'gpt4': {60, HOUR*3}
}

songquanpeng / one-api

支持在用户组维度设置模型的调用频次限制 #145

背景

需求