songquanpeng / one-api

OpenAI 接口管理 & 分发系统,支持 Azure、Anthropic Claude、Google PaLM 2 & Gemini、智谱 ChatGLM、百度文心一言、讯飞星火认知、阿里通义千问、360 智脑以及腾讯混元,可用于二次分发管理 key,仅单可执行文件,已打包好 Docker 镜像,一键部署,开箱即用. OpenAI key management & redistribution system, using a single API for all LLMs, and features an English UI.
https://openai.justsong.cn/
MIT License
19.2k stars 4.29k forks source link

支持在用户组维度设置模型的调用频次限制 #145

Open caolixiang opened 1 year ago

caolixiang commented 1 year ago

背景

模型提供商openai、Azure、第三方等对模型的调用频次有软性设置。 比如:https://platform.openai.com/account/rate-limits

很多第三方模型提供商,可以提供10w+/秒 的GPT3.5接口请求,从费率上看,又可以放宽GPT3.5的频次。 同时,对GPT4等高消耗Token的模型设置频次限制,也是对终端用户的保护。

需求

可以在用户维度(结合4.0版本特性,在用户分组(级别)维度似乎更有通用性),设置常用模型的调用频次。 如:

default: {
   'gpt-3.5' : {2000, SECOND},
   'gpt4': {20, HOUR*3}
}

vip: {
   'gpt-3.5' : {2000, SECOND},
   'gpt4': {60, HOUR*3}
}
songquanpeng commented 1 year ago

确实有必要,先加入 TODO 了。

chawaa commented 8 months ago

mark