Open cr7258 opened 1 week ago
@cr7258 补充两个点:
当所有 api key 都被拉黑之后,不应该返回 api key 都不可用,变成 higress 自身产生的错误,建议是没有可用 api key 时,将所有 api key 都从黑名单中放出
我反而觉得在所有 apikey 不可用时,让 higress 直接返回错误信息是不是会更好? 让用户知道 api key 有问题,应该进行人工干预。
将所有 api key 都从黑名单中放出既不能改变请求失败的结果(因为一旦有 api key 健康检测通过就会被加回来,全放出来还是全部都失败),另外这么做可能也会让逻辑更复杂些。
@cr7258 主要我担心所有 apikey 都被拉黑的情况,可能是我们自身逻辑或者突发网络问题等。所以如果从健壮性上考虑,都被拉黑时一次性都放出来会更合理一些
@johnlanni Ok
例如 qwen-max 限流比较严重,fallback 退化到 qwen-plus 仍然可以使用
避免 ai-proxy 插件自身逻辑有问题误将 apiToken 移除的情况