一、系统环境 1.1、操作系统:centos9 1.2、python版本:3.10 1.3、[Langchain-Chatchat]版本: 1.4、emb:bge-large-zh v1.5 1.5、llm: glm-4-9b-chat
二、Xinference: 2.1、创建Xinference虚拟环境(python3 -m venv venv_xinference) 2.2、pip安装,如下: Package Version
Package Version

accelerate 1.1.0 aiofiles 23.2.1 aioprometheus 23.12.0 [... extensive package list truncated for brevity ...]
2.3、启动运行Xinference: Xinference正常使用,使用xinfernce内置对话功能,能够正常进行对话;.
三、[Langchain-Chatchat] 3.1、创建[Langchain-Chatchat]虚拟环境(python3 -m venv venv_Langchain) 3.2、pip安装,如下: Package Version
Package Version

aiohappyeyeballs 2.4.3 aiohttp 3.10.10 aiosignal 1.3.1 [... extensive package list truncated for brevity ...]
默认选用的 LLM 名称
DEFAULT_LLM_MODEL: autodl-tmp-glm-4-9b-chat-id
默认选用的 Embedding 名称
DEFAULT_EMBEDDING_MODEL: bge-large-zh-v1.5
AgentLM模型的名称 (可以不指定,指定之后就锁定进入Agent之后的Chain的模型,不指定就是 DEFAULT_LLM_MODEL)
Agent_MODEL: ''
如果留空则自动使用 DEFAULT_LLM_MODELLLM_MODEL_CONFIG: preprocess_model: model: '' temperature: 0.05 max_tokens: 4096 history_len: 10 prompt_name: default callbacks: false llm_model: model: '' temperature: 0.9 max_tokens: 4096 history_len: 10 prompt_name: default callbacks: true action_model: model: '' temperature: 0.01 max_tokens: 4096 history_len: 10 prompt_name: ChatGLM3 callbacks: true postprocess_model: model: '' temperature: 0.01 max_tokens: 4096 history_len: 10 prompt_name: default callbacks: true image_model: model: sd-turbo size: 256*256
platform_name: xinference
可选值:['xinference', 'ollama', 'oneapi', 'fastchat', 'openai', 'custom openai']
platform_type: xinference
openai api url
api key if available
api_key: EMPTY
API 代理
api_proxy: ''
api_concurrencies: 5
是否自动获取平台可用模型列表。设为 True 时下方不同模型类型可自动检测
auto_detect_model: false
该平台支持的大语言模型列表,auto_detect_model 设为 True 时自动检测
llm_models: []
该平台支持的嵌入模型列表,auto_detect_model 设为 True 时自动检测
embed_models: []
该平台支持的图像生成模型列表,auto_detect_model 设为 True 时自动检测
text2image_models: []
该平台支持的多模态模型列表,auto_detect_model 设为 True 时自动检测
image2text_models: []
该平台支持的重排模型列表,auto_detect_model 设为 True 时自动检测
rerank_models: []
该平台支持的 STT 模型列表,auto_detect_model 设为 True 时自动检测
speech2text_models: []
该平台支持的 TTS 模型列表,auto_detect_model 设为 True 时自动检测
text2speech_models: []
3.5、使用:报错: 多功能对话报错: An error occurred during streaming 2024-11-05 14:22:50.570 | ERROR | chatchat.server.api_server.openai_routes:generator:105 - openai request error: An error occurred during streaming
RAG对话报错: failed to access embed model 'quentinz/bge-large-zh-v1.5': Error raised by inference endpoint: HTTPConnectionPool(host='', port=11434): Max retries exceeded with url: /api/embeddings (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f31a39f7460>: Failed to establish a new connection: [Errno 111] Connection refused'))