Closed 450586509 closed 1 year ago
from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("THUDM/visualglm-6b", trust_remote_code=True) model = AutoModel.from_pretrained("THUDM/visualglm-6b", trust_remote_code=True).half().cuda() image_path = "./examples/1.jpeg"
model.chat(tokenizer, image_path, "用中文描述这张图片。", history=[])[0] Out[3]: '这张照片描绘了一个单个人,正在吃晚餐。画面中有一片草地和一座小山丘,还有一对夫妇在远处看着他们。草地上有一个桌子,桌子上放着食物和饮料,人们正坐在桌子周围用餐。背景中还有一些树木和建筑物的轮廓,暗示着这个地区是一个自然环境良好的社区。'
model.chat(tokenizer, "./examples/2.jpeg", "用中文描述这张图片。", history=[])[0] Out[6]: '这张照片描绘的是一对夫妇在一座小山丘上,正在吃晚餐。他们有一个白色桌子和几个菜,桌子上有水果、蔬菜和一些肉类。天空晴朗,阳光明媚,可以看到远处的山脉。整个场景温馨而宁静,充满了家庭和谐的氛围。'
model.chat(tokenizer, "./examples/3.jpeg", "用中文描述这张图片。", history=[])[0] Out[7]: '这张照片描绘了一对夫妇在一座小山丘上,正在享受晚餐。他们有一个房子,周围有树木和花园。桌子上放着一些食物,包括米饭、蔬菜和一些肉类。这对夫妻穿着简单舒适的衣服,享受着家庭时光。整个场景充满了温馨和谐的氛围。'
https://github.com/THUDM/VisualGLM-6B/issues/208
from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("THUDM/visualglm-6b", trust_remote_code=True) model = AutoModel.from_pretrained("THUDM/visualglm-6b", trust_remote_code=True).half().cuda() image_path = "./examples/1.jpeg"
model.chat(tokenizer, image_path, "用中文描述这张图片。", history=[])[0] Out[3]: '这张照片描绘了一个单个人,正在吃晚餐。画面中有一片草地和一座小山丘,还有一对夫妇在远处看着他们。草地上有一个桌子,桌子上放着食物和饮料,人们正坐在桌子周围用餐。背景中还有一些树木和建筑物的轮廓,暗示着这个地区是一个自然环境良好的社区。'
model.chat(tokenizer, "./examples/2.jpeg", "用中文描述这张图片。", history=[])[0] Out[6]: '这张照片描绘的是一对夫妇在一座小山丘上,正在吃晚餐。他们有一个白色桌子和几个菜,桌子上有水果、蔬菜和一些肉类。天空晴朗,阳光明媚,可以看到远处的山脉。整个场景温馨而宁静,充满了家庭和谐的氛围。'
model.chat(tokenizer, "./examples/3.jpeg", "用中文描述这张图片。", history=[])[0] Out[7]: '这张照片描绘了一对夫妇在一座小山丘上,正在享受晚餐。他们有一个房子,周围有树木和花园。桌子上放着一些食物,包括米饭、蔬菜和一些肉类。这对夫妻穿着简单舒适的衣服,享受着家庭时光。整个场景充满了温馨和谐的氛围。'