Closed luciaganlulu closed 38 minutes ago
您好,
visualize=True
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61 您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61
请问config文件是跟model_final.pth
一起的那个config.json
么?里面没有visualize
,只有个visual_embed
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61
请问下这个detection_results 是这里的results 嘛?
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问config文件是跟
model_final.pth
一起的那个config.json
么?里面没有visualize
,只有个visual_embed
不是,是configs/layout_detection_layoutlmv3.yaml
里面需要设置visualize=True
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到predict_pdf
来处理PDF文件
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问config文件是跟
model_final.pth
一起的那个config.json
么?里面没有visualize
,只有个visual_embed
不是,是
configs/layout_detection_layoutlmv3.yaml
里面需要设置visualize=True
您好,我这样设置 visualize=True
,执行 python scripts/layout_detection.py --config configs/layout_detection.yaml
后, outputs/layout_detection
里面还是空的,请问是没有保存成功嘛?
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到
predict_pdf
来处理PDF文件
您好,这里我有点没懂,为什么突然说起 predict_pdf
呢?当我像现在这样用 predict_image
的话,这个detection_results 是不是 这个results 直接传参过来的呢?因为前者代码里我没法找到上层函数定义,好像写的有点隐蔽,跳转找不到 ~
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问config文件是跟
model_final.pth
一起的那个config.json
么?里面没有visualize
,只有个visual_embed
不是,是
configs/layout_detection_layoutlmv3.yaml
里面需要设置visualize=True
您好,我这样设置
visualize=True
,执行python scripts/layout_detection.py --config configs/layout_detection.yaml
后,outputs/layout_detection
里面还是空的,请问是没有保存成功嘛?
您好,这里visualize=True
的缩进不对,visualize
是model_config
下的参数
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问config文件是跟
model_final.pth
一起的那个config.json
么?里面没有visualize
,只有个visual_embed
不是,是
configs/layout_detection_layoutlmv3.yaml
里面需要设置visualize=True
您好,我这样设置
visualize=True
,执行python scripts/layout_detection.py --config configs/layout_detection.yaml
后,outputs/layout_detection
里面还是空的,请问是没有保存成功嘛?您好,这里
visualize=True
的缩进不对,visualize
是model_config
下的参数
好的好的可以啦,感谢感谢~
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到
predict_pdf
来处理PDF文件您好,这里我有点没懂,为什么突然说起
predict_pdf
呢?当我像现在这样用predict_image
的话,这个detection_results 是不是 这个results 直接传参过来的呢?因为前者代码里我没法找到上层函数定义,好像写的有点隐蔽,跳转找不到 ~
这个我测试了一下,这两个是一模一样的,我理解的对嘛?
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到
predict_pdf
来处理PDF文件您好,这里我有点没懂,为什么突然说起
predict_pdf
呢?当我像现在这样用predict_image
的话,这个detection_results 是不是 这个results 直接传参过来的呢?因为前者代码里我没法找到上层函数定义,好像写的有点隐蔽,跳转找不到 ~这个我测试了一下,这两个是一模一样的,我理解的对嘛?
这两个函数虽然都是准备好input,然后调用推理,但是传入的input类型不一样,如果您传入的input是一系列或者单个PDF,需要调用predict_pdf
,如果是图片的话需要调用predict_images
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到
predict_pdf
来处理PDF文件您好,这里我有点没懂,为什么突然说起
predict_pdf
呢?当我像现在这样用predict_image
的话,这个detection_results 是不是 这个results 直接传参过来的呢?因为前者代码里我没法找到上层函数定义,好像写的有点隐蔽,跳转找不到 ~这个我测试了一下,这两个是一模一样的,我理解的对嘛?
这两个函数虽然都是准备好input,然后调用推理,但是传入的input类型不一样,如果您传入的input是一系列或者单个PDF,需要调用
predict_pdf
,如果是图片的话需要调用predict_images
嗯嗯,明白了,那就是输入不同使用的函数不同,predict_pdf
和predict_images
这两个函数本质都是调用的predict那个函数,前两者只能接受单一类型输入,后者可以接受多种类型输入,我理解对嘛?
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到
predict_pdf
来处理PDF文件您好,这里我有点没懂,为什么突然说起
predict_pdf
呢?当我像现在这样用predict_image
的话,这个detection_results 是不是 这个results 直接传参过来的呢?因为前者代码里我没法找到上层函数定义,好像写的有点隐蔽,跳转找不到 ~这个我测试了一下,这两个是一模一样的,我理解的对嘛?
这两个函数虽然都是准备好input,然后调用推理,但是传入的input类型不一样,如果您传入的input是一系列或者单个PDF,需要调用
predict_pdf
,如果是图片的话需要调用predict_images
嗯嗯,明白了,那就是输入不同使用的函数不同,
predict_pdf
和predict_images
这两个函数本质都是调用的predict那个函数,前两者只能接受单一类型输入,后者可以接受多种类型输入,我理解对嘛?
是的,如果您传入的是PDF请使用predict_pdf
,如果传入的是图像请使用predict_images
您好,
- 可视化结果,config文件里需要设置
visualize=True
- 推理结果例如
bbox, class, score
等在https://github.com/opendatalab/PDF-Extract-Kit/blob/710f577f308f3604e4450076fc04392d2d11009f/pdf_extract_kit/tasks/layout_detection/models/layoutlmv3.py#L59-L61请问下这个detection_results 是这里的results 嘛?
是的,您可以通过切换到
predict_pdf
来处理PDF文件您好,这里我有点没懂,为什么突然说起
predict_pdf
呢?当我像现在这样用predict_image
的话,这个detection_results 是不是 这个results 直接传参过来的呢?因为前者代码里我没法找到上层函数定义,好像写的有点隐蔽,跳转找不到 ~这个我测试了一下,这两个是一模一样的,我理解的对嘛?
这两个函数虽然都是准备好input,然后调用推理,但是传入的input类型不一样,如果您传入的input是一系列或者单个PDF,需要调用
predict_pdf
,如果是图片的话需要调用predict_images
嗯嗯,明白了,那就是输入不同使用的函数不同,
predict_pdf
和predict_images
这两个函数本质都是调用的predict那个函数,前两者只能接受单一类型输入,后者可以接受多种类型输入,我理解对嘛?是的,如果您传入的是PDF请使用
predict_pdf
,如果传入的是图像请使用predict_images
好的明白了感谢您的耐心解答,非常感谢!
您好,直接运行
python scripts/layout_detection.py --config configs/layout_detection.yaml
的话,只是新建了result_path
路径,并没有存储detection_results
结果,请问如何解析出其中的im_path, boxes, scores, classes
信息呢?检测结果annotated_image
在哪里呢?