PaddlePaddle / PaddleOCR

Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)
https://paddlepaddle.github.io/PaddleOCR/
Apache License 2.0
43.02k stars 7.72k forks source link

表格识别训练, 数据问题 #7857

Closed LeFuGang closed 1 year ago

LeFuGang commented 1 year ago

请提供下述完整信息以便快速定位问题/Please provide the following information to quickly locate the problem

这是我报的数据问题,我想问下是什么问题? 我用的paddlelabel工具标注生成的标注文件,bbox我改成4个点的了,

WenmuZhou commented 1 year ago

你标注的时候标注了空白单元格吗,对单元格进行排序了没

LeFuGang commented 1 year ago

你标注的时候标注了空白单元格吗,对单元格进行排序了没

标注了尼, 有排序了

LeFuGang commented 1 year ago

已解决

DYJNG commented 1 year ago

已解决

您好,我也遇到了类似的问题,请问您是如何解决的呢?

TasneemVKhan commented 1 year ago

solved

Hello, I also encountered a similar problem, how did you solve it?

Hi, did you solve the error? I have the same problem?

Mrfuhang commented 1 year ago

已解决

怎么解决的啊 老哥

mm23mm commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

mm23mm commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

mk25499 commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

我用的paddlelabel工具标注生成的标注文件,不一样的话需要自己手动修改吗,还是怎么办呀

mk25499 commented 1 year ago

已解决

你好,我也遇到同样问题,想问下怎么解决的呀!

mm23mm commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

我用的paddlelabel工具标注生成的标注文件,不一样的话需要自己手动修改吗,还是怎么办呀

我最后是手动修改的标注文件

mk25499 commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

我用的paddlelabel工具标注生成的标注文件,不一样的话需要自己手动修改吗,还是怎么办呀

我最后是手动修改的标注文件

我还是有问题,我的gt.txt里的structure 数量和cell数量是一致的,这是我单张的标记,可以帮忙看下吗?{"filename": "7.png", "html": {"structure": {"tokens": ["", "", "<td", " colspan=\"7\"", ">", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", ""]}, "cells": [{"tokens": ["概", "算", "审", "定", "表"], "bbox": [[355, 9], [516, 9], [516, 43], [355, 43]]}, {"tokens": ["项", "目", "名", "称", ":", "(", "一", "二", "三", "四", ")"], "bbox": [[115, 102], [764, 102], [764, 122], [115, 122]]}, {"tokens": ["单", "位", ":", "万", "元"], "bbox": [[114, 139], [206, 139], [206, 164], [114, 164]]}, {"tokens": ["序", "号"], "bbox": [[134, 172], [174, 172], [174, 199], [134, 199]]}, {"tokens": ["工", "程", "或", "费", "用", "名", "称"], "bbox": [[221, 173], [348, 173], [348, 198], [221, 198]]}, {"tokens": ["报", "审", "金", "额"], "bbox": [[393, 174], [469, 174], [469, 198], [393, 198]]}, {"tokens": ["审", "定", "金", "额"], "bbox": [[493, 173], [567, 173], [567, 197], [493, 197]]}, {"tokens": ["调", "整", "金", "额"], "bbox": [[591, 172], [666, 172], [666, 199], [591, 199]]}, {"tokens": ["备", "注"], "bbox": [[698, 173], [739, 173], [739, 199], [698, 199]]}, {"tokens": ["一"], "bbox": [[134, 210], [174, 210], [174, 237], [134, 237]]}, {"tokens": ["工", "程", "费", "用"], "bbox": [[194, 212], [267, 212], [267, 235], [194, 235]]}, {"tokens": ["7", "3", "5", "4", ".", "9", "6"], "bbox": [[399, 215], [461, 215], [461, 235], [399, 235]]}, {"tokens": ["6", "9", "6", "3", ".", "2", "0"], "bbox": [[498, 215], [561, 215], [561, 234], [498, 234]]}, {"tokens": ["-", "3", "9", "1", ".", "7", "6"], "bbox": [[599, 215], [658, 215], [658, 235], [599, 235]]}, {"tokens": [], "bbox": [[686, 215], [745, 215], [745, 235], [686, 235]]}, {"tokens": ["1", "."], "bbox": [[147, 253], [163, 253], [163, 274], [147, 274]]}, {"tokens": ["道", "路", "工", "程"], "bbox": [[195, 251], [265, 251], [265, 272], [195, 272]]}, {"tokens": ["6", "5", "6", ".", "4", "7"], "bbox": [[403, 252], [456, 252], [456, 273], [403, 273]]}, {"tokens": ["6", "2", "4", ".", "4", "8"], "bbox": [[503, 252], [557, 252], [557, 273], [503, 273]]}, {"tokens": ["-", "3", "1", ".", "9", "9"], "bbox": [[604, 252], [653, 252], [653, 274], [604, 274]]}, {"tokens": [], "bbox": [[682, 249], [741, 249], [741, 269], [682, 269]]}, {"tokens": ["2"], "bbox": [[146, 290], [162, 290], [162, 310], [146, 310]]}, {"tokens": ["桥", "梁", "工", "程"], "bbox": [[193, 288], [267, 288], [267, 311], [193, 311]]}, {"tokens": ["5", "5", "5", "1", ".", "3", "7"], "bbox": [[399, 289], [461, 289], [461, 309], [399, 309]]}, {"tokens": ["5", "2", "1", "6", ".", "9", "9"], "bbox": [[498, 290], [560, 290], [560, 310], [498, 310]]}, {"tokens": ["-", "3", "3", "4", ".", "3", "8"], "bbox": [[600, 291], [657, 291], [657, 311], [600, 311]]}, {"tokens": [], "bbox": [[681, 286], [740, 286], [740, 306], [681, 306]]}, {"tokens": ["2", ".", "1", " "], "bbox": [[138, 326], [167, 326], [167, 351], [138, 351]]}, {"tokens": ["西", "桥"], "bbox": [[193, 324], [232, 324], [232, 350], [193, 350]]}, {"tokens": ["2", "7", "3", "2", ".", "9", "5"], "bbox": [[397, 327], [460, 327], [460, 348], [397, 348]]}, {"tokens": ["2", "5", "5", "8", ".", "9", "4"], "bbox": [[497, 327], [561, 327], [561, 348], [497, 348]]}, {"tokens": ["-", "1", "7", "4", ".", "0", "1"], "bbox": [[598, 327], [656, 327], [656, 348], [598, 348]]}, {"tokens": [], "bbox": [[681, 324], [740, 324], [740, 344], [681, 344]]}, {"tokens": ["2", ".", "2"], "bbox": [[139, 365], [168, 365], [168, 387], [139, 387]]}, {"tokens": ["东", "桥"], "bbox": [[193, 362], [231, 362], [231, 388], [193, 388]]}, {"tokens": ["2", "8", "1", "8", ".", "4", "2"], "bbox": [[399, 366], [460, 366], [460, 386], [399, 386]]}, {"tokens": ["2", "6", "5", "8", ".", "0", "5"], "bbox": [[498, 366], [561, 366], [561, 386], [498, 386]]}, {"tokens": ["-", "1", "6", "0", ".", "3", "7"], "bbox": [[600, 366], [657, 366], [657, 386], [600, 386]]}, {"tokens": [], "bbox": [[683, 366], [742, 366], [742, 386], [683, 386]]}, {"tokens": ["3"], "bbox": [[146, 403], [161, 403], [161, 423], [146, 423]]}, {"tokens": ["结", "构", "工", "程"], "bbox": [[193, 401], [266, 401], [266, 425], [193, 425]]}, {"tokens": ["2", "4", "1", ".", "1", "4"], "bbox": [[401, 401], [458, 401], [458, 425], [401, 425]]}, {"tokens": ["2", "3", "6", ".", "4", "8"], "bbox": [[501, 403], [556, 403], [556, 424], [501, 424]]}, {"tokens": ["-", "4", ".", "6", "6"], "bbox": [[608, 402], [648, 402], [648, 424], [608, 424]]}, {"tokens": [], "bbox": [[682, 405], [741, 405], [741, 425], [682, 425]]}, {"tokens": ["4"], "bbox": [[146, 441], [162, 441], [162, 460], [146, 460]]}, {"tokens": ["排", "水", "工", "程"], "bbox": [[192, 439], [266, 439], [266, 462], [192, 462]]}, {"tokens": ["6", "5", ".", "2", "0"], "bbox": [[406, 441], [452, 441], [452, 461], [406, 461]]}, {"tokens": ["6", "4", ".", "9", "4"], "bbox": [[506, 441], [553, 441], [553, 461], [506, 461]]}, {"tokens": ["-", "0", ".", "2", "6"], "bbox": [[607, 440], [648, 440], [648, 461], [607, 461]]}, {"tokens": [], "bbox": [[684, 440], [743, 440], [743, 460], [684, 460]]}, {"tokens": ["5"], "bbox": [[146, 478], [162, 478], [162, 500], [146, 500]]}, {"tokens": ["照", "明", "及", "亮", "化", "工", "程"], "bbox": [[193, 477], [319, 477], [319, 500], [193, 500]]}, {"tokens": ["1", "2", "9", ".", "2", "9"], "bbox": [[405, 478], [456, 478], [456, 500], [405, 500]]}, {"tokens": ["1", "2", "6", ".", "3", "1"], "bbox": [[503, 478], [555, 478], [555, 500], [503, 500]]}, {"tokens": ["-", "2", ".", "9", "8"], "bbox": [[608, 478], [648, 478], [648, 500], [608, 500]]}, {"tokens": [], "bbox": [[685, 480], [744, 480], [744, 500], [685, 500]]}, {"tokens": ["6"], "bbox": [[146, 517], [161, 517], [161, 536], [146, 536]]}, {"tokens": ["交", "通", "工", "程"], "bbox": [[194, 516], [265, 516], [265, 536], [194, 536]]}, {"tokens": ["1", "8", ".", "8", "3"], "bbox": [[408, 516], [451, 516], [451, 537], [408, 537]]}, {"tokens": ["1", "8", ".", "3", "4"], "bbox": [[506, 516], [552, 516], [552, 537], [506, 537]]}, {"tokens": ["-", "0", ".", "4", "9"], "bbox": [[608, 516], [648, 516], [648, 537], [608, 537]]}, {"tokens": [], "bbox": [[683, 516], [742, 516], [742, 536], [683, 536]]}, {"tokens": ["7"], "bbox": [[146, 553], [161, 553], [161, 574], [146, 574]]}, {"tokens": ["景", "观", "装", "饰", "工", "程"], "bbox": [[193, 552], [302, 552], [302, 575], [193, 575]]}, {"tokens": ["4", "9", "9", ".", "5", "6"], "bbox": [[404, 555], [456, 555], [456, 573], [404, 573]]}, {"tokens": ["4", "8", "2", ".", "5", "6"], "bbox": [[503, 555], [555, 555], [555, 573], [503, 573]]}, {"tokens": ["-", "1", "7", ".", "0", "0"], "bbox": [[603, 554], [652, 554], [652, 575], [603, 575]]}, {"tokens": [], "bbox": [[684, 555], [743, 555], [743, 575], [684, 575]]}, {"tokens": ["8"], "bbox": [[146, 593], [161, 593], [161, 612], [146, 612]]}, {"tokens": ["绿", "化", "工", "程"], "bbox": [[194, 592], [265, 592], [265, 612], [194, 612]]}, {"tokens": ["4", "3", ".", "1", "0"], "bbox": [[407, 592], [452, 592], [452, 613], [407, 613]]}, {"tokens": ["4", "3", ".", "1", "0"], "bbox": [[506, 592], [553, 592], [553, 613], [506, 613]]}, {"tokens": ["0", ".", "0", "0"], "bbox": [[608, 592], [645, 592], [645, 613], [608, 613]]}, {"tokens": [], "bbox": [[686, 591], [745, 591], [745, 611], [686, 611]]}, {"tokens": ["9"], "bbox": [[145, 630], [161, 630], [161, 650], [145, 650]]}, {"tokens": ["管", "线", "工", "程", "(", "电", "力", "、", "通", "信", ")"], "bbox": [[194, 628], [376, 628], [376, 651], [194, 651]]}, {"tokens": ["1", "5", "0", ".", "0", "0"], "bbox": [[404, 629], [456, 629], [456, 651], [404, 651]]}, {"tokens": ["1", "5", "0", ".", "0", "0"], "bbox": [[502, 628], [557, 628], [557, 652], [502, 652]]}, {"tokens": ["0", ".", "0", "0"], "bbox": [[608, 629], [645, 629], [645, 651], [608, 651]]}, {"tokens": [], "bbox": [[685, 633], [744, 633], [744, 653], [685, 653]]}, {"tokens": ["二"], "bbox": [[143, 665], [163, 665], [163, 691], [143, 691]]}, {"tokens": ["工", "程", "建", "设", "其", "他", "费", "用"], "bbox": [[194, 666], [338, 666], [338, 688], [194, 688]]}, {"tokens": ["7", "7", "1", ".", "9", "2"], "bbox": [[402, 668], [456, 668], [456, 688], [402, 688]]}, {"tokens": ["6", "6", "8", ".", "5", "2"], "bbox": [[502, 668], [556, 668], [556, 688], [502, 688]]}, {"tokens": ["-", "1", "0", "3", ".", "4", "0"], "bbox": [[598, 668], [657, 668], [657, 688], [598, 688]]}, {"tokens": [], "bbox": [[686, 671], [745, 671], [745, 691], [686, 691]]}, {"tokens": ["1"], "bbox": [[146, 706], [160, 706], [160, 726], [146, 726]]}, {"tokens": ["建", "设", "管", "理", "费"], "bbox": [[194, 705], [282, 705], [282, 726], [194, 726]]}, {"tokens": ["2", "5", "3", ".", "7", "1"], "bbox": [[402, 705], [453, 705], [453, 727], [402, 727]]}, {"tokens": ["2", "1", "5", ".", "6", "9"], "bbox": [[500, 704], [557, 704], [557, 728], [500, 728]]}, {"tokens": ["-", "3", "8", ".", "0", "2"], "bbox": [[603, 705], [652, 705], [652, 727], [603, 727]]}, {"tokens": [], "bbox": [[686, 705], [745, 705], [745, 725], [686, 725]]}, {"tokens": ["1", ".", "1"], "bbox": [[138, 742], [167, 742], [167, 765], [138, 765]]}, {"tokens": ["建", "设", "单", "位", "管", "理", "费"], "bbox": [[193, 742], [319, 742], [319, 764], [193, 764]]}, {"tokens": ["1", "3", "3", ".", "1", "1"], "bbox": [[403, 743], [453, 743], [453, 764], [403, 764]]}, {"tokens": ["1", "0", "3", ".", "5", "6"], "bbox": [[501, 742], [557, 742], [557, 765], [501, 765]]}, {"tokens": ["-", "2", "9", ".", "5", "5"], "bbox": [[604, 743], [652, 743], [652, 764], [604, 764]]}, {"tokens": [], "bbox": [[685, 747], [744, 747], [744, 767], [685, 767]]}, {"tokens": ["1", ".", "2"], "bbox": [[139, 780], [168, 780], [168, 803], [139, 803]]}, {"tokens": ["工", "程", "建", "设", "监", "理", "费"], "bbox": [[194, 781], [318, 781], [318, 801], [194, 801]]}, {"tokens": ["1", "2", "0", ".", "6", "0"], "bbox": [[404, 781], [456, 781], [456, 802], [404, 802]]}, {"tokens": ["1", "1", "2", ".", "1", "3"], "bbox": [[502, 781], [555, 781], [555, 802], [502, 802]]}, {"tokens": ["-", "8", ".", "4", "7"], "bbox": [[605, 781], [648, 781], [648, 802], [605, 802]]}, {"tokens": [], "bbox": [[683, 782], [742, 782], [742, 802], [683, 802]]}, {"tokens": ["2"], "bbox": [[144, 820], [160, 820], [160, 840], [144, 840]]}, {"tokens": ["项", "目", "前", "期", "咨", "询", "费"], "bbox": [[194, 820], [318, 820], [318, 839], [194, 839]]}, {"tokens": ["2", "4", ".", "0", "7"], "bbox": [[406, 820], [450, 820], [450, 840], [406, 840]]}, {"tokens": ["2", "3", ".", "8", "0"], "bbox": [[505, 820], [551, 820], [551, 840], [505, 840]]}, {"tokens": ["-", "0", ".", "2", "7"], "bbox": [[607, 819], [647, 819], [647, 840], [607, 840]]}, {"tokens": [], "bbox": [[682, 823], [741, 823], [741, 843], [682, 843]]}, {"tokens": ["2", ".", "1"], "bbox": [[137, 856], [166, 856], [166, 879], [137, 879]]}, {"tokens": ["项", "目", "建", "议", "书", "编", "审", "费"], "bbox": [[194, 857], [336, 857], [336, 877], [194, 877]]}, {"tokens": ["8", ".", "8", "3"], "bbox": [[409, 856], [445, 856], [445, 878], [409, 878]]}, {"tokens": ["8", ".", "7", "7"], "bbox": [[509, 856], [548, 856], [548, 878], [509, 878]]}, {"tokens": ["-", "0", ".", "0", "6"], "bbox": [[607, 856], [648, 856], [648, 878], [607, 878]]}, {"tokens": [], "bbox": [[679, 852], [738, 852], [738, 872], [679, 872]]}, {"tokens": ["2", ".", "2"], "bbox": [[137, 894], [168, 894], [168, 916], [137, 916]]}, {"tokens": ["可", "行", "性", "研", "究", "报", "告", "编", "制", "费"], "bbox": [[195, 895], [371, 895], [371, 914], [195, 914]]}, {"tokens": ["1", "5", ".", "2", "4"], "bbox": [[406, 895], [450, 895], [450, 915], [406, 915]]}, {"tokens": ["1", "5", ".", "0", "3"], "bbox": [[505, 895], [550, 895], [550, 915], [505, 915]]}, {"tokens": ["-", "0", ".", "2", "1"], "bbox": [[606, 895], [646, 895], [646, 915], [606, 915]]}, {"tokens": [], "bbox": [[683, 895], [742, 895], [742, 915], [683, 915]]}]}, "gt": "

<td colspan=\"7\">
概算审定表项目名称:(一二三四)单位:万元序号
工程或费用名称报审金额审定金额调整金额备注工程费用
7354.966963.20-391.761.道路工程656.47
624.48-31.992桥梁工程5551.375216.99
-334.382.1 西桥2732.952558.94-174.01
2.2东桥2818.422658.05-160.37
3结构工程241.14236.48-4.664
排水工程65.2064.94-0.265照明及亮化工程
129.29126.31-2.986交通工程18.83
18.34-0.497景观装饰工程499.56482.56
-17.008绿化工程43.1043.100.00
9管线工程(电力、通信)150.00150.000.00
工程建设其他费用771.92668.52-103.401
建设管理费253.71215.69-38.021.1建设单位管理费
133.11103.56-29.551.2工程建设监理费120.60
112.13-8.472项目前期咨询费24.0723.80
-0.272.1项目建议书编审费8.838.77-0.06
2.2可行性研究报告编制费15.2415.03-0.21
"}

mm23mm commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

我用的paddlelabel工具标注生成的标注文件,不一样的话需要自己手动修改吗,还是怎么办呀

我最后是手动修改的标注文件

我还是有问题,我的gt.txt里的structure 数量和cell数量是一致的,这是我单张的标记,可以帮忙看下吗?{"filename": "7.png", "html": {"structure": {"tokens": ["", "", "<td", " colspan="7"", ">", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", "", ""]}, "cells": [{"tokens": ["概", "算", "审", "定", "表"], "bbox": [[355, 9], [516, 9], [516, 43], [355, 43]]}, {"tokens": ["项", "目", "名", "称", ":", "(", "一", "二", "三", "四", ")"], "bbox": [[115, 102], [764, 102], [764, 122], [115, 122]]}, {"tokens": ["单", "位", ":", "万", "元"], "bbox": [[114, 139], [206, 139], [206, 164], [114, 164]]}, {"tokens": ["序", "号"], "bbox": [[134, 172], [174, 172], [174, 199], [134, 199]]}, {"tokens": ["工", "程", "或", "费", "用", "名", "称"], "bbox": [[221, 173], [348, 173], [348, 198], [221, 198]]}, {"tokens": ["报", "审", "金", "额"], "bbox": [[393, 174], [469, 174], [469, 198], [393, 198]]}, {"tokens": ["审", "定", "金", "额"], "bbox": [[493, 173], [567, 173], [567, 197], [493, 197]]}, {"tokens": ["调", "整", "金", "额"], "bbox": [[591, 172], [666, 172], [666, 199], [591, 199]]}, {"tokens": ["备", "注"], "bbox": [[698, 173], [739, 173], [739, 199], [698, 199]]}, {"tokens": ["一"], "bbox": [[134, 210], [174, 210], [174, 237], [134, 237]]}, {"tokens": ["工", "程", "费", "用"], "bbox": [[194, 212], [267, 212], [267, 235], [194, 235]]}, {"tokens": ["7", "3", "5", "4", ".", "9", "6"], "bbox": [[399, 215], [461, 215], [461, 235], [399, 235]]}, {"tokens": ["6", "9", "6", "3", ".", "2", "0"], "bbox": [[498, 215], [561, 215], [561, 234], [498, 234]]}, {"tokens": ["-", "3", "9", "1", ".", "7", "6"], "bbox": [[599, 215], [658, 215], [658, 235], [599, 235]]}, {"tokens": [], "bbox": [[686, 215], [745, 215], [745, 235], [686, 235]]}, {"tokens": ["1", "."], "bbox": [[147, 253], [163, 253], [163, 274], [147, 274]]}, {"tokens": ["道", "路", "工", "程"], "bbox": [[195, 251], [265, 251], [265, 272], [195, 272]]}, {"tokens": ["6", "5", "6", ".", "4", "7"], "bbox": [[403, 252], [456, 252], [456, 273], [403, 273]]}, {"tokens": ["6", "2", "4", ".", "4", "8"], "bbox": [[503, 252], [557, 252], [557, 273], [503, 273]]}, {"tokens": ["-", "3", "1", ".", "9", "9"], "bbox": [[604, 252], [653, 252], [653, 274], [604, 274]]}, {"tokens": [], "bbox": [[682, 249], [741, 249], [741, 269], [682, 269]]}, {"tokens": ["2"], "bbox": [[146, 290], [162, 290], [162, 310], [146, 310]]}, {"tokens": ["桥", "梁", "工", "程"], "bbox": [[193, 288], [267, 288], [267, 311], [193, 311]]}, {"tokens": ["5", "5", "5", "1", ".", "3", "7"], "bbox": [[399, 289], [461, 289], [461, 309], [399, 309]]}, {"tokens": ["5", "2", "1", "6", ".", "9", "9"], "bbox": [[498, 290], [560, 290], [560, 310], [498, 310]]}, {"tokens": ["-", "3", "3", "4", ".", "3", "8"], "bbox": [[600, 291], [657, 291], [657, 311], [600, 311]]}, {"tokens": [], "bbox": [[681, 286], [740, 286], [740, 306], [681, 306]]}, {"tokens": ["2", ".", "1", " "], "bbox": [[138, 326], [167, 326], [167, 351], [138, 351]]}, {"tokens": ["西", "桥"], "bbox": [[193, 324], [232, 324], [232, 350], [193, 350]]}, {"tokens": ["2", "7", "3", "2", ".", "9", "5"], "bbox": [[397, 327], [460, 327], [460, 348], [397, 348]]}, {"tokens": ["2", "5", "5", "8", ".", "9", "4"], "bbox": [[497, 327], [561, 327], [561, 348], [497, 348]]}, {"tokens": ["-", "1", "7", "4", ".", "0", "1"], "bbox": [[598, 327], [656, 327], [656, 348], [598, 348]]}, {"tokens": [], "bbox": [[681, 324], [740, 324], [740, 344], [681, 344]]}, {"tokens": ["2", ".", "2"], "bbox": [[139, 365], [168, 365], [168, 387], [139, 387]]}, {"tokens": ["东", "桥"], "bbox": [[193, 362], [231, 362], [231, 388], [193, 388]]}, {"tokens": ["2", "8", "1", "8", ".", "4", "2"], "bbox": [[399, 366], [460, 366], [460, 386], [399, 386]]}, {"tokens": ["2", "6", "5", "8", ".", "0", "5"], "bbox": [[498, 366], [561, 366], [561, 386], [498, 386]]}, {"tokens": ["-", "1", "6", "0", ".", "3", "7"], "bbox": [[600, 366], [657, 366], [657, 386], [600, 386]]}, {"tokens": [], "bbox": [[683, 366], [742, 366], [742, 386], [683, 386]]}, {"tokens": ["3"], "bbox": [[146, 403], [161, 403], [161, 423], [146, 423]]}, {"tokens": ["结", "构", "工", "程"], "bbox": [[193, 401], [266, 401], [266, 425], [193, 425]]}, {"tokens": ["2", "4", "1", ".", "1", "4"], "bbox": [[401, 401], [458, 401], [458, 425], [401, 425]]}, {"tokens": ["2", "3", "6", ".", "4", "8"], "bbox": [[501, 403], [556, 403], [556, 424], [501, 424]]}, {"tokens": ["-", "4", ".", "6", "6"], "bbox": [[608, 402], [648, 402], [648, 424], [608, 424]]}, {"tokens": [], "bbox": [[682, 405], [741, 405], [741, 425], [682, 425]]}, {"tokens": ["4"], "bbox": [[146, 441], [162, 441], [162, 460], [146, 460]]}, {"tokens": ["排", "水", "工", "程"], "bbox": [[192, 439], [266, 439], [266, 462], [192, 462]]}, {"tokens": ["6", "5", ".", "2", "0"], "bbox": [[406, 441], [452, 441], [452, 461], [406, 461]]}, {"tokens": ["6", "4", ".", "9", "4"], "bbox": [[506, 441], [553, 441], [553, 461], [506, 461]]}, {"tokens": ["-", "0", ".", "2", "6"], "bbox": [[607, 440], [648, 440], [648, 461], [607, 461]]}, {"tokens": [], "bbox": [[684, 440], [743, 440], [743, 460], [684, 460]]}, {"tokens": ["5"], "bbox": [[146, 478], [162, 478], [162, 500], [146, 500]]}, {"tokens": ["照", "明", "及", "亮", "化", "工", "程"], "bbox": [[193, 477], [319, 477], [319, 500], [193, 500]]}, {"tokens": ["1", "2", "9", ".", "2", "9"], "bbox": [[405, 478], [456, 478], [456, 500], [405, 500]]}, {"tokens": ["1", "2", "6", ".", "3", "1"], "bbox": [[503, 478], [555, 478], [555, 500], [503, 500]]}, {"tokens": ["-", "2", ".", "9", "8"], "bbox": [[608, 478], [648, 478], [648, 500], [608, 500]]}, {"tokens": [], "bbox": [[685, 480], [744, 480], [744, 500], [685, 500]]}, {"tokens": ["6"], "bbox": [[146, 517], [161, 517], [161, 536], [146, 536]]}, {"tokens": ["交", "通", "工", "程"], "bbox": [[194, 516], [265, 516], [265, 536], [194, 536]]}, {"tokens": ["1", "8", ".", "8", "3"], "bbox": [[408, 516], [451, 516], [451, 537], [408, 537]]}, {"tokens": ["1", "8", ".", "3", "4"], "bbox": [[506, 516], [552, 516], [552, 537], [506, 537]]}, {"tokens": ["-", "0", ".", "4", "9"], "bbox": [[608, 516], [648, 516], [648, 537], [608, 537]]}, {"tokens": [], "bbox": [[683, 516], [742, 516], [742, 536], [683, 536]]}, {"tokens": ["7"], "bbox": [[146, 553], [161, 553], [161, 574], [146, 574]]}, {"tokens": ["景", "观", "装", "饰", "工", "程"], "bbox": [[193, 552], [302, 552], [302, 575], [193, 575]]}, {"tokens": ["4", "9", "9", ".", "5", "6"], "bbox": [[404, 555], [456, 555], [456, 573], [404, 573]]}, {"tokens": ["4", "8", "2", ".", "5", "6"], "bbox": [[503, 555], [555, 555], [555, 573], [503, 573]]}, {"tokens": ["-", "1", "7", ".", "0", "0"], "bbox": [[603, 554], [652, 554], [652, 575], [603, 575]]}, {"tokens": [], "bbox": [[684, 555], [743, 555], [743, 575], [684, 575]]}, {"tokens": ["8"], "bbox": [[146, 593], [161, 593], [161, 612], [146, 612]]}, {"tokens": ["绿", "化", "工", "程"], "bbox": [[194, 592], [265, 592], [265, 612], [194, 612]]}, {"tokens": ["4", "3", ".", "1", "0"], "bbox": [[407, 592], [452, 592], [452, 613], [407, 613]]}, {"tokens": ["4", "3", ".", "1", "0"], "bbox": [[506, 592], [553, 592], [553, 613], [506, 613]]}, {"tokens": ["0", ".", "0", "0"], "bbox": [[608, 592], [645, 592], [645, 613], [608, 613]]}, {"tokens": [], "bbox": [[686, 591], [745, 591], [745, 611], [686, 611]]}, {"tokens": ["9"], "bbox": [[145, 630], [161, 630], [161, 650], [145, 650]]}, {"tokens": ["管", "线", "工", "程", "(", "电", "力", "、", "通", "信", ")"], "bbox": [[194, 628], [376, 628], [376, 651], [194, 651]]}, {"tokens": ["1", "5", "0", ".", "0", "0"], "bbox": [[404, 629], [456, 629], [456, 651], [404, 651]]}, {"tokens": ["1", "5", "0", ".", "0", "0"], "bbox": [[502, 628], [557, 628], [557, 652], [502, 652]]}, {"tokens": ["0", ".", "0", "0"], "bbox": [[608, 629], [645, 629], [645, 651], [608, 651]]}, {"tokens": [], "bbox": [[685, 633], [744, 633], [744, 653], [685, 653]]}, {"tokens": ["二"], "bbox": [[143, 665], [163, 665], [163, 691], [143, 691]]}, {"tokens": ["工", "程", "建", "设", "其", "他", "费", "用"], "bbox": [[194, 666], [338, 666], [338, 688], [194, 688]]}, {"tokens": ["7", "7", "1", ".", "9", "2"], "bbox": [[402, 668], [456, 668], [456, 688], [402, 688]]}, {"tokens": ["6", "6", "8", ".", "5", "2"], "bbox": [[502, 668], [556, 668], [556, 688], [502, 688]]}, {"tokens": ["-", "1", "0", "3", ".", "4", "0"], "bbox": [[598, 668], [657, 668], [657, 688], [598, 688]]}, {"tokens": [], "bbox": [[686, 671], [745, 671], [745, 691], [686, 691]]}, {"tokens": ["1"], "bbox": [[146, 706], [160, 706], [160, 726], [146, 726]]}, {"tokens": ["建", "设", "管", "理", "费"], "bbox": [[194, 705], [282, 705], [282, 726], [194, 726]]}, {"tokens": ["2", "5", "3", ".", "7", "1"], "bbox": [[402, 705], [453, 705], [453, 727], [402, 727]]}, {"tokens": ["2", "1", "5", ".", "6", "9"], "bbox": [[500, 704], [557, 704], [557, 728], [500, 728]]}, {"tokens": ["-", "3", "8", ".", "0", "2"], "bbox": [[603, 705], [652, 705], [652, 727], [603, 727]]}, {"tokens": [], "bbox": [[686, 705], [745, 705], [745, 725], [686, 725]]}, {"tokens": ["1", ".", "1"], "bbox": [[138, 742], [167, 742], [167, 765], [138, 765]]}, {"tokens": ["建", "设", "单", "位", "管", "理", "费"], "bbox": [[193, 742], [319, 742], [319, 764], [193, 764]]}, {"tokens": ["1", "3", "3", ".", "1", "1"], "bbox": [[403, 743], [453, 743], [453, 764], [403, 764]]}, {"tokens": ["1", "0", "3", ".", "5", "6"], "bbox": [[501, 742], [557, 742], [557, 765], [501, 765]]}, {"tokens": ["-", "2", "9", ".", "5", "5"], "bbox": [[604, 743], [652, 743], [652, 764], [604, 764]]}, {"tokens": [], "bbox": [[685, 747], [744, 747], [744, 767], [685, 767]]}, {"tokens": ["1", ".", "2"], "bbox": [[139, 780], [168, 780], [168, 803], [139, 803]]}, {"tokens": ["工", "程", "建", "设", "监", "理", "费"], "bbox": [[194, 781], [318, 781], [318, 801], [194, 801]]}, {"tokens": ["1", "2", "0", ".", "6", "0"], "bbox": [[404, 781], [456, 781], [456, 802], [404, 802]]}, {"tokens": ["1", "1", "2", ".", "1", "3"], "bbox": [[502, 781], [555, 781], [555, 802], [502, 802]]}, {"tokens": ["-", "8", ".", "4", "7"], "bbox": [[605, 781], [648, 781], [648, 802], [605, 802]]}, {"tokens": [], "bbox": [[683, 782], [742, 782], [742, 802], [683, 802]]}, {"tokens": ["2"], "bbox": [[144, 820], [160, 820], [160, 840], [144, 840]]}, {"tokens": ["项", "目", "前", "期", "咨", "询", "费"], "bbox": [[194, 820], [318, 820], [318, 839], [194, 839]]}, {"tokens": ["2", "4", ".", "0", "7"], "bbox": [[406, 820], [450, 820], [450, 840], [406, 840]]}, {"tokens": ["2", "3", ".", "8", "0"], "bbox": [[505, 820], [551, 820], [551, 840], [505, 840]]}, {"tokens": ["-", "0", ".", "2", "7"], "bbox": [[607, 819], [647, 819], [647, 840], [607, 840]]}, {"tokens": [], "bbox": [[682, 823], [741, 823], [741, 843], [682, 843]]}, {"tokens": ["2", ".", "1"], "bbox": [[137, 856], [166, 856], [166, 879], [137, 879]]}, {"tokens": ["项", "目", "建", "议", "书", "编", "审", "费"], "bbox": [[194, 857], [336, 857], [336, 877], [194, 877]]}, {"tokens": ["8", ".", "8", "3"], "bbox": [[409, 856], [445, 856], [445, 878], [409, 878]]}, {"tokens": ["8", ".", "7", "7"], "bbox": [[509, 856], [548, 856], [548, 878], [509, 878]]}, {"tokens": ["-", "0", ".", "0", "6"], "bbox": [[607, 856], [648, 856], [648, 878], [607, 878]]}, {"tokens": [], "bbox": [[679, 852], [738, 852], [738, 872], [679, 872]]}, {"tokens": ["2", ".", "2"], "bbox": [[137, 894], [168, 894], [168, 916], [137, 916]]}, {"tokens": ["可", "行", "性", "研", "究", "报", "告", "编", "制", "费"], "bbox": [[195, 895], [371, 895], [371, 914], [195, 914]]}, {"tokens": ["1", "5", ".", "2", "4"], "bbox": [[406, 895], [450, 895], [450, 915], [406, 915]]}, {"tokens": ["1", "5", ".", "0", "3"], "bbox": [[505, 895], [550, 895], [550, 915], [505, 915]]}, {"tokens": ["-", "0", ".", "2", "1"], "bbox": [[606, 895], [646, 895], [646, 915], [606, 915]]}, {"tokens": [], "bbox": [[683, 895], [742, 895], [742, 915], [683, 915]]}]}, "gt": "

概算审定表 项目名称:(一二三四) 单位:万元 序号 工程或费用名称 报审金额 审定金额 调整金额 备注 一 工程费用 7354.96 6963.20 -391.76 1. 道路工程 656.47 624.48 -31.99 2 桥梁工程 5551.37 5216.99 -334.38 2.1 西桥 2732.95 2558.94 -174.01 2.2 东桥 2818.42 2658.05 -160.37 3 结构工程 241.14 236.48 -4.66 4 排水工程 65.20 64.94 -0.26 5 照明及亮化工程 129.29 126.31 -2.98 6 交通工程 18.83 18.34 -0.49 7 景观装饰工程 499.56 482.56 -17.00 8 绿化工程 43.10 43.10 0.00 9 管线工程(电力、通信) 150.00 150.00 0.00 二 工程建设其他费用 771.92 668.52 -103.40 1 建设管理费 253.71 215.69 -38.02 1.1 建设单位管理费 133.11 103.56 -29.55 1.2 工程建设监理费 120.60 112.13 -8.47 2 项目前期咨询费 24.07 23.80 -0.27 2.1 项目建议书编审费 8.83 8.77 -0.06 2.2 可行性研究报告编制费 15.24 15.03 -0.21 "}

应该是structure里的tokens有误,我最后是很暴力地自己按照原表格样式写了tokens,然后替换掉标注文件里的对应部分

mk25499 commented 1 year ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

我用的paddlelabel工具标注生成的标注文件,不一样的话需要自己手动修改吗,还是怎么办呀

我最后是手动修改的标注文件

我用训练后的模型进行表格识别报错: File "/usr/local/lib/python3.8/dist-packages/paddleocr/ppstructure/table/matcher.py", line 183, in _filter_ocr_result y1 = pred_bboxes[:, 1::2].min() IndexError: too many indices for array: array is 1-dimensional, but 2 were indexed ,请问遇到过吗?

ATP-BME commented 8 months ago

已解决

空白单元格标注了并且排好了序,遇到了同样的问题,请问是怎么解决的呢?

解决了,标注导出gt.txt里的structure 数量和cell数量不一致就会报这个错

我用的paddlelabel工具标注生成的标注文件,不一样的话需要自己手动修改吗,还是怎么办呀

我最后是手动修改的标注文件

我用训练后的模型进行表格识别报错: File "/usr/local/lib/python3.8/dist-packages/paddleocr/ppstructure/table/matcher.py", line 183, in _filter_ocr_result y1 = pred_bboxes[:, 1::2].min() IndexError: too many indices for array: array is 1-dimensional, but 2 were indexed ,请问遇到过吗?

我遇到了相同的问题