ssocean / AlphX-Code-For-DAR

粤港澳大湾区(黄埔)国际算法算例大赛-古籍文档图像识别与分析算法比赛 Alphx队源码
36 stars 3 forks source link

两个问题请求赐教 #3

Closed haooxia closed 1 year ago

haooxia commented 1 year ago
  1. 请问码表char.txt接近1万个汉字是依据什么得到的?是大赛直接给定的吗?
  2. 请问该比赛的数据集有公开吗?
ssocean commented 1 year ago

1.char.txt是可以根据label统计得到的(大赛好像也提供了码表)。 2.因为我不太清楚大赛是否允许选手二次分发数据,因此很抱歉我们不便提供。但是我们在参赛的时候注意到了与大赛数据集相似的开源数据集,repo地址:https://github.com/HCIILAB/TKH_MTH_Datasets_Release

haooxia commented 1 year ago

1.char.txt是可以根据label统计得到的(大赛好像也提供了码表)。 2.因为我不太清楚大赛是否允许选手二次分发数据,因此很抱歉我们不便提供。但是我们在参赛的时候注意到了与大赛数据集相似的开源数据集,repo地址:https://github.com/HCIILAB/TKH_MTH_Datasets_Release

好的,谢谢您

SpiritBear000 commented 1 year ago

我在这个链接里找到了码表,不知道是不是,分享一下大家看看。 本次比赛提供码表(下载链接见链接: https://pan.baidu.com/s/16wUeSZ4JKD6f1Pj9ZhlKww 提取码: i53n ),其中包含了初赛训练集、验证集**(初赛A榜)及测试集(初赛B榜)中出现的字符类别