Closed Duyz232 closed 1 year ago
您好,初步判断可能是您的tsv文件有问题。您可以使用Python库jsonlines中的相关函数进行得到tsv数据,每行是一行json。请问您是如何生成的自己数据集的tsv文件呢?根据您提供的tsv文件内容看,您可以再检查一下其是否为json格式,其中不应该包含中文的冒号“:”等字符。
您好!非常感谢您的回复!确实是我的tsv文件格式有问题,不知您是否方便提供把一张图转成tsv数据的正确方法呢
您好,之前回答笔误了一下,判断可能是您的jsonl文件有问题,您可以尝试使用jsonlines库来重新写入jsonl文件再尝试一下,比如写入一行json数据的示例:
import jsonlines
with jsonlines.open('output.jsonl', mode='a') as f:
json_data = {"key": "value"} # 替换成需要写入的JSON数据
f.write(json_data)
对于tsv文件,您可以按照数据集格式预处理部分介绍的方法将图片原始文件转换为base64,进而写入tsv。
非常感谢您的回复!
hi 在处理自己准备的数据集时候遇到问题如下: 这种问题我该如何应对呢? 以下是我具体的tsv以及jsonl文件