naota7118 / ocr_check_app

0 stars 0 forks source link

90人分の照合で生じたエラー #42

Open naota7118 opened 1 month ago

naota7118 commented 1 month ago

エラー

スクリーンショット 2024-08-14 午後6 12 18

原因調査

pdf_dataにデータが入っていない。
pdf_dataには、本来、sample.txtから得点データのみ抽出したものが入っているはず。
そもそもsample.txtにPDFのテキストデータが出力されていない。

Googleドキュメントからテキストファイルに出力する処理が失敗している?

drive.export_file(converted_file.id, 'text/plain', download_dest: './tmp/txt/sample.txt')

converted_fileにはデータが格納されている。
converted_file.idも問題なし。 残っていたsample.txtを削除していなかったから?→違った

ということは、、、データが大きすぎて、そもそもGoogleドライブで手動でPDFからGoogleドキュメント形式にすることもできないのでは?
→最初の15枚しか正しく表示されていない

PDFデータを圧縮してサイズを小さくしたら変わる?70MBから1MBにした →結果は変わらず、最初の15枚しか正しく表示されていない