shellzu6 / GijirokuApp

議事録アプリ
0 stars 0 forks source link

大容量のファイルに耐えられるようにしたい(現状3分が限界) #11

Open HBA-AkaneKitagawa opened 1 year ago

shellzu commented 1 year ago

概要

まずは3分以上のファイルを再度アップロードして挙動を確認する

HBA-AkaneKitagawa commented 1 year ago

8分、6分 18分の音声ファイルでは以下のエラーが出た 入力テキストのサイズが制限を超えています。 許可されるリクエスト テキストの最大長は 5000 バイトですが、このリクエストのテキスト サイズは 13878 バイトです

HBA-AkaneKitagawa commented 1 year ago

18分の音声ファイルの文字数:4626 18分の音声ファイルの文字数から推測される、テキストのバイト数:9252バイト AWSのエラーメッセージに表示されたリクエストのテキストサイズ:13878 バイト →文字数×3の値をリクエストサイズとしてAWS lambdで認識するようだ

また、UTF-8のエンコーディングで5,000バイトが処理の上限となことの回避は困難であることが分かった。 (https://docs.aws.amazon.com/comprehend/latest/dg/guidelines-and-limits.html) https://docs.aws.amazon.com/ja_jp/comprehend/latest/dg/guidelines-and-limits.html

HBA-AkaneKitagawa commented 1 year ago

【疑問】https://dev.classmethod.jp/articles/get-translate-text-using-boto3-ja/ 上記のやり方を参考に、whileでバイト数を削ることはできるのだろうか。。。