Open HBA-AkaneKitagawa opened 1 year ago
8分、6分 18分の音声ファイルでは以下のエラーが出た 入力テキストのサイズが制限を超えています。 許可されるリクエスト テキストの最大長は 5000 バイトですが、このリクエストのテキスト サイズは 13878 バイトです
18分の音声ファイルの文字数:4626 18分の音声ファイルの文字数から推測される、テキストのバイト数:9252バイト AWSのエラーメッセージに表示されたリクエストのテキストサイズ:13878 バイト →文字数×3の値をリクエストサイズとしてAWS lambdで認識するようだ
また、UTF-8のエンコーディングで5,000バイトが処理の上限となことの回避は困難であることが分かった。 (https://docs.aws.amazon.com/comprehend/latest/dg/guidelines-and-limits.html) https://docs.aws.amazon.com/ja_jp/comprehend/latest/dg/guidelines-and-limits.html
【疑問】https://dev.classmethod.jp/articles/get-translate-text-using-boto3-ja/ 上記のやり方を参考に、whileでバイト数を削ることはできるのだろうか。。。
概要
まずは3分以上のファイルを再度アップロードして挙動を確認する