Azure-Samples / Cognitive-Speech-TTS

Microsoft Text-to-Speech API sample code in several languages, part of Cognitive Services.
https://azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/
Other
895 stars 511 forks source link

Sentences boundary does not Match audio #255

Closed techboycr closed 1 year ago

techboycr commented 1 year ago

The system is returning audio in the correct way just as the text is written but the sentence boundary is incorrect. I am using the times in the sentence boundaries to sync the generated speech with the video but the inconsistencies in time are giving me issues.

This snippet is the one giving me issues, is a modificated version of the long text synthetizer example:

`with ThreadPool(processes=self.parallel_threads) as pool: _fileName = fileName+'.mp3' audio_path = output_path / _fileName with audio_path.open("wb") as f: for result, text_boundaries in tqdm( pool.imap(self.synthesize_text_once, sentences), total=len(sentences)): if result is not None: print('Text Boundaries: ',len(text_boundaries)) f.write(result.audio_data) for text_boundary in text_boundaries: text_boundary_dict = { 'audio_offset': offset + text_boundary.audio_offset / 10000, 'duration': text_boundary.duration.total_seconds() * 1000, 'text': text_boundary.text } print(text_boundary.boundary_type) print(text_boundary_dict) if text_boundary.boundary_type == speechsdk.SpeechSynthesisBoundaryType.Sentence: all_sentence_boundaries.append(text_boundary_dict) elif text_boundary.boundary_type == speechsdk.SpeechSynthesisBoundaryType.Word: all_word_boundaries.append(text_boundary_dict) else: other_text.append(text_boundary_dict)

                    # Calculate the offset for the next sentence,
                    offset += len(result.audio_data) / (48 / 8)
        with (output_path / "word_boundaries.json").open("w", encoding="utf-8") as f:
            json.dump(all_word_boundaries, f, indent=4, ensure_ascii=False)
        with (output_path / "sentence_boundaries.json").open("w", encoding="utf-8") as f:
            json.dump(all_sentence_boundaries, f, indent=4, ensure_ascii=False)
        with (output_path / "other_text.json").open("w", encoding="utf-8") as f:
            json.dump(all_sentence_boundaries, f, indent=4, ensure_ascii=False)`

When I do some debugging I find out that in a moment the system is ignoring one final period ".", and after that the sentece is not generated even though I confirm that the sentences are being created correctly fron the plain text, here is the dump:

`['Expandirse a nuevas industrias y segmentos de mercado verticales, mediante el uso de su experiencia en su segmento de manufactura puede ayudar a expandir las líneas de productos existentes y la participación general en el mercado.', 'La expansión a nuevos mercados globales a través del análisis de colocación de productos y el aumento de las oportunidades de ingresos a través de la innovación de productos son formas de aumentar la participación de mercado.', 'También se puede respaldar ofreciendo complementos y personalización posterior a la compra del producto, paquete de mantenimiento y servicio, contratos de actualización en tecnología o capacidad.', 'El costo y el precio también juegan un papel importante para garantizar que se pueda lograr la máxima participación de mercado al conocer el panorama competitivo.', 'Te invitamos a agendar una reunión con nuestro equipo para que nos cuentes en cual niche usted es indiscutible líder o donde quiere llegar ser líder y te mostramos ejemplos como otros clientes lo han logrado.'] 0%| | 0/5 [00:00<?, ?it/s]Text Boundaries: 39 SpeechSynthesisBoundaryType.Word {'audio_offset': 50.0, 'duration': 737.5, 'text': 'Expandirse'} SpeechSynthesisBoundaryType.Word {'audio_offset': 800.0, 'duration': 25.0, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 837.5, 'duration': 337.5, 'text': 'nuevas'} SpeechSynthesisBoundaryType.Word {'audio_offset': 1187.5, 'duration': 575.0, 'text': 'industrias'} SpeechSynthesisBoundaryType.Word {'audio_offset': 1775.0, 'duration': 50.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 1837.5, 'duration': 587.5, 'text': 'segmentos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 2437.5, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 2525.0, 'duration': 412.5, 'text': 'mercado'} SpeechSynthesisBoundaryType.Word {'audio_offset': 2950.0, 'duration': 737.5, 'text': 'verticales'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 3775.0, 'duration': 125.0, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 3950.0, 'duration': 475.0, 'text': 'mediante'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4437.5, 'duration': 112.5, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4562.5, 'duration': 225.0, 'text': 'uso'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4800.0, 'duration': 100.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4912.5, 'duration': 100.0, 'text': 'su'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5025.0, 'duration': 625.0, 'text': 'experiencia'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5662.5, 'duration': 62.5, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5737.5, 'duration': 112.5, 'text': 'su'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5862.5, 'duration': 487.5, 'text': 'segmento'} SpeechSynthesisBoundaryType.Word {'audio_offset': 6362.5, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 6462.5, 'duration': 662.5, 'text': 'manufactura'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7137.5, 'duration': 250.0, 'text': 'puede'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7400.0, 'duration': 350.0, 'text': 'ayudar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7762.5, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7812.5, 'duration': 562.5, 'text': 'expandir'} SpeechSynthesisBoundaryType.Word {'audio_offset': 8387.5, 'duration': 200.0, 'text': 'las'} SpeechSynthesisBoundaryType.Word {'audio_offset': 8600.0, 'duration': 387.5, 'text': 'líneas'} SpeechSynthesisBoundaryType.Word {'audio_offset': 9000.0, 'duration': 225.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 9387.5, 'duration': 500.0, 'text': 'productos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 9900.0, 'duration': 750.0, 'text': 'existentes'} SpeechSynthesisBoundaryType.Word {'audio_offset': 10662.5, 'duration': 50.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 10725.0, 'duration': 100.0, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 10837.5, 'duration': 787.5, 'text': 'participación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 11637.5, 'duration': 450.0, 'text': 'general'} SpeechSynthesisBoundaryType.Word {'audio_offset': 12100.0, 'duration': 100.0, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 12212.5, 'duration': 112.5, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 12337.5, 'duration': 537.5, 'text': 'mercado'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 12887.5, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 50.0, 'duration': 13637.5, 'text': 'Expandirse a nuevas industrias y segmentos de mercado verticales, mediante el uso de su experiencia en su segmento de manufactura puede ayudar a expandir las líneas de productos existentes y la participación general en el mercado.'} 20%|█████████████████████████████▏ | 1/5 [00:01<00:06, 1.55s/it]Text Boundaries: 37 SpeechSynthesisBoundaryType.Word {'audio_offset': 13802.0, 'duration': 162.5, 'text': 'La'} SpeechSynthesisBoundaryType.Word {'audio_offset': 13977.0, 'duration': 550.0, 'text': 'expansión'} SpeechSynthesisBoundaryType.Word {'audio_offset': 14539.5, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 14589.5, 'duration': 375.0, 'text': 'nuevos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 14977.0, 'duration': 475.0, 'text': 'mercados'} SpeechSynthesisBoundaryType.Word {'audio_offset': 15464.5, 'duration': 500.0, 'text': 'globales'} SpeechSynthesisBoundaryType.Word {'audio_offset': 15977.0, 'duration': 62.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 16052.0, 'duration': 337.5, 'text': 'través'} SpeechSynthesisBoundaryType.Word {'audio_offset': 16402.0, 'duration': 137.5, 'text': 'del'} SpeechSynthesisBoundaryType.Word {'audio_offset': 16552.0, 'duration': 512.5, 'text': 'análisis'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17077.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17177.0, 'duration': 562.5, 'text': 'colocación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17752.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17852.0, 'duration': 650.0, 'text': 'productos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 18514.5, 'duration': 100.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 18627.0, 'duration': 100.0, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 18739.5, 'duration': 437.5, 'text': 'aumento'} SpeechSynthesisBoundaryType.Word {'audio_offset': 19189.5, 'duration': 100.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 19302.0, 'duration': 350.0, 'text': 'las'} SpeechSynthesisBoundaryType.Word {'audio_offset': 19814.5, 'duration': 850.0, 'text': 'oportunidades'} SpeechSynthesisBoundaryType.Word {'audio_offset': 20677.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 20764.5, 'duration': 512.5, 'text': 'ingresos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21289.5, 'duration': 62.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21364.5, 'duration': 325.0, 'text': 'través'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21702.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21789.5, 'duration': 75.0, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21877.0, 'duration': 525.0, 'text': 'innovación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 22414.5, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 22514.5, 'duration': 500.0, 'text': 'productos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23027.0, 'duration': 200.0, 'text': 'son'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23239.5, 'duration': 387.5, 'text': 'formas'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23639.5, 'duration': 62.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23714.5, 'duration': 500.0, 'text': 'aumentar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 24227.0, 'duration': 100.0, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 24339.5, 'duration': 775.0, 'text': 'participación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 25127.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 25214.5, 'duration': 525.0, 'text': 'mercado'} Text Boundaries: 30 SpeechSynthesisBoundaryType.Word {'audio_offset': 25970.0, 'duration': 400.0, 'text': 'También'} SpeechSynthesisBoundaryType.Word {'audio_offset': 26382.5, 'duration': 125.0, 'text': 'se'} SpeechSynthesisBoundaryType.Word {'audio_offset': 26520.0, 'duration': 250.0, 'text': 'puede'} SpeechSynthesisBoundaryType.Word {'audio_offset': 26782.5, 'duration': 525.0, 'text': 'respaldar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 27320.0, 'duration': 512.5, 'text': 'ofreciendo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 27845.0, 'duration': 712.5, 'text': 'complementos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 28570.0, 'duration': 50.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 28632.5, 'duration': 900.0, 'text': 'personalización'} SpeechSynthesisBoundaryType.Word {'audio_offset': 29545.0, 'duration': 525.0, 'text': 'posterior'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30082.5, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30132.5, 'duration': 112.5, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30257.5, 'duration': 325.0, 'text': 'compra'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30595.0, 'duration': 175.0, 'text': 'del'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30782.5, 'duration': 512.5, 'text': 'producto'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 31370.0, 'duration': 125.0, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 31545.0, 'duration': 412.5, 'text': 'paquete'} SpeechSynthesisBoundaryType.Word {'audio_offset': 31970.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 32070.0, 'duration': 687.5, 'text': 'mantenimiento'} SpeechSynthesisBoundaryType.Word {'audio_offset': 32770.0, 'duration': 37.5, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 32820.0, 'duration': 575.0, 'text': 'servicio'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 33495.0, 'duration': 162.5, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 33670.0, 'duration': 587.5, 'text': 'contratos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 34270.0, 'duration': 62.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 34345.0, 'duration': 700.0, 'text': 'actualización'} SpeechSynthesisBoundaryType.Word {'audio_offset': 35057.5, 'duration': 125.0, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 35195.0, 'duration': 737.5, 'text': 'tecnología'} SpeechSynthesisBoundaryType.Word {'audio_offset': 35945.0, 'duration': 75.0, 'text': 'o'} SpeechSynthesisBoundaryType.Word {'audio_offset': 36032.5, 'duration': 750.0, 'text': 'capacidad'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 36795.0, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 25970.0, 'duration': 11625.0, 'text': 'También se puede respaldar ofreciendo complementos y personalización posterior a la compra del producto, paquete de mantenimiento y servicio, contratos de actualización en tecnología o capacidad.'} Text Boundaries: 28 SpeechSynthesisBoundaryType.Word {'audio_offset': 37706.0, 'duration': 200.0, 'text': 'El'} SpeechSynthesisBoundaryType.Word {'audio_offset': 37918.5, 'duration': 350.0, 'text': 'costo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38281.0, 'duration': 87.5, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38381.0, 'duration': 100.0, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38493.5, 'duration': 350.0, 'text': 'precio'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38856.0, 'duration': 400.0, 'text': 'también'} SpeechSynthesisBoundaryType.Word {'audio_offset': 39268.5, 'duration': 362.5, 'text': 'juegan'} SpeechSynthesisBoundaryType.Word {'audio_offset': 39643.5, 'duration': 112.5, 'text': 'un'} SpeechSynthesisBoundaryType.Word {'audio_offset': 39768.5, 'duration': 325.0, 'text': 'papel'} SpeechSynthesisBoundaryType.Word {'audio_offset': 40106.0, 'duration': 637.5, 'text': 'importante'} SpeechSynthesisBoundaryType.Word {'audio_offset': 40756.0, 'duration': 212.5, 'text': 'para'} SpeechSynthesisBoundaryType.Word {'audio_offset': 40981.0, 'duration': 637.5, 'text': 'garantizar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 41631.0, 'duration': 112.5, 'text': 'que'} SpeechSynthesisBoundaryType.Word {'audio_offset': 41756.0, 'duration': 137.5, 'text': 'se'} SpeechSynthesisBoundaryType.Word {'audio_offset': 41906.0, 'duration': 262.5, 'text': 'pueda'} SpeechSynthesisBoundaryType.Word {'audio_offset': 42181.0, 'duration': 387.5, 'text': 'lograr'} SpeechSynthesisBoundaryType.Word {'audio_offset': 42581.0, 'duration': 87.5, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 42681.0, 'duration': 537.5, 'text': 'máxima'} SpeechSynthesisBoundaryType.Word {'audio_offset': 43381.0, 'duration': 737.5, 'text': 'participación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44131.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44218.5, 'duration': 400.0, 'text': 'mercado'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44631.0, 'duration': 75.0, 'text': 'al'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44718.5, 'duration': 425.0, 'text': 'conocer'} SpeechSynthesisBoundaryType.Word {'audio_offset': 45156.0, 'duration': 100.0, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 45268.5, 'duration': 500.0, 'text': 'panorama'} SpeechSynthesisBoundaryType.Word {'audio_offset': 45781.0, 'duration': 787.5, 'text': 'competitivo'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 46581.0, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 37706.0, 'duration': 9675.0, 'text': 'El costo y el precio también juegan un papel importante para garantizar que se pueda lograr la máxima participación de mercado al conocer el panorama competitivo.'} Text Boundaries: 38 SpeechSynthesisBoundaryType.Word {'audio_offset': 47498.0, 'duration': 100.0, 'text': 'Te'} SpeechSynthesisBoundaryType.Word {'audio_offset': 47610.5, 'duration': 575.0, 'text': 'invitamos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48198.0, 'duration': 50.0, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48260.5, 'duration': 400.0, 'text': 'agendar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48673.0, 'duration': 162.5, 'text': 'una'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48848.0, 'duration': 450.0, 'text': 'reunión'} SpeechSynthesisBoundaryType.Word {'audio_offset': 49310.5, 'duration': 162.5, 'text': 'con'} SpeechSynthesisBoundaryType.Word {'audio_offset': 49485.5, 'duration': 262.5, 'text': 'nuestro'} SpeechSynthesisBoundaryType.Word {'audio_offset': 49760.5, 'duration': 362.5, 'text': 'equipo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 50135.5, 'duration': 225.0, 'text': 'para'} SpeechSynthesisBoundaryType.Word {'audio_offset': 50373.0, 'duration': 112.5, 'text': 'que'} SpeechSynthesisBoundaryType.Word {'audio_offset': 50498.0, 'duration': 162.5, 'text': 'nos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 50673.0, 'duration': 400.0, 'text': 'cuentes'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51085.5, 'duration': 112.5, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51210.5, 'duration': 237.5, 'text': 'cual'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51460.5, 'duration': 237.5, 'text': 'niche'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51710.5, 'duration': 325.0, 'text': 'usted'} SpeechSynthesisBoundaryType.Word {'audio_offset': 52048.0, 'duration': 137.5, 'text': 'es'} SpeechSynthesisBoundaryType.Word {'audio_offset': 52198.0, 'duration': 712.5, 'text': 'indiscutible'} SpeechSynthesisBoundaryType.Word {'audio_offset': 52923.0, 'duration': 437.5, 'text': 'líder'} SpeechSynthesisBoundaryType.Word {'audio_offset': 53523.0, 'duration': 112.5, 'text': 'o'} SpeechSynthesisBoundaryType.Word {'audio_offset': 53648.0, 'duration': 275.0, 'text': 'donde'} SpeechSynthesisBoundaryType.Word {'audio_offset': 53935.5, 'duration': 250.0, 'text': 'quiere'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54198.0, 'duration': 325.0, 'text': 'llegar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54535.5, 'duration': 250.0, 'text': 'ser'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54798.0, 'duration': 337.5, 'text': 'líder'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55148.0, 'duration': 75.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55235.5, 'duration': 100.0, 'text': 'te'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55348.0, 'duration': 512.5, 'text': 'mostramos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55873.0, 'duration': 487.5, 'text': 'ejemplos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 56373.0, 'duration': 262.5, 'text': 'como'} SpeechSynthesisBoundaryType.Word {'audio_offset': 56648.0, 'duration': 312.5, 'text': 'otros'} SpeechSynthesisBoundaryType.Word {'audio_offset': 56973.0, 'duration': 537.5, 'text': 'clientes'} SpeechSynthesisBoundaryType.Word {'audio_offset': 57523.0, 'duration': 125.0, 'text': 'lo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 57660.5, 'duration': 100.0, 'text': 'han'} SpeechSynthesisBoundaryType.Word {'audio_offset': 57773.0, 'duration': 512.5, 'text': 'logrado'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 58298.0, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 47498.0, 'duration': 11600.0, 'text': 'Te invitamos a agendar una reunión con nuestro equipo para que nos cuentes en cual niche usted es indiscutible líder o donde quiere llegar ser líder y te mostramos ejemplos como otros clientes lo han logrado.'} 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00, 3.10it/s] Moviepy - Building video hola_mundo.webm. MoviePy - Writing audio in hola_mundoTEMP_MPY_wvf_snd.ogg MoviePy - Done. Moviepy - Writing video hola_mundo.webm

Moviepy - Done ! Moviepy - video ready hola_mundo.webm text_to_speech/speechOutput/hola_mundo/hola_mundo.mp3 Duracion total: 46.5375 Offset total: 111.224 ['Expandirse a nuevas industrias y segmentos de mercado verticales, mediante el uso de su experiencia en su segmento de manufactura puede ayudar a expandir las líneas de productos existentes y la participación general en el mercado.', 'La expansión a nuevos mercados globales a través del análisis de colocación de productos y el aumento de las oportunidades de ingresos a través de la innovación de productos son formas de aumentar la participación de mercado.', 'También se puede respaldar ofreciendo complementos y personalización posterior a la compra del producto, paquete de mantenimiento y servicio, contratos de actualización en tecnología o capacidad.', 'El costo y el precio también juegan un papel importante para garantizar que se pueda lograr la máxima participación de mercado al conocer el panorama competitivo.', 'Te invitamos a agendar una reunión con nuestro equipo, para que nos cuentes en cual nicho usted es indiscutible líder, o donde quiere llegar a ser líder y te mostramos ejemplos de como otros clientes lo han logrado.'] 0%| | 0/5 [00:00<?, ?it/sT ext Boundaries: 39 SpeechSynthesisBoundaryType.Word {'audio_offset': 50.0, 'duration': 737.5, 'text': 'Expandirse'} SpeechSynthesisBoundaryType.Word {'audio_offset': 800.0, 'duration': 25.0, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 837.5, 'duration': 337.5, 'text': 'nuevas'} SpeechSynthesisBoundaryType.Word {'audio_offset': 1187.5, 'duration': 575.0, 'text': 'industrias'} SpeechSynthesisBoundaryType.Word {'audio_offset': 1775.0, 'duration': 50.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 1837.5, 'duration': 587.5, 'text': 'segmentos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 2437.5, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 2525.0, 'duration': 412.5, 'text': 'mercado'} SpeechSynthesisBoundaryType.Word {'audio_offset': 2950.0, 'duration': 737.5, 'text': 'verticales'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 3775.0, 'duration': 125.0, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 3950.0, 'duration': 475.0, 'text': 'mediante'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4437.5, 'duration': 112.5, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4562.5, 'duration': 225.0, 'text': 'uso'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4800.0, 'duration': 100.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 4912.5, 'duration': 100.0, 'text': 'su'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5025.0, 'duration': 625.0, 'text': 'experiencia'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5662.5, 'duration': 62.5, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5737.5, 'duration': 112.5, 'text': 'su'} SpeechSynthesisBoundaryType.Word {'audio_offset': 5862.5, 'duration': 487.5, 'text': 'segmento'} SpeechSynthesisBoundaryType.Word {'audio_offset': 6362.5, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 6462.5, 'duration': 662.5, 'text': 'manufactura'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7137.5, 'duration': 250.0, 'text': 'puede'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7400.0, 'duration': 350.0, 'text': 'ayudar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7762.5, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 7812.5, 'duration': 562.5, 'text': 'expandir'} SpeechSynthesisBoundaryType.Word {'audio_offset': 8387.5, 'duration': 200.0, 'text': 'las'} SpeechSynthesisBoundaryType.Word {'audio_offset': 8600.0, 'duration': 387.5, 'text': 'líneas'} SpeechSynthesisBoundaryType.Word {'audio_offset': 9000.0, 'duration': 225.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 9387.5, 'duration': 500.0, 'text': 'productos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 9900.0, 'duration': 750.0, 'text': 'existentes'} SpeechSynthesisBoundaryType.Word {'audio_offset': 10662.5, 'duration': 50.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 10725.0, 'duration': 100.0, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 10837.5, 'duration': 787.5, 'text': 'participación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 11637.5, 'duration': 450.0, 'text': 'general'} SpeechSynthesisBoundaryType.Word {'audio_offset': 12100.0, 'duration': 100.0, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 12212.5, 'duration': 112.5, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 12337.5, 'duration': 537.5, 'text': 'mercado'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 12887.5, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 50.0, 'duration': 13637.5, 'text': 'Expandirse a nuevas industrias y segmentos de mercado verticales, mediante el uso de su experiencia en su segmento de manufactura puede ayudar a expandir las líneas de productos existentes y la participación general en el mercado.'} 20%|█████████████████████████████▏ | 1/5 [00:01<00:06, 1.53s/it]Text Boundaries: 37 SpeechSynthesisBoundaryType.Word {'audio_offset': 13802.0, 'duration': 162.5, 'text': 'La'} SpeechSynthesisBoundaryType.Word {'audio_offset': 13977.0, 'duration': 550.0, 'text': 'expansión'} SpeechSynthesisBoundaryType.Word {'audio_offset': 14539.5, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 14589.5, 'duration': 375.0, 'text': 'nuevos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 14977.0, 'duration': 475.0, 'text': 'mercados'} SpeechSynthesisBoundaryType.Word {'audio_offset': 15464.5, 'duration': 500.0, 'text': 'globales'} SpeechSynthesisBoundaryType.Word {'audio_offset': 15977.0, 'duration': 62.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 16052.0, 'duration': 337.5, 'text': 'través'} SpeechSynthesisBoundaryType.Word {'audio_offset': 16402.0, 'duration': 137.5, 'text': 'del'} SpeechSynthesisBoundaryType.Word {'audio_offset': 16552.0, 'duration': 512.5, 'text': 'análisis'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17077.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17177.0, 'duration': 562.5, 'text': 'colocación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17752.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 17852.0, 'duration': 650.0, 'text': 'productos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 18514.5, 'duration': 100.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 18627.0, 'duration': 100.0, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 18739.5, 'duration': 437.5, 'text': 'aumento'} SpeechSynthesisBoundaryType.Word {'audio_offset': 19189.5, 'duration': 100.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 19302.0, 'duration': 350.0, 'text': 'las'} SpeechSynthesisBoundaryType.Word {'audio_offset': 19814.5, 'duration': 850.0, 'text': 'oportunidades'} SpeechSynthesisBoundaryType.Word {'audio_offset': 20677.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 20764.5, 'duration': 512.5, 'text': 'ingresos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21289.5, 'duration': 62.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21364.5, 'duration': 325.0, 'text': 'través'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21702.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21789.5, 'duration': 75.0, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 21877.0, 'duration': 525.0, 'text': 'innovación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 22414.5, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 22514.5, 'duration': 500.0, 'text': 'productos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23027.0, 'duration': 200.0, 'text': 'son'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23239.5, 'duration': 387.5, 'text': 'formas'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23639.5, 'duration': 62.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 23714.5, 'duration': 500.0, 'text': 'aumentar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 24227.0, 'duration': 100.0, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 24339.5, 'duration': 775.0, 'text': 'participación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 25127.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 25214.5, 'duration': 525.0, 'text': 'mercado'} Text Boundaries: 30 SpeechSynthesisBoundaryType.Word {'audio_offset': 25970.0, 'duration': 400.0, 'text': 'También'} SpeechSynthesisBoundaryType.Word {'audio_offset': 26382.5, 'duration': 125.0, 'text': 'se'} SpeechSynthesisBoundaryType.Word {'audio_offset': 26520.0, 'duration': 250.0, 'text': 'puede'} SpeechSynthesisBoundaryType.Word {'audio_offset': 26782.5, 'duration': 525.0, 'text': 'respaldar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 27320.0, 'duration': 512.5, 'text': 'ofreciendo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 27845.0, 'duration': 712.5, 'text': 'complementos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 28570.0, 'duration': 50.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 28632.5, 'duration': 900.0, 'text': 'personalización'} SpeechSynthesisBoundaryType.Word {'audio_offset': 29545.0, 'duration': 525.0, 'text': 'posterior'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30082.5, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30132.5, 'duration': 112.5, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30257.5, 'duration': 325.0, 'text': 'compra'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30595.0, 'duration': 175.0, 'text': 'del'} SpeechSynthesisBoundaryType.Word {'audio_offset': 30782.5, 'duration': 512.5, 'text': 'producto'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 31370.0, 'duration': 125.0, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 31545.0, 'duration': 412.5, 'text': 'paquete'} SpeechSynthesisBoundaryType.Word {'audio_offset': 31970.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 32070.0, 'duration': 687.5, 'text': 'mantenimiento'} SpeechSynthesisBoundaryType.Word {'audio_offset': 32770.0, 'duration': 37.5, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 32820.0, 'duration': 575.0, 'text': 'servicio'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 33495.0, 'duration': 162.5, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 33670.0, 'duration': 587.5, 'text': 'contratos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 34270.0, 'duration': 62.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 34345.0, 'duration': 700.0, 'text': 'actualización'} SpeechSynthesisBoundaryType.Word {'audio_offset': 35057.5, 'duration': 125.0, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 35195.0, 'duration': 737.5, 'text': 'tecnología'} SpeechSynthesisBoundaryType.Word {'audio_offset': 35945.0, 'duration': 75.0, 'text': 'o'} SpeechSynthesisBoundaryType.Word {'audio_offset': 36032.5, 'duration': 750.0, 'text': 'capacidad'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 36795.0, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 25970.0, 'duration': 11625.0, 'text': 'También se puede respaldar ofreciendo complementos y personalización posterior a la compra del producto, paquete de mantenimiento y servicio, contratos de actualización en tecnología o capacidad.'} Text Boundaries: 28 SpeechSynthesisBoundaryType.Word {'audio_offset': 37706.0, 'duration': 200.0, 'text': 'El'} SpeechSynthesisBoundaryType.Word {'audio_offset': 37918.5, 'duration': 350.0, 'text': 'costo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38281.0, 'duration': 87.5, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38381.0, 'duration': 100.0, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38493.5, 'duration': 350.0, 'text': 'precio'} SpeechSynthesisBoundaryType.Word {'audio_offset': 38856.0, 'duration': 400.0, 'text': 'también'} SpeechSynthesisBoundaryType.Word {'audio_offset': 39268.5, 'duration': 362.5, 'text': 'juegan'} SpeechSynthesisBoundaryType.Word {'audio_offset': 39643.5, 'duration': 112.5, 'text': 'un'} SpeechSynthesisBoundaryType.Word {'audio_offset': 39768.5, 'duration': 325.0, 'text': 'papel'} SpeechSynthesisBoundaryType.Word {'audio_offset': 40106.0, 'duration': 637.5, 'text': 'importante'} SpeechSynthesisBoundaryType.Word {'audio_offset': 40756.0, 'duration': 212.5, 'text': 'para'} SpeechSynthesisBoundaryType.Word {'audio_offset': 40981.0, 'duration': 637.5, 'text': 'garantizar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 41631.0, 'duration': 112.5, 'text': 'que'} SpeechSynthesisBoundaryType.Word {'audio_offset': 41756.0, 'duration': 137.5, 'text': 'se'} SpeechSynthesisBoundaryType.Word {'audio_offset': 41906.0, 'duration': 262.5, 'text': 'pueda'} SpeechSynthesisBoundaryType.Word {'audio_offset': 42181.0, 'duration': 387.5, 'text': 'lograr'} SpeechSynthesisBoundaryType.Word {'audio_offset': 42581.0, 'duration': 87.5, 'text': 'la'} SpeechSynthesisBoundaryType.Word {'audio_offset': 42681.0, 'duration': 537.5, 'text': 'máxima'} SpeechSynthesisBoundaryType.Word {'audio_offset': 43381.0, 'duration': 737.5, 'text': 'participación'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44131.0, 'duration': 75.0, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44218.5, 'duration': 400.0, 'text': 'mercado'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44631.0, 'duration': 75.0, 'text': 'al'} SpeechSynthesisBoundaryType.Word {'audio_offset': 44718.5, 'duration': 425.0, 'text': 'conocer'} SpeechSynthesisBoundaryType.Word {'audio_offset': 45156.0, 'duration': 100.0, 'text': 'el'} SpeechSynthesisBoundaryType.Word {'audio_offset': 45268.5, 'duration': 500.0, 'text': 'panorama'} SpeechSynthesisBoundaryType.Word {'audio_offset': 45781.0, 'duration': 787.5, 'text': 'competitivo'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 46581.0, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 37706.0, 'duration': 9675.0, 'text': 'El costo y el precio también juegan un papel importante para garantizar que se pueda lograr la máxima participación de mercado al conocer el panorama competitivo.'} Text Boundaries: 42 SpeechSynthesisBoundaryType.Word {'audio_offset': 47498.0, 'duration': 100.0, 'text': 'Te'} SpeechSynthesisBoundaryType.Word {'audio_offset': 47610.5, 'duration': 575.0, 'text': 'invitamos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48198.0, 'duration': 50.0, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48260.5, 'duration': 400.0, 'text': 'agendar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48673.0, 'duration': 162.5, 'text': 'una'} SpeechSynthesisBoundaryType.Word {'audio_offset': 48848.0, 'duration': 475.0, 'text': 'reunión'} SpeechSynthesisBoundaryType.Word {'audio_offset': 49335.5, 'duration': 162.5, 'text': 'con'} SpeechSynthesisBoundaryType.Word {'audio_offset': 49510.5, 'duration': 275.0, 'text': 'nuestro'} SpeechSynthesisBoundaryType.Word {'audio_offset': 49798.0, 'duration': 425.0, 'text': 'equipo'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 50298.0, 'duration': 125.0, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 50473.0, 'duration': 225.0, 'text': 'para'} SpeechSynthesisBoundaryType.Word {'audio_offset': 50710.5, 'duration': 112.5, 'text': 'que'} SpeechSynthesisBoundaryType.Word {'audio_offset': 50835.5, 'duration': 162.5, 'text': 'nos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51010.5, 'duration': 387.5, 'text': 'cuentes'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51410.5, 'duration': 112.5, 'text': 'en'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51535.5, 'duration': 225.0, 'text': 'cual'} SpeechSynthesisBoundaryType.Word {'audio_offset': 51773.0, 'duration': 287.5, 'text': 'nicho'} SpeechSynthesisBoundaryType.Word {'audio_offset': 52073.0, 'duration': 300.0, 'text': 'usted'} SpeechSynthesisBoundaryType.Word {'audio_offset': 52385.5, 'duration': 137.5, 'text': 'es'} SpeechSynthesisBoundaryType.Word {'audio_offset': 52535.5, 'duration': 687.5, 'text': 'indiscutible'} SpeechSynthesisBoundaryType.Word {'audio_offset': 53235.5, 'duration': 375.0, 'text': 'líder'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 53698.0, 'duration': 137.5, 'text': ','} SpeechSynthesisBoundaryType.Word {'audio_offset': 53885.5, 'duration': 112.5, 'text': 'o'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54010.5, 'duration': 275.0, 'text': 'donde'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54298.0, 'duration': 250.0, 'text': 'quiere'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54560.5, 'duration': 325.0, 'text': 'llegar'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54898.0, 'duration': 37.5, 'text': 'a'} SpeechSynthesisBoundaryType.Word {'audio_offset': 54948.0, 'duration': 262.5, 'text': 'ser'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55223.0, 'duration': 337.5, 'text': 'líder'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55573.0, 'duration': 75.0, 'text': 'y'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55660.5, 'duration': 100.0, 'text': 'te'} SpeechSynthesisBoundaryType.Word {'audio_offset': 55773.0, 'duration': 537.5, 'text': 'mostramos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 56323.0, 'duration': 487.5, 'text': 'ejemplos'} SpeechSynthesisBoundaryType.Word {'audio_offset': 56823.0, 'duration': 87.5, 'text': 'de'} SpeechSynthesisBoundaryType.Word {'audio_offset': 56923.0, 'duration': 262.5, 'text': 'como'} SpeechSynthesisBoundaryType.Word {'audio_offset': 57198.0, 'duration': 312.5, 'text': 'otros'} SpeechSynthesisBoundaryType.Word {'audio_offset': 57523.0, 'duration': 525.0, 'text': 'clientes'} SpeechSynthesisBoundaryType.Word {'audio_offset': 58060.5, 'duration': 125.0, 'text': 'lo'} SpeechSynthesisBoundaryType.Word {'audio_offset': 58198.0, 'duration': 112.5, 'text': 'han'} SpeechSynthesisBoundaryType.Word {'audio_offset': 58323.0, 'duration': 525.0, 'text': 'logrado'} SpeechSynthesisBoundaryType.Punctuation {'audio_offset': 58860.5, 'duration': 100.0, 'text': '.'} SpeechSynthesisBoundaryType.Sentence {'audio_offset': 47498.0, 'duration': 12162.5, 'text': 'Te invitamos a agendar una reunión con nuestro equipo, para que nos cuentes en cual nicho usted es indiscutible líder, o donde quiere llegar a ser líder y te mostramos ejemplos de como otros clientes lo han logrado.'} 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [00:01<00:00, 3.17it/s] `

For some reason is ignoring punctuation in the very same Sentence, it does not matter how I arrenge the text.

Any help will be greatly appreciated.

newhillchan commented 1 year ago

I am not quite understanding what you have met. Do you mean the same input but different output (punctuation "," missing in one)? Can you share the original input?