Open luisleao opened 1 week ago
Uma questão em relação à esta mudança é que ela pode impactar no formato de reposta via WhatsApp, uma vez que estamos recebendo o texto no formato de streaming agora.
Pode ser interessante rodar uma chamada separada da LLM, usando a thread do usuário, logo após respondê-lo.
forçar a saída do assistente em json para incluir alguns parâmetros:
Neste momento vamos apenas retornar o objeto de resposta.