kkdai / bookmarks

Repo to storage all my favorite links
15 stars 0 forks source link

程式設計師手寫了 160 多行程式碼,創建了一個 GPT-4o 演示版的即時音訊視訊通話能力,並開源了程式碼。該程式碼結合了 OpenCV、GPT-4o、Gemini、Whisper 和 TTS 引擎,實現了影片畫面擷取、文本處理以及音訊處理。 #1624

Open kkdai opened 1 month ago

kkdai commented 1 month ago

{ "summary": "程式設計師手寫了 160 多行程式碼,創建了一個 GPT-4o 演示版的即時音訊視訊通話能力,並開源了程式碼。該程式碼結合了 OpenCV、GPT-4o、Gemini、Whisper 和 TTS 引擎,實現了影片畫面擷取、文本處理以及音訊處理。", "full_content": "160+ 行代码手搓 GPT-4o 演示版的实时音视频通话能力并开源🔥,作者还录制了教程视频!⚡️\n\n- 使用 OpenCV 搞定视频画面捕获,GPT-4o、Gemini 实现文本处理和多模态\n- 音频基于 Whisper 和 TTS 引擎处理", "url": "https://twitter.com/tuturetom", "tags": ["GPT-4o", "OpenCV", "Whisper", "TTS", "音訊處理", "視訊通話", "程式設計"] }

JunJD commented 1 month ago

hello,Can you share the address?

kkdai commented 1 month ago

https://github.com/svpino/alloy-voice-assistant