fly51fly / aicoco

“爱可可-爱生活”微博内容精选
522 stars 66 forks source link

爱可可微博热门分享(5.15) #158

Open fly51fly opened 6 months ago

fly51fly commented 6 months ago

No 1. Pytvzhen:能快速将英文YouTube视频转换成中文视频的开源项目,以其高效的翻译流程和高质量的文本转换作为最主要特色 No 2. 免费课程:“构建多模态搜索和RAG系统”,旨在教授如何通过对比学习实现多模态模型训练,构建能处理文本、图像、音频和视频的多模态RAG系统,并用于行业实践 No 3. llama3.np:用纯NumPy实现的Llama 3模型 No 4. The Graph Maker:将任意文本通过给定的本体转换成知识图谱 No 5. 早![太阳] No 6. #免费##抽奖# 携手@异步图书 送出 5 本《大模型应用开发 动手做AI Agent》 No 7. [IR] MS MARCO Web Search: a Large-scale Information-rich Web ...... No 8. Sakuga-42M Dataset: Scaling Up Cartoon Research:首个包含4200万关键帧的大规模卡通动画数据集,旨在推动卡通动画研究领域的发展 No 9. #免费##抽奖# 携手@博文视点Broadview 送出3本《基础统计学(第14版)(双色)》 No 10. 大型语言模型(LLM)推理和服务优化相关论文列表 No 11. Pipecat:一个开源框架,用于构建语音和多模态对话式人工智能Agent,如个人教练、会议助手、儿童故事玩具、客户支持机器人等 No 12. Pi-C.A.R.D:完全运行在树莓派上的 AI 语音助手,具备本地对话、图片识别和隐私保护功能 No 13. 斯坦福大学Hazy Research团队发布了一种新的嵌入式领域特定语言(DSL)ThunderKittens,旨在提高GPU上AI计算的效率,特别是针对NVIDIA H100 GPU No 14. [CL] A Survey on RAG Meets LLMs: Towards Retrieval-Augmented ...... No 15. [CL] Evaluation of Retrieval-Augmented Generation: A Survey ...... No 16. 致力于研究和整理通用人工智能(AGI)相关论文和资源的开源项目 No 17. Glider:开源的电子墨水屏项目,专注于低延迟和高刷新率,支持多种电子纸显示技术 No 18. PaliGemma:谷歌发布的最新视觉语言模型,结合了图像编码器SigLIP和文本解码器Gemma-2B,支持多种视觉语言任务 No 19. pixi:用 Zig 语言编写的跨平台开源像素艺术编辑器和动画编辑器 No 20. [CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》 No 21. Google推出 Gemini 1.5 Pro 的质量改进和新的 1.5 Flash 模型,增加了两个新的 Gemma 模型,并为 Gemini API 引入了新特性和定价选项 No 22. [LG]《RLHF Workflow: From Reward Modeling to Online RLHF》 No 23. 新书《大语言模型实战》,旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统 No 24. [CV]《MambaOut: Do We Really Need Mamba for Vision?》 No 25. LinearBoost Classifier:建立在快速线性分类器基础上的高效准确的分类算法 No 26. Podman AI Lab:一个开源扩展,允许用户在本地环境中使用容器与大型语言模型(LLM)进行交互,支持AI模型下载、推理服务器启动、本地实验场以及AI应用开发 No 27. MeeseeksAI:用Mermaid图来编排人工智Agent的框架 No 28. '《动手学大模型》 No 29. 高质量的合成文本数据集资源列表 No 30. Needle in a Needlestack:用于评估大型语言模型(LLM)注意力能力的更高级的基准测试工具 No 31. AI Agent正在颠覆自动化领域 No 32. 几篇论文实现代码 No 33. [CL] AgentClinic: a multimodal agent benchmark to evaluate ...... No 34. data-to-paper:利用AI进行端到端科研的框架,从原始数据开始,一直到生成全面、透明、可验证的科研论文 No 35. Kolmogorov-Arnold Network (KAN)通俗解析 No 36. Beta9:超快无服务器 GPU 运行时 No 37. 晚安~ [月亮] ​ No 38. PyxLSTM:实现了xLSTM架构的Python库,通过引入指数门控、记忆混合和矩阵记忆结构,提升了序列建模任务的性能和可扩展性 No 39. [LG]《Deep MMD Gradient Flow without adversarial training》 No 40. ntscQT:用于模拟 VHS(录像带)视频效果的 Python GUI 工具,适用于艺术创作和模拟视频信号中的模拟伪影 No 41. 'MaxKey SSO ,Leading-Edge IAM-IDaas(Identity and Access Management) ...... No 42. 'Convolutional Kolmogorov-Arnold Network (CKAN) - This project ...... No 43. 通过可微Marching Cubes提取网格,并将高斯分布严格绑定到其面上,实现了混合式场景表示的直接端到端学习,使场景几何重建与基于高斯的实时渲染达成统一。//[CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》 No 44. 通过分析Mamba架构与不同视觉任务的适配性,提出并验证了SSM对图像分类可能是不必要的而对检测和分割可能还有帮助的假说,为未来视觉Mamba模型的设计提供了重要指导。//[CV]《MambaOut: Do We Really Need Mamba for Vision?》 No 45. [LG]《Memory Mosaics》 No 46. Model Explorer:现代化的模型图可视化和调试工具 No 47. Barkour Robot:Google DeepMind开发的敏捷四足机器人,旨在支持各种研究项目,包含设计资产(CAD、PCBA设计、装配指南)和核心软件(固件和低级代码) No 48. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》 No 49. 今日推介(第1406期):视觉任务有必要用Mamba吗、柏拉图(统一)表示假说、无需对抗性训练的深度MMD梯度流、RLHF工作流、通过3D高斯Splatting直接学习网格和外观 ...... No 50. MuLan:旨在通过Adapter技术,使多语言扩散模型支持超过110种语言,而无需额外训练

LeoYML commented 3 months ago

一个比 No 33的小团队做的ClinicalAgent工作,同样欢迎大家关注拍砖。 Excited to discover the amazing project developed by you. And welcome to visit our similar paper [https://arxiv.org/abs/2404.14777], which was published on April 23, 2024. We look forward to your suggestions and feedback. If you have any ideas and want to cooperate with us, you are welcome.