Open fly51fly opened 6 months ago
一个比 No 33的小团队做的ClinicalAgent工作,同样欢迎大家关注拍砖。 Excited to discover the amazing project developed by you. And welcome to visit our similar paper [https://arxiv.org/abs/2404.14777], which was published on April 23, 2024. We look forward to your suggestions and feedback. If you have any ideas and want to cooperate with us, you are welcome.
No 1. Pytvzhen:能快速将英文YouTube视频转换成中文视频的开源项目,以其高效的翻译流程和高质量的文本转换作为最主要特色 No 2. 免费课程:“构建多模态搜索和RAG系统”,旨在教授如何通过对比学习实现多模态模型训练,构建能处理文本、图像、音频和视频的多模态RAG系统,并用于行业实践 No 3. llama3.np:用纯NumPy实现的Llama 3模型 No 4. The Graph Maker:将任意文本通过给定的本体转换成知识图谱 No 5. 早![太阳] No 6. #免费##抽奖# 携手@异步图书 送出 5 本《大模型应用开发 动手做AI Agent》 No 7. [IR] MS MARCO Web Search: a Large-scale Information-rich Web ...... No 8. Sakuga-42M Dataset: Scaling Up Cartoon Research:首个包含4200万关键帧的大规模卡通动画数据集,旨在推动卡通动画研究领域的发展 No 9. #免费##抽奖# 携手@博文视点Broadview 送出3本《基础统计学(第14版)(双色)》 No 10. 大型语言模型(LLM)推理和服务优化相关论文列表 No 11. Pipecat:一个开源框架,用于构建语音和多模态对话式人工智能Agent,如个人教练、会议助手、儿童故事玩具、客户支持机器人等 No 12. Pi-C.A.R.D:完全运行在树莓派上的 AI 语音助手,具备本地对话、图片识别和隐私保护功能 No 13. 斯坦福大学Hazy Research团队发布了一种新的嵌入式领域特定语言(DSL)ThunderKittens,旨在提高GPU上AI计算的效率,特别是针对NVIDIA H100 GPU No 14. [CL] A Survey on RAG Meets LLMs: Towards Retrieval-Augmented ...... No 15. [CL] Evaluation of Retrieval-Augmented Generation: A Survey ...... No 16. 致力于研究和整理通用人工智能(AGI)相关论文和资源的开源项目 No 17. Glider:开源的电子墨水屏项目,专注于低延迟和高刷新率,支持多种电子纸显示技术 No 18. PaliGemma:谷歌发布的最新视觉语言模型,结合了图像编码器SigLIP和文本解码器Gemma-2B,支持多种视觉语言任务 No 19. pixi:用 Zig 语言编写的跨平台开源像素艺术编辑器和动画编辑器 No 20. [CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》 No 21. Google推出 Gemini 1.5 Pro 的质量改进和新的 1.5 Flash 模型,增加了两个新的 Gemma 模型,并为 Gemini API 引入了新特性和定价选项 No 22. [LG]《RLHF Workflow: From Reward Modeling to Online RLHF》 No 23. 新书《大语言模型实战》,旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统 No 24. [CV]《MambaOut: Do We Really Need Mamba for Vision?》 No 25. LinearBoost Classifier:建立在快速线性分类器基础上的高效准确的分类算法 No 26. Podman AI Lab:一个开源扩展,允许用户在本地环境中使用容器与大型语言模型(LLM)进行交互,支持AI模型下载、推理服务器启动、本地实验场以及AI应用开发 No 27. MeeseeksAI:用Mermaid图来编排人工智Agent的框架 No 28. '《动手学大模型》 No 29. 高质量的合成文本数据集资源列表 No 30. Needle in a Needlestack:用于评估大型语言模型(LLM)注意力能力的更高级的基准测试工具 No 31. AI Agent正在颠覆自动化领域 No 32. 几篇论文实现代码 No 33. [CL] AgentClinic: a multimodal agent benchmark to evaluate ...... No 34. data-to-paper:利用AI进行端到端科研的框架,从原始数据开始,一直到生成全面、透明、可验证的科研论文 No 35. Kolmogorov-Arnold Network (KAN)通俗解析 No 36. Beta9:超快无服务器 GPU 运行时 No 37. 晚安~ [月亮] No 38. PyxLSTM:实现了xLSTM架构的Python库,通过引入指数门控、记忆混合和矩阵记忆结构,提升了序列建模任务的性能和可扩展性 No 39. [LG]《Deep MMD Gradient Flow without adversarial training》 No 40. ntscQT:用于模拟 VHS(录像带)视频效果的 Python GUI 工具,适用于艺术创作和模拟视频信号中的模拟伪影 No 41. 'MaxKey SSO ,Leading-Edge IAM-IDaas(Identity and Access Management) ...... No 42. 'Convolutional Kolmogorov-Arnold Network (CKAN) - This project ...... No 43. 通过可微Marching Cubes提取网格,并将高斯分布严格绑定到其面上,实现了混合式场景表示的直接端到端学习,使场景几何重建与基于高斯的实时渲染达成统一。//[CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》 No 44. 通过分析Mamba架构与不同视觉任务的适配性,提出并验证了SSM对图像分类可能是不必要的而对检测和分割可能还有帮助的假说,为未来视觉Mamba模型的设计提供了重要指导。//[CV]《MambaOut: Do We Really Need Mamba for Vision?》 No 45. [LG]《Memory Mosaics》 No 46. Model Explorer:现代化的模型图可视化和调试工具 No 47. Barkour Robot:Google DeepMind开发的敏捷四足机器人,旨在支持各种研究项目,包含设计资产(CAD、PCBA设计、装配指南)和核心软件(固件和低级代码) No 48. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》 No 49. 今日推介(第1406期):视觉任务有必要用Mamba吗、柏拉图(统一)表示假说、无需对抗性训练的深度MMD梯度流、RLHF工作流、通过3D高斯Splatting直接学习网格和外观 ...... No 50. MuLan:旨在通过Adapter技术,使多语言扩散模型支持超过110种语言,而无需额外训练