爱可可微博热门分享(5.15) - Githubissues

fly51fly / aicoco

“爱可可-爱生活”微博内容精选

522 stars 66 forks source link

爱可可微博热门分享(5.15) #158

Open fly51fly opened 6 months ago

fly51fly commented 6 months ago

No 1. Pytvzhen：能快速将英文YouTube视频转换成中文视频的开源项目，以其高效的翻译流程和高质量的文本转换作为最主要特色 No 2. 免费课程：“构建多模态搜索和RAG系统”，旨在教授如何通过对比学习实现多模态模型训练，构建能处理文本、图像、音频和视频的多模态RAG系统，并用于行业实践 No 3. llama3.np：用纯NumPy实现的Llama 3模型 No 4. The Graph Maker：将任意文本通过给定的本体转换成知识图谱 No 5. 早！[太阳] No 6. #免费##抽奖# 携手@异步图书送出 5 本《大模型应用开发动手做AI Agent》 No 7. [IR] MS MARCO Web Search: a Large-scale Information-rich Web ...... No 8. Sakuga-42M Dataset: Scaling Up Cartoon Research：首个包含4200万关键帧的大规模卡通动画数据集，旨在推动卡通动画研究领域的发展 No 9. #免费##抽奖# 携手@博文视点Broadview 送出3本《基础统计学（第14版）（双色）》 No 10. 大型语言模型(LLM)推理和服务优化相关论文列表 No 11. Pipecat：一个开源框架，用于构建语音和多模态对话式人工智能Agent，如个人教练、会议助手、儿童故事玩具、客户支持机器人等 No 12. Pi-C.A.R.D：完全运行在树莓派上的 AI 语音助手，具备本地对话、图片识别和隐私保护功能 No 13. 斯坦福大学Hazy Research团队发布了一种新的嵌入式领域特定语言（DSL）ThunderKittens，旨在提高GPU上AI计算的效率，特别是针对NVIDIA H100 GPU No 14. [CL] A Survey on RAG Meets LLMs: Towards Retrieval-Augmented ...... No 15. [CL] Evaluation of Retrieval-Augmented Generation: A Survey ...... No 16. 致力于研究和整理通用人工智能(AGI)相关论文和资源的开源项目 No 17. Glider：开源的电子墨水屏项目，专注于低延迟和高刷新率，支持多种电子纸显示技术 No 18. PaliGemma：谷歌发布的最新视觉语言模型，结合了图像编码器SigLIP和文本解码器Gemma-2B，支持多种视觉语言任务 No 19. pixi：用 Zig 语言编写的跨平台开源像素艺术编辑器和动画编辑器 No 20. [CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》 No 21. Google推出 Gemini 1.5 Pro 的质量改进和新的 1.5 Flash 模型，增加了两个新的 Gemma 模型，并为 Gemini API 引入了新特性和定价选项 No 22. [LG]《RLHF Workflow: From Reward Modeling to Online RLHF》 No 23. 新书《大语言模型实战》，旨在教授Python开发者如何利用大型预训练语言模型来构建先进的文本处理系统 No 24. [CV]《MambaOut: Do We Really Need Mamba for Vision?》 No 25. LinearBoost Classifier：建立在快速线性分类器基础上的高效准确的分类算法 No 26. Podman AI Lab：一个开源扩展，允许用户在本地环境中使用容器与大型语言模型(LLM)进行交互，支持AI模型下载、推理服务器启动、本地实验场以及AI应用开发 No 27. MeeseeksAI：用Mermaid图来编排人工智Agent的框架 No 28. '《动手学大模型》 No 29. 高质量的合成文本数据集资源列表 No 30. Needle in a Needlestack：用于评估大型语言模型(LLM)注意力能力的更高级的基准测试工具 No 31. AI Agent正在颠覆自动化领域 No 32. 几篇论文实现代码 No 33. [CL] AgentClinic: a multimodal agent benchmark to evaluate ...... No 34. data-to-paper：利用AI进行端到端科研的框架，从原始数据开始，一直到生成全面、透明、可验证的科研论文 No 35. Kolmogorov-Arnold Network (KAN)通俗解析 No 36. Beta9：超快无服务器 GPU 运行时 No 37. 晚安～ [月亮] No 38. PyxLSTM：实现了xLSTM架构的Python库，通过引入指数门控、记忆混合和矩阵记忆结构，提升了序列建模任务的性能和可扩展性 No 39. [LG]《Deep MMD Gradient Flow without adversarial training》 No 40. ntscQT：用于模拟 VHS(录像带)视频效果的 Python GUI 工具，适用于艺术创作和模拟视频信号中的模拟伪影 No 41. 'MaxKey SSO ,Leading-Edge IAM-IDaas(Identity and Access Management) ...... No 42. 'Convolutional Kolmogorov-Arnold Network (CKAN) - This project ...... No 43. 通过可微Marching Cubes提取网格，并将高斯分布严格绑定到其面上，实现了混合式场景表示的直接端到端学习，使场景几何重建与基于高斯的实时渲染达成统一。//[CV]《Direct Learning of Mesh and Appearance via 3D Gaussian Splatting》 No 44. 通过分析Mamba架构与不同视觉任务的适配性，提出并验证了SSM对图像分类可能是不必要的而对检测和分割可能还有帮助的假说，为未来视觉Mamba模型的设计提供了重要指导。//[CV]《MambaOut: Do We Really Need Mamba for Vision?》 No 45. [LG]《Memory Mosaics》 No 46. Model Explorer：现代化的模型图可视化和调试工具 No 47. Barkour Robot：Google DeepMind开发的敏捷四足机器人，旨在支持各种研究项目，包含设计资产（CAD、PCBA设计、装配指南）和核心软件（固件和低级代码） No 48. [CL]《You Only Cache Once: Decoder-Decoder Architectures for Language Models》 No 49. 今日推介(第1406期)：视觉任务有必要用Mamba吗、柏拉图(统一)表示假说、无需对抗性训练的深度MMD梯度流、RLHF工作流、通过3D高斯Splatting直接学习网格和外观 ...... No 50. MuLan：旨在通过Adapter技术，使多语言扩散模型支持超过110种语言，而无需额外训练

LeoYML commented 3 months ago

一个比 No 33的小团队做的ClinicalAgent工作，同样欢迎大家关注拍砖。 Excited to discover the amazing project developed by you. And welcome to visit our similar paper [https://arxiv.org/abs/2404.14777], which was published on April 23, 2024. We look forward to your suggestions and feedback. If you have any ideas and want to cooperate with us, you are welcome.