fly51fly / aicoco

“爱可可-爱生活”微博内容精选
496 stars 62 forks source link

爱可可微博热门分享(5.8) #151

Open fly51fly opened 3 weeks ago

fly51fly commented 3 weeks ago

No 1. #免费##抽奖# 携手@图灵新知 @图灵文化 送出3本《LangChain编程》 No 2. '《动手学大模型》 No 3. markdown_crawler:多线程网络爬虫,能递归地爬取网站并为每个页面创建 Markdown 文件,专为大型语言模型文档解析设计 No 4. Hugging Face推出LeRobot开源机器人代码库 No 5. [CL] MAmmoTH2: Scaling Instructions from the Web 网页链接 通过文档召回、问答提取和问答优化三步骤,从网页中挖掘了1000万个高质量指导问答对,构建了WEBINSTRUCT数据集,并验证仅用该数据集训练的LLM可显著提升多领域推理能力。 No 6. #免费##抽奖# 携手@博文视点Broadview 送出3本《大语言模型应用指南》 No 7. tinyllm:一个轻量框架,用于开发、调试和监控大规模大语言模型(LLM)和Agent驱动的应用 No 8. [LG]《Is Flash Attention Stable?》 No 9. onnx2c:将 ONNX 神经网络模型转换为 C 语言代码的编译器,专为微控制器上的“Tiny ML”(微型机器学习)应用设计 No 10. OpenAI推出新工具识别生成内容,保障用户知情权 No 11. 关于进化算法和强化学习结合的研究论文和代码库 No 12. Skyrim:旨在通过消费级 GPU 快速运行大型天气模型,以提高天气预报的准确性和可访问性 No 13. LLMBox:全面的工具库,用于实现大型语言模型(LLM)的训练和利用,支持多种训练策略和数据集构建策略,以及高效的模型评估 No 14. DeepSeek-V2: 高效经济的专家混合(MoE)语言模型,具有236B参数,通过优化训练和推理过程,减少成本的同时提升了性能 No 15. IC-Light:用于图像光照操纵的项目,能实现文本条件和背景条件下的图像重照明 No 16. 晚安~ [月亮] ​ No 17. RAG-Retrieval:开源的Python库,旨在统一高效微调RAG检索模型,包括嵌入、ColBERT和交叉编码器模型,支持多种排序模型并优化长文档处理 No 18. [CL] AlphaMath Almost Zero: process Supervision without process ...... No 19. 早![太阳] ​ No 20. 大模型白盒子构建指南:旨在从零开始手写代码,深入理解并实践大型语言模型(LLM)的构建,包括模型结构、RAG、Agent和Eval任务 No 21. 'Chenyme-AAVT(AI Auto Video-Audio Translation) - 全自动(音频)视频翻译项目。利用Whisper识别声音,AI大模型翻译字幕,最后合并字幕视频,生成翻译后的视频' ...... No 22. OpenAI尊重创作者选择权,建立AI内容伦理规范 No 23. 提出Lory,首个适合语言模型预训练的全可微混合专家架构,通过从头训练验证其可以获得显著提升,展现出可微MoE在该任务上的巨大潜力。 No 24. 几篇论文实现代码 No 25. VILA: 预训练的视觉语言模型(VLM),具备视频理解和多图像理解能力,支持云端到边缘设备(如Jetson Orin和笔记本电脑)的部署 No 26. [CV]《ImageInWords: Unlocking Hyper-Detailed Image Descriptions》 No 27. Graph of Language Models:旨在构建世界上最大的语言模型图谱,通过整合多种专业模型并训练Octopus模型以高效连接这些模型,以期达到与闭源模型相竞争的性能 No 28. [CV] Advancing Multimodal Medical Capabilities of Gemini 网页链接 ...... No 29. [LG] Position Paper: Leveraging Foundational Models for Black-Box ...... No 30. 面向天气和气候数据理解的深度学习基础模型相关论文资源列表 No 31. 通过语言提示LMM生成接触约束,将自然语言转化为姿势优化的损失函数,在无需额外训练和标注的情况下准确捕获人体自身和人际间的接触。//[CV]《Pose Priors from Language Models》 No 32. '汉语拼音辞典 - 中文汉语拼音辞典,汉字拼音字典,词典,成语词典,常用字、多音字字典数据库' GitHub: ...... No 33. CCML:用C语言编写的简单自动微分库,旨在教育性地展示计算科学中各种概念的实现细节 No 34. 通过微基准测试和Wasserstein距离分析了Flash Attention的数值偏差量,并与低精度训练进行比较,为理解训练优化技术的稳定性影响提供了框架。//[LG]《Is Flash Attention Stable?》 No 35. 'FCN-KAN - Kolmogorov–Arnold Networks with modified activation ...... No 36. Arduino Audio Tools:功能强大的音频处理库,适用于Arduino及其它平台,提供音频源、音频效果、编码器/解码器等多种音频处理功能 No 37. 'LLM-And-More:一站式大模型训练及应用构建的解决方案,其覆盖了从数据处理到模型评估、从训练到部署、从想法到服务等整个流程' ...... No 38. Finetuning Whisper for dynamic audio context robustness:提高Whisper模型在动态音频上下文下鲁棒性 No 39. 提出一种人机交互框架,通过机器生成的种子描述和人工的多轮增强编辑,构建了一个包含超详细图像描述的新数据集,并证明这些描述对图像生成、组合推理等任务都有显著提升。//[CV]《ImageInWords: Unlocking Hyper-Detailed Image Descriptions》 No 40. AI生成检测与学术诚信 No 41. [CL]《Lory: Fully Differentiable Mixture-of-Experts for Autoregressive Language Model Pre-training》 No 42. [CV]《Pose Priors from Language Models》 No 43. DriveDownloader:基于Python的命令行工具,用来下载OneDrive, 谷歌网盘等在线存储上的文件 No 44. 《爱丽丝在可微奇境的冒险——第一卷,土地之旅》是一本关于现代(深度)神经网络设计的袖珍书,强调了构建高效处理N维数据模型的重要性,被人覆盖从卷积到Transformer、SSM 及其他一些主题 No 45. [RO]《Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning》 No 46. 今日推介(第1399期):基于深度强化学习的自我中心视觉足球机器人、自回归语言模型预训练的全可微混合专家、超详细图像描述研究、来自语言模型的姿态先验、Flash ...... No 47. 从零开始学习深度强化学习的实践课程 No 48. NPI:一个开源平台,为AI Agent提供工具使用API,以在虚拟世界中执行操作 No 49. Rocketnotes:网页版 Markdown 笔记应用,具有大型语言模型(LLM)支持的文本补全、聊天和语义搜索功能 No 50. 通过深度强化学习实现了直接从图像输入端到端训练多机器人足球策略,并可以零距离迁移到实际机器人,这是这种复杂动态多Agent任务上的首次示范。//[RO]《Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning》