Open fly51fly opened 2 weeks ago
No 1. 过节了,推荐一些微博上的程序员大佬。排名不分先后,简介如有错误欢迎指出。也欢迎评论增加你知道的程序员@刘群MT-to-Death ...... No 2. [CL] A Survey of Conversational Search 这篇论文全面综述了对话式搜索技术,重点分析了其四个关键模块以及大型语言模型的整合,并指出了该领域面临的挑战和未来的发展方向,尤其强调了多轮交互的复杂性以及如何平衡检索和生成模块以实现更精准、更符合用户需求的搜索体 ...... No 3. 数字人模型:能在手机上实时运行的超轻量级虚拟人,适合移动端的实时互动和娱乐 No 4. NewsNow:优雅阅读实时热门新闻的工具,提供简洁的界面和流畅的阅读体验,让你随时掌握最新资讯 No 5. [LG] Long Term Memory: The Foundation of AI Self-Evolution 本文提出AI应具备自我进化能力,并以长期记忆(LTM)为核心机制,构建多智能体框架OMNE,在GAIA基准测试中取得领先,为AI持续学习和个性化发展提供了新的方向。 ...... No 6. #免费##抽奖# 携手@博文视点Broadview 送出3本《事理图谱:概念与技术》 No 7. [LG]《Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers》 No 8. [LG]《Explaining Graph Neural Networks with Large Language Models: A Counterfactual Perspective for Molecular Property Prediction》 No 9. 早![太阳] No 10. x.infer:框架无关的计算机视觉推理库,它允许用户通过统一的 Python API 运行来自不同框架的多种模型的推理,支持超过1000+模型 No 11. mdx - 执行Markdown中的代码块,让你能直接在Markdown文件中编写并执行代码块,支持多种编程语言,使得文档和代码的结合更加紧密 No 12. [CL]《Little Giants: Synthesizing High-Quality Embedding Data at Scale》 No 13. Computer Use Agents资源库:一个收集了关于Computer Use Agents的资源库,包括论文和博客,旨在帮助理解和开发能够像人类一样使用计算机的智能代理 No 14. Bee Agent Framework:构建可扩展的智能Agent应用框架,让开发者轻松实现基于最新模型的智能工作流,具备代码解释器、记忆策略等多种功能 No 15. ngrid:数据浏览好帮手,就像命令行的“less”命令一样,让你在命令行环境下轻松浏览大型表格数据 No 16. KAG:基于 OpenSPG 引擎的知识增强生成框架,旨在构建知识增强的严谨决策和信息检索知识服务 No 17. 今日推介(第1572期):旋转嵌入如何在自回归transfomer中塑造表征和记忆、更快、更高效的语言模型Off-Policy强化学习、大规模高质量嵌入数据合成、通过基于SAE的表示工程指导大语言模型的知识选择行为、用大语言模型解释图神经网络 ...... No 18. [LG]《Asynchronous RLHF: Faster and More Efficient Off-Policy RL for Language Models》 No 19. [CL]《Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering》 No 20. 本文通过谱分析和实证实验,揭示了旋转位置嵌入 (RoPE) 如何通过引入频率分量及其与非线性激活函数的交互作用,影响 Transformer 模型的内部表示、记忆机制和注意力机制,并强调了相位对齐在其中扮演的关键作用,为理解 Transformer 模型提供了新的视角。//[LG]《Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers》 No 21. GenoView:基于raylib的动画查看应用,专门用来展示Geno角色的动画,支持骨骼动画数据的清晰展示,便于发现角色动画中的常见问题 No 22. Go-Taskflow:一个类似任务流的有向无环图(DAG)任务执行框架,集成了可视化和性能分析工具,旨在简化并行任务的复杂依赖管理 No 23. 几篇论文实现代码 No 24. 智谱AI语音对话模型:一款能直接理解和生成中英文语音的智能对话系统,支持实时对话并根据指令改变语音属性,让机器交流更自然 No 25. CUDATutorial:手把手教你CUDA高性能编程,从入门到精通,一起学习一起进步 No 26. 具身智能入门指南:为新手提供快速建立关于具身智能领域认知的路径和有用信息,帮助理解智能体与环境的交互获取信息、理解问题、做出决策并实现行动的过程 No 27. Hollama:一个简洁的网页界面,用于与Ollama服务器对话,支持大型提示字段、Markdown渲染、代码编辑功能,以及自定义系统提示和高级Ollama参数 No 28. SPEED框架通过三阶段对齐流程高效地利用小型开源语言模型生成大规模高质量的文本嵌入数据,其成本远低于现有方法,并揭示了合成数据规模与模型性能之间的对数线性关系,挑战了更多数据总是更好这一直觉。 No 29. [TAI快报]Vol.118 解密最新AI突破,普通人也能懂的前沿科技 No 30. DataExpert 数据工程:一个公共知识库,涵盖所有由大型语言模型(LLM)驱动的数据工程概念,帮助你理解并应用LLM技术于数据工程领域 No 31. AMT-APC自动钢琴伴奏:通过微调自动音乐转录模型来训练自动钢琴伴奏生成模型,让你的音乐创作更加智能和便捷 No 32. EveryoneNobel:为每个人生成诺贝尔奖风格的图片,利用ComfyUI进行图像生成,并用HTML模板展示文字,旨在为个人或组织提供一种生成具有纪念意义图片的框架 No 33. [LG]《Rethinking Softmax: Self-Attention with Polynomial Activations》 No 34. DataFusion Ray:分布式数据处理工具,利用Ray和Apache DataFusion进行分布式SQL查询,支持大规模数据集的快速分析 No 35. DocLayout-YOLO:文档布局分析工具,通过多样化的合成数据和全局到局部的自适应感知增强文档布局分析,提升处理速度和准确性 No 36. GraphLLM:一个基于图的框架,用于通过大型语言模型(LLM)处理数据,支持网页搜索和运行Python代码,具有强大的工具集来抓取网页并重新格式化数据,使其对LLM更友好 No 37. 小型模型的妙用:在大型语言模型时代,探索小型模型的独特角色和应用,包括数据筛选、推理增强和知识蒸馏等 No 38. Brush:旨在实现 3D 重建的工具,它使用高斯溅射技术,能够在多种系统和设备上运行,包括 macOS、Windows、Linux、Android 以及浏览器 No 39. 「TAI前沿」第23期 如何选择最适合LLM推理的NVIDIA GPU No 40. [LG]《LiNeS: Post-training Layer Scaling Prevents Forgetting and Enhances Model Merging》 No 41. 晚安~ [月亮] No 42. Mochi 1:一款开源的视频生成模型,以高保真动作和强提示遵循性为特色,缩小了封闭和开放视频生成系统之间的差距 No 43. 本文提出一种异步离线策略RLHF方法,通过分离生成和训练过程,显著提高了RLHF的训练效率,尤其是在大规模模型上,并发现在线DPO算法对离线策略数据具有较强的鲁棒性,但同时也存在计算效率与模型一致性之间的权衡。//[LG]《Asynchronous RLHF: Faster and More Efficient Off-Policy RL for Language Models》 No 44. TileLang/tvm:开源深度学习编译器堆栈,专为CPU、GPU和专业加速器设计,支持简化和高性能的GPU内核编写 No 45. 摩托车模型预测控制:一种用于摩托车控制的先进算法,通过预测未来状态来优化行驶路径和稳定性,特别适合自动驾驶和高性能摩托车 No 46. 本文首次深入研究了大型语言模型在多文档摘要任务中的幻觉问题,发现幻觉率极高且存在显著的结尾偏差和对不存在信息的虚假总结倾向,并指出简单的后处理方法效果有限,为未来研究提供了重要方向。//[CL]《From Single to Multi: How LLMs Hallucinate in Multi-Document Summarization》 No 47. 基于Llama Index + OpenAI API的术语表自动提取 No 48. OURS Project:开源、可升级、可修复、无大科技公司控制的智能手机项目,提供详细的组装指南,让你能自制一部完全属于自己的智能手机 No 49. 美国波士顿动力公司的新款机器人 寰亚SYHP的微博视... No 50. 数学好书推荐:一个汇集了各种数学书籍资源的宝库,无论你是数学专业的学生还是对数学感兴趣的爱好者,都能在这里找到丰富的学习材料和参考书籍
No 1. 过节了,推荐一些微博上的程序员大佬。排名不分先后,简介如有错误欢迎指出。也欢迎评论增加你知道的程序员@刘群MT-to-Death ...... No 2. [CL] A Survey of Conversational Search 这篇论文全面综述了对话式搜索技术,重点分析了其四个关键模块以及大型语言模型的整合,并指出了该领域面临的挑战和未来的发展方向,尤其强调了多轮交互的复杂性以及如何平衡检索和生成模块以实现更精准、更符合用户需求的搜索体 ...... No 3. 数字人模型:能在手机上实时运行的超轻量级虚拟人,适合移动端的实时互动和娱乐 No 4. NewsNow:优雅阅读实时热门新闻的工具,提供简洁的界面和流畅的阅读体验,让你随时掌握最新资讯 No 5. [LG] Long Term Memory: The Foundation of AI Self-Evolution 本文提出AI应具备自我进化能力,并以长期记忆(LTM)为核心机制,构建多智能体框架OMNE,在GAIA基准测试中取得领先,为AI持续学习和个性化发展提供了新的方向。 ...... No 6. #免费##抽奖# 携手@博文视点Broadview 送出3本《事理图谱:概念与技术》 No 7. [LG]《Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers》 No 8. [LG]《Explaining Graph Neural Networks with Large Language Models: A Counterfactual Perspective for Molecular Property Prediction》 No 9. 早![太阳] No 10. x.infer:框架无关的计算机视觉推理库,它允许用户通过统一的 Python API 运行来自不同框架的多种模型的推理,支持超过1000+模型 No 11. mdx - 执行Markdown中的代码块,让你能直接在Markdown文件中编写并执行代码块,支持多种编程语言,使得文档和代码的结合更加紧密 No 12. [CL]《Little Giants: Synthesizing High-Quality Embedding Data at Scale》 No 13. Computer Use Agents资源库:一个收集了关于Computer Use Agents的资源库,包括论文和博客,旨在帮助理解和开发能够像人类一样使用计算机的智能代理 No 14. Bee Agent Framework:构建可扩展的智能Agent应用框架,让开发者轻松实现基于最新模型的智能工作流,具备代码解释器、记忆策略等多种功能 No 15. ngrid:数据浏览好帮手,就像命令行的“less”命令一样,让你在命令行环境下轻松浏览大型表格数据 No 16. KAG:基于 OpenSPG 引擎的知识增强生成框架,旨在构建知识增强的严谨决策和信息检索知识服务 No 17. 今日推介(第1572期):旋转嵌入如何在自回归transfomer中塑造表征和记忆、更快、更高效的语言模型Off-Policy强化学习、大规模高质量嵌入数据合成、通过基于SAE的表示工程指导大语言模型的知识选择行为、用大语言模型解释图神经网络 ...... No 18. [LG]《Asynchronous RLHF: Faster and More Efficient Off-Policy RL for Language Models》 No 19. [CL]《Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering》 No 20. 本文通过谱分析和实证实验,揭示了旋转位置嵌入 (RoPE) 如何通过引入频率分量及其与非线性激活函数的交互作用,影响 Transformer 模型的内部表示、记忆机制和注意力机制,并强调了相位对齐在其中扮演的关键作用,为理解 Transformer 模型提供了新的视角。//[LG]《Beyond position: how rotary embeddings shape representations and memory in autoregressive transfomers》 No 21. GenoView:基于raylib的动画查看应用,专门用来展示Geno角色的动画,支持骨骼动画数据的清晰展示,便于发现角色动画中的常见问题 No 22. Go-Taskflow:一个类似任务流的有向无环图(DAG)任务执行框架,集成了可视化和性能分析工具,旨在简化并行任务的复杂依赖管理 No 23. 几篇论文实现代码 No 24. 智谱AI语音对话模型:一款能直接理解和生成中英文语音的智能对话系统,支持实时对话并根据指令改变语音属性,让机器交流更自然 No 25. CUDATutorial:手把手教你CUDA高性能编程,从入门到精通,一起学习一起进步 No 26. 具身智能入门指南:为新手提供快速建立关于具身智能领域认知的路径和有用信息,帮助理解智能体与环境的交互获取信息、理解问题、做出决策并实现行动的过程 No 27. Hollama:一个简洁的网页界面,用于与Ollama服务器对话,支持大型提示字段、Markdown渲染、代码编辑功能,以及自定义系统提示和高级Ollama参数 No 28. SPEED框架通过三阶段对齐流程高效地利用小型开源语言模型生成大规模高质量的文本嵌入数据,其成本远低于现有方法,并揭示了合成数据规模与模型性能之间的对数线性关系,挑战了更多数据总是更好这一直觉。 No 29. [TAI快报]Vol.118 解密最新AI突破,普通人也能懂的前沿科技 No 30. DataExpert 数据工程:一个公共知识库,涵盖所有由大型语言模型(LLM)驱动的数据工程概念,帮助你理解并应用LLM技术于数据工程领域 No 31. AMT-APC自动钢琴伴奏:通过微调自动音乐转录模型来训练自动钢琴伴奏生成模型,让你的音乐创作更加智能和便捷 No 32. EveryoneNobel:为每个人生成诺贝尔奖风格的图片,利用ComfyUI进行图像生成,并用HTML模板展示文字,旨在为个人或组织提供一种生成具有纪念意义图片的框架 No 33. [LG]《Rethinking Softmax: Self-Attention with Polynomial Activations》 No 34. DataFusion Ray:分布式数据处理工具,利用Ray和Apache DataFusion进行分布式SQL查询,支持大规模数据集的快速分析 No 35. DocLayout-YOLO:文档布局分析工具,通过多样化的合成数据和全局到局部的自适应感知增强文档布局分析,提升处理速度和准确性 No 36. GraphLLM:一个基于图的框架,用于通过大型语言模型(LLM)处理数据,支持网页搜索和运行Python代码,具有强大的工具集来抓取网页并重新格式化数据,使其对LLM更友好 No 37. 小型模型的妙用:在大型语言模型时代,探索小型模型的独特角色和应用,包括数据筛选、推理增强和知识蒸馏等 No 38. Brush:旨在实现 3D 重建的工具,它使用高斯溅射技术,能够在多种系统和设备上运行,包括 macOS、Windows、Linux、Android 以及浏览器 No 39. 「TAI前沿」第23期 如何选择最适合LLM推理的NVIDIA GPU No 40. [LG]《LiNeS: Post-training Layer Scaling Prevents Forgetting and Enhances Model Merging》 No 41. 晚安~ [月亮] No 42. Mochi 1:一款开源的视频生成模型,以高保真动作和强提示遵循性为特色,缩小了封闭和开放视频生成系统之间的差距 No 43. 本文提出一种异步离线策略RLHF方法,通过分离生成和训练过程,显著提高了RLHF的训练效率,尤其是在大规模模型上,并发现在线DPO算法对离线策略数据具有较强的鲁棒性,但同时也存在计算效率与模型一致性之间的权衡。//[LG]《Asynchronous RLHF: Faster and More Efficient Off-Policy RL for Language Models》 No 44. TileLang/tvm:开源深度学习编译器堆栈,专为CPU、GPU和专业加速器设计,支持简化和高性能的GPU内核编写 No 45. 摩托车模型预测控制:一种用于摩托车控制的先进算法,通过预测未来状态来优化行驶路径和稳定性,特别适合自动驾驶和高性能摩托车 No 46. 本文首次深入研究了大型语言模型在多文档摘要任务中的幻觉问题,发现幻觉率极高且存在显著的结尾偏差和对不存在信息的虚假总结倾向,并指出简单的后处理方法效果有限,为未来研究提供了重要方向。//[CL]《From Single to Multi: How LLMs Hallucinate in Multi-Document Summarization》 No 47. 基于Llama Index + OpenAI API的术语表自动提取 No 48. OURS Project:开源、可升级、可修复、无大科技公司控制的智能手机项目,提供详细的组装指南,让你能自制一部完全属于自己的智能手机 No 49. 美国波士顿动力公司的新款机器人 寰亚SYHP的微博视... No 50. 数学好书推荐:一个汇集了各种数学书籍资源的宝库,无论你是数学专业的学生还是对数学感兴趣的爱好者,都能在这里找到丰富的学习材料和参考书籍