Open fly51fly opened 1 month ago
No 1. 数学好书推荐:一个汇集了各种数学书籍资源的宝库,无论你是数学专业的学生还是对数学感兴趣的爱好者,都能在这里找到丰富的学习材料和参考书籍 No 2. 日常使用的AI工具推荐,涵盖多个领域:(via Alvaro Cintas ) 日常工作: ChatGPT (聊天机器人,用于各种日常任务) ...... No 3. 数据科学家的小手册:《机器学习度量小册子》——旨在成为数据科学家桌面上的参考手册,涵盖从常见的准确率到较为边缘的 P4 指标的各种机器学习度量 No 4. AI学习小径:一个专为中级到高级AI学习者设计的进阶学习路径,包含深度学习基础和进阶资源,特色在于精选的论文、博客和视频教程 No 5. Prompt Engineering Techniques:AI交互技术大全,提供了从基础到高级的提示工程(Prompt Engineering)技术的全面教程和实现,旨在帮助用户掌握有效地与大型语言模型交流和应用的艺术 No 6. 智能文档助手:通过视觉语言模型与你的文档进行对话,这个项目实现了一个端到端的RAG(Retrieval-Augmented Generation)流程,支持本地和专有的视觉语言模型 No 7. In-Context强化学习精选:一个收集上下文强化学习(ICRL)研究论文的资源库,旨在定期更新追踪该领域的前沿进展 No 8. AsrTools:智能语音转文字工具,集成了剪映、快手、必剪的官方接口,支持高效的批量处理,提供用户友好的界面,无需 GPU,可以免费使用大厂的 ASR 服务,支持 SRT 和 TXT 格式的输出 No 9. Dito:一款用Go语言编写的高级第七层反向代理服务器,支持动态配置重载、中间件、分布式缓存和限流,还能自定义后端连接的TLS证书 No 10. OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且支持多种推理和训练方法 No 11. TrustCall 工具:基于 LangGraph 的强大工具调用库,旨在通过让 LLM(大型语言模型)生成 JSON 补丁操作来提高生成和修改复杂 JSON 结构的效率和准确性 No 12. [CL]《Round and Round We Go! What makes Rotary Positional Encodings useful?》 No 13. 早![太阳] No 14. PrimeIntellect AI Prime:一个用于在互联网上高效、全球分布式训练人工智能模型的框架,具备弹性设备网络、异步分布式检查点、实时检查点恢复等特性,旨在优化全球范围内的AI模型训练过程 No 15. 视觉自回归模型论文集:汇总了自回归视觉模型的论文资源,专注于通过序列化建模依赖关系生成高质量内容的模型 No 16. [LG]《Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification》 No 17. AsahiLinux muvm:一款让你在微型虚拟机中运行系统中任意程序的工具,特点是轻量级、易用性,支持多图形应用同时运行 No 18. 数字人动作视频生成资源库:汇总2D数字人动作视频生成的最新研究,包括论文、数据集和代码库,特色在于按视觉、文本、音频驱动分类,并明确五大生成阶段 No 19. Fullmoon iOS:一款为苹果硬件优化的iOS应用,让你能与本地大型语言模型进行聊天,你的聊天记录仅保存在本地,还能自定义应用外观 No 20. 几篇论文实现代码 No 21. [LG] TopoTune : A Framework for Generalized Combinatorial Complex ...... No 22. [CL]《LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations》 No 23. 本文颠覆性地揭示了旋转位置编码(RoPE)在大型语言模型中的实际工作机制:高频用于构建位置注意力模式,低频用于语义信息处理,但低频的有效性受限于上下文长度,基于此,提出了改进的p-RoPE,并验证了其有效性。//[CL]《Round and Round We Go! What makes Rotary Positional Encodings useful?》 No 24. CoreML Profiler:一款直接从Python对CoreML模型进行性能分析的工具,让模型优化更直观便捷,特色在于简洁的操作和直观的图表展示 No 25. PoolTool 桌球模拟器:一款注重真实物理效果的沙盒桌球游戏,专为科学和工程研究设计,提供快速、灵活的模拟体验以及丰富的可视化和分析工具 No 26. 大语言模型评估指南:关于大型语言模型(LLM)评估的指南,提供了从实践经验到理论知识的见解,旨在帮助用户确保 LLM 在特定任务上表现良好 No 27. [LG]《Strong Model Collapse》 No 28. FLUXSwift:基于Swift语言实现的Flux.1模型,利用mlx-swift库在苹果硅芯片上实现GPU加速,用于生成图像 No 29. 晚安~ [月亮] No 30. OpenAI Swarm:一个实验性的框架,用于构建、编排和部署多智能体系统,由OpenAI解决方案团队管理,旨在探索以人为本、轻量级的多Agent协同模式 No 31. [CL]《Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG》 No 32. Pocache 乐观预加载缓存:一款小巧的缓存工具,专注于预加载乐观缓存策略,通过减少数据库的冗余调用,在保持数据新鲜的同时优化并发环境下的性能 No 33. 欢迎收听「爱可可AI前沿快报」,用最通俗的语言,介绍最前沿的学术进展,思考新成果带给我们的启发,即使你是中学生,也能有所收获! ...... No 34. 今日推介(第1558期):LLM幻觉内在表征研究、大语言模型数学推理的局限性、强模型崩溃研究、通过协作验证扩展推理计算改进LLM推理、旋转位置编码为何有用 ...... No 35. 本文通过分析大型语言模型的内部表示,揭示了其“幻觉”错误的产生机制:真实性信息集中于特定词元,但编码方式并非普遍适用,且模型内部可能已知晓正确答案却持续生成错误答案,这为改进错误检测和缓解策略提供了新的思路。 No 36. MGDebugger:多粒度LLM代码调试工具,通过分层调试方法精确定位并解决代码错误,提升代码正确率和调试效率 No 37. 基于 PyTorch 的分布式 VAE(变分自编码器)训练器的实现,该训练器用于训练潜在扩散模型(如稳定扩散模型、FLUX、SORA 等)中的 VAE,并包含了一些修改和优化,如固定方差、LPIPS 损失、低通滤波器重建损失等,以提高训练稳定性和性能 No 38. 《CNN笔记:通俗理解卷积神经网络》 No 39. [LG]《Large Language Models as Markov Chains》 No 40. 本文通过构建一个包含多种LLM生成正确和错误解答的合成数据集,利用无参考偏好调整方法训练验证器,结合CoT和PoT的协同验证方法CoTnPoT,显著提升了大型语言模型的推理能力,并在多个基准测试中取得了最先进的结果,发现基于较弱LLM数据训练的验证器可以显著提升更强LLM的性能。//[LG]《Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification》 No 41. [LG]《Everything Everywhere All at Once: LLMs can In-Context Learn Multiple Tasks in Superposition》 No 42. 「TAI前沿」第4期 SpaceX星舰突破——迈向火星的新纪元 No 43. WebChat:一款匿名聊天浏览器插件,能在任何网站上实现点对点加密通信,注重隐私,所有数据本地存储 No 44. [LG] Towards a Categorical Foundation of Deep Learning: A Survey ...... No 45. [LG]《Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion》 No 46. CogVideoX Factory:在 24GB GPU 内存下对 Cog 系列视频模型进行微调以实现自定义视频生成,支持多分辨率 No 47. 本文通过理论分析和实证实验,揭示了训练数据中少量合成数据即可导致“模型崩溃”的现象,并意外地发现模型大小对模型崩溃的影响存在双下降曲线,强调了数据质量控制和模型设计的重要性,同时指出现有数据混合策略的局限性。//[LG]《Strong Model Collapse》 No 48. [LG]《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》 No 49. 孤立森林异常检测 No 50. 《怎么知道某一学术领域有影响力的国外杂志有哪些? - 知乎》
No 1. 数学好书推荐:一个汇集了各种数学书籍资源的宝库,无论你是数学专业的学生还是对数学感兴趣的爱好者,都能在这里找到丰富的学习材料和参考书籍 No 2. 日常使用的AI工具推荐,涵盖多个领域:(via Alvaro Cintas ) 日常工作: ChatGPT (聊天机器人,用于各种日常任务) ...... No 3. 数据科学家的小手册:《机器学习度量小册子》——旨在成为数据科学家桌面上的参考手册,涵盖从常见的准确率到较为边缘的 P4 指标的各种机器学习度量 No 4. AI学习小径:一个专为中级到高级AI学习者设计的进阶学习路径,包含深度学习基础和进阶资源,特色在于精选的论文、博客和视频教程 No 5. Prompt Engineering Techniques:AI交互技术大全,提供了从基础到高级的提示工程(Prompt Engineering)技术的全面教程和实现,旨在帮助用户掌握有效地与大型语言模型交流和应用的艺术 No 6. 智能文档助手:通过视觉语言模型与你的文档进行对话,这个项目实现了一个端到端的RAG(Retrieval-Augmented Generation)流程,支持本地和专有的视觉语言模型 No 7. In-Context强化学习精选:一个收集上下文强化学习(ICRL)研究论文的资源库,旨在定期更新追踪该领域的前沿进展 No 8. AsrTools:智能语音转文字工具,集成了剪映、快手、必剪的官方接口,支持高效的批量处理,提供用户友好的界面,无需 GPU,可以免费使用大厂的 ASR 服务,支持 SRT 和 TXT 格式的输出 No 9. Dito:一款用Go语言编写的高级第七层反向代理服务器,支持动态配置重载、中间件、分布式缓存和限流,还能自定义后端连接的TLS证书 No 10. OpenR:一个开源框架,专为大型语言模型提供高级推理能力,支持数据生成、策略训练和多种搜索策略,让机器更聪明地理解和解决问题,提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型,并且支持多种推理和训练方法 No 11. TrustCall 工具:基于 LangGraph 的强大工具调用库,旨在通过让 LLM(大型语言模型)生成 JSON 补丁操作来提高生成和修改复杂 JSON 结构的效率和准确性 No 12. [CL]《Round and Round We Go! What makes Rotary Positional Encodings useful?》 No 13. 早![太阳] No 14. PrimeIntellect AI Prime:一个用于在互联网上高效、全球分布式训练人工智能模型的框架,具备弹性设备网络、异步分布式检查点、实时检查点恢复等特性,旨在优化全球范围内的AI模型训练过程 No 15. 视觉自回归模型论文集:汇总了自回归视觉模型的论文资源,专注于通过序列化建模依赖关系生成高质量内容的模型 No 16. [LG]《Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification》 No 17. AsahiLinux muvm:一款让你在微型虚拟机中运行系统中任意程序的工具,特点是轻量级、易用性,支持多图形应用同时运行 No 18. 数字人动作视频生成资源库:汇总2D数字人动作视频生成的最新研究,包括论文、数据集和代码库,特色在于按视觉、文本、音频驱动分类,并明确五大生成阶段 No 19. Fullmoon iOS:一款为苹果硬件优化的iOS应用,让你能与本地大型语言模型进行聊天,你的聊天记录仅保存在本地,还能自定义应用外观 No 20. 几篇论文实现代码 No 21. [LG] TopoTune : A Framework for Generalized Combinatorial Complex ...... No 22. [CL]《LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations》 No 23. 本文颠覆性地揭示了旋转位置编码(RoPE)在大型语言模型中的实际工作机制:高频用于构建位置注意力模式,低频用于语义信息处理,但低频的有效性受限于上下文长度,基于此,提出了改进的p-RoPE,并验证了其有效性。//[CL]《Round and Round We Go! What makes Rotary Positional Encodings useful?》 No 24. CoreML Profiler:一款直接从Python对CoreML模型进行性能分析的工具,让模型优化更直观便捷,特色在于简洁的操作和直观的图表展示 No 25. PoolTool 桌球模拟器:一款注重真实物理效果的沙盒桌球游戏,专为科学和工程研究设计,提供快速、灵活的模拟体验以及丰富的可视化和分析工具 No 26. 大语言模型评估指南:关于大型语言模型(LLM)评估的指南,提供了从实践经验到理论知识的见解,旨在帮助用户确保 LLM 在特定任务上表现良好 No 27. [LG]《Strong Model Collapse》 No 28. FLUXSwift:基于Swift语言实现的Flux.1模型,利用mlx-swift库在苹果硅芯片上实现GPU加速,用于生成图像 No 29. 晚安~ [月亮] No 30. OpenAI Swarm:一个实验性的框架,用于构建、编排和部署多智能体系统,由OpenAI解决方案团队管理,旨在探索以人为本、轻量级的多Agent协同模式 No 31. [CL]《Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG》 No 32. Pocache 乐观预加载缓存:一款小巧的缓存工具,专注于预加载乐观缓存策略,通过减少数据库的冗余调用,在保持数据新鲜的同时优化并发环境下的性能 No 33. 欢迎收听「爱可可AI前沿快报」,用最通俗的语言,介绍最前沿的学术进展,思考新成果带给我们的启发,即使你是中学生,也能有所收获! ...... No 34. 今日推介(第1558期):LLM幻觉内在表征研究、大语言模型数学推理的局限性、强模型崩溃研究、通过协作验证扩展推理计算改进LLM推理、旋转位置编码为何有用 ...... No 35. 本文通过分析大型语言模型的内部表示,揭示了其“幻觉”错误的产生机制:真实性信息集中于特定词元,但编码方式并非普遍适用,且模型内部可能已知晓正确答案却持续生成错误答案,这为改进错误检测和缓解策略提供了新的思路。 No 36. MGDebugger:多粒度LLM代码调试工具,通过分层调试方法精确定位并解决代码错误,提升代码正确率和调试效率 No 37. 基于 PyTorch 的分布式 VAE(变分自编码器)训练器的实现,该训练器用于训练潜在扩散模型(如稳定扩散模型、FLUX、SORA 等)中的 VAE,并包含了一些修改和优化,如固定方差、LPIPS 损失、低通滤波器重建损失等,以提高训练稳定性和性能 No 38. 《CNN笔记:通俗理解卷积神经网络》 No 39. [LG]《Large Language Models as Markov Chains》 No 40. 本文通过构建一个包含多种LLM生成正确和错误解答的合成数据集,利用无参考偏好调整方法训练验证器,结合CoT和PoT的协同验证方法CoTnPoT,显著提升了大型语言模型的推理能力,并在多个基准测试中取得了最先进的结果,发现基于较弱LLM数据训练的验证器可以显著提升更强LLM的性能。//[LG]《Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification》 No 41. [LG]《Everything Everywhere All at Once: LLMs can In-Context Learn Multiple Tasks in Superposition》 No 42. 「TAI前沿」第4期 SpaceX星舰突破——迈向火星的新纪元 No 43. WebChat:一款匿名聊天浏览器插件,能在任何网站上实现点对点加密通信,注重隐私,所有数据本地存储 No 44. [LG] Towards a Categorical Foundation of Deep Learning: A Survey ...... No 45. [LG]《Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion》 No 46. CogVideoX Factory:在 24GB GPU 内存下对 Cog 系列视频模型进行微调以实现自定义视频生成,支持多分辨率 No 47. 本文通过理论分析和实证实验,揭示了训练数据中少量合成数据即可导致“模型崩溃”的现象,并意外地发现模型大小对模型崩溃的影响存在双下降曲线,强调了数据质量控制和模型设计的重要性,同时指出现有数据混合策略的局限性。//[LG]《Strong Model Collapse》 No 48. [LG]《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》 No 49. 孤立森林异常检测 No 50. 《怎么知道某一学术领域有影响力的国外杂志有哪些? - 知乎》