爱可可微博热门分享(10.14) - Githubissues

fly51fly / aicoco

“爱可可-爱生活”微博内容精选

521 stars 66 forks source link

爱可可微博热门分享(10.14) #301

Open fly51fly opened 1 month ago

fly51fly commented 1 month ago

No 1. 数学好书推荐：一个汇集了各种数学书籍资源的宝库，无论你是数学专业的学生还是对数学感兴趣的爱好者，都能在这里找到丰富的学习材料和参考书籍 No 2. 日常使用的AI工具推荐，涵盖多个领域：(via Alvaro Cintas ) 日常工作: ChatGPT (聊天机器人，用于各种日常任务) ...... No 3. 数据科学家的小手册：《机器学习度量小册子》——旨在成为数据科学家桌面上的参考手册，涵盖从常见的准确率到较为边缘的 P4 指标的各种机器学习度量 No 4. AI学习小径：一个专为中级到高级AI学习者设计的进阶学习路径，包含深度学习基础和进阶资源，特色在于精选的论文、博客和视频教程 No 5. Prompt Engineering Techniques：AI交互技术大全，提供了从基础到高级的提示工程（Prompt Engineering）技术的全面教程和实现，旨在帮助用户掌握有效地与大型语言模型交流和应用的艺术 No 6. 智能文档助手：通过视觉语言模型与你的文档进行对话，这个项目实现了一个端到端的RAG（Retrieval-Augmented Generation）流程，支持本地和专有的视觉语言模型 No 7. In-Context强化学习精选：一个收集上下文强化学习（ICRL）研究论文的资源库，旨在定期更新追踪该领域的前沿进展 No 8. AsrTools：智能语音转文字工具，集成了剪映、快手、必剪的官方接口，支持高效的批量处理，提供用户友好的界面，无需 GPU，可以免费使用大厂的 ASR 服务，支持 SRT 和 TXT 格式的输出 No 9. Dito：一款用Go语言编写的高级第七层反向代理服务器，支持动态配置重载、中间件、分布式缓存和限流，还能自定义后端连接的TLS证书 No 10. OpenR：一个开源框架，专为大型语言模型提供高级推理能力，支持数据生成、策略训练和多种搜索策略，让机器更聪明地理解和解决问题，提供了 MATH-APS 数据集和 MATH-psa 流程奖励模型，并且支持多种推理和训练方法 No 11. TrustCall 工具：基于 LangGraph 的强大工具调用库，旨在通过让 LLM（大型语言模型）生成 JSON 补丁操作来提高生成和修改复杂 JSON 结构的效率和准确性 No 12. [CL]《Round and Round We Go! What makes Rotary Positional Encodings useful?》 No 13. 早！[太阳] No 14. PrimeIntellect AI Prime：一个用于在互联网上高效、全球分布式训练人工智能模型的框架，具备弹性设备网络、异步分布式检查点、实时检查点恢复等特性，旨在优化全球范围内的AI模型训练过程 No 15. 视觉自回归模型论文集：汇总了自回归视觉模型的论文资源，专注于通过序列化建模依赖关系生成高质量内容的模型 No 16. [LG]《Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification》 No 17. AsahiLinux muvm：一款让你在微型虚拟机中运行系统中任意程序的工具，特点是轻量级、易用性，支持多图形应用同时运行 No 18. 数字人动作视频生成资源库：汇总2D数字人动作视频生成的最新研究，包括论文、数据集和代码库，特色在于按视觉、文本、音频驱动分类，并明确五大生成阶段 No 19. Fullmoon iOS：一款为苹果硬件优化的iOS应用，让你能与本地大型语言模型进行聊天，你的聊天记录仅保存在本地，还能自定义应用外观 No 20. 几篇论文实现代码 No 21. [LG] TopoTune : A Framework for Generalized Combinatorial Complex ...... No 22. [CL]《LLMs Know More Than They Show: On the Intrinsic Representation of LLM Hallucinations》 No 23. 本文颠覆性地揭示了旋转位置编码(RoPE)在大型语言模型中的实际工作机制：高频用于构建位置注意力模式，低频用于语义信息处理，但低频的有效性受限于上下文长度，基于此，提出了改进的p-RoPE，并验证了其有效性。//[CL]《Round and Round We Go! What makes Rotary Positional Encodings useful?》 No 24. CoreML Profiler：一款直接从Python对CoreML模型进行性能分析的工具，让模型优化更直观便捷，特色在于简洁的操作和直观的图表展示 No 25. PoolTool 桌球模拟器：一款注重真实物理效果的沙盒桌球游戏，专为科学和工程研究设计，提供快速、灵活的模拟体验以及丰富的可视化和分析工具 No 26. 大语言模型评估指南：关于大型语言模型（LLM）评估的指南，提供了从实践经验到理论知识的见解，旨在帮助用户确保 LLM 在特定任务上表现良好 No 27. [LG]《Strong Model Collapse》 No 28. FLUXSwift：基于Swift语言实现的Flux.1模型，利用mlx-swift库在苹果硅芯片上实现GPU加速，用于生成图像 No 29. 晚安～ [月亮] No 30. OpenAI Swarm：一个实验性的框架，用于构建、编排和部署多智能体系统，由OpenAI解决方案团队管理，旨在探索以人为本、轻量级的多Agent协同模式 No 31. [CL]《Long-Context LLMs Meet RAG: Overcoming Challenges for Long Inputs in RAG》 No 32. Pocache 乐观预加载缓存：一款小巧的缓存工具，专注于预加载乐观缓存策略，通过减少数据库的冗余调用，在保持数据新鲜的同时优化并发环境下的性能 No 33. 欢迎收听「爱可可AI前沿快报」，用最通俗的语言，介绍最前沿的学术进展，思考新成果带给我们的启发，即使你是中学生，也能有所收获！ ...... No 34. 今日推介(第1558期)：LLM幻觉内在表征研究、大语言模型数学推理的局限性、强模型崩溃研究、通过协作验证扩展推理计算改进LLM推理、旋转位置编码为何有用 ...... No 35. 本文通过分析大型语言模型的内部表示，揭示了其“幻觉”错误的产生机制：真实性信息集中于特定词元，但编码方式并非普遍适用，且模型内部可能已知晓正确答案却持续生成错误答案，这为改进错误检测和缓解策略提供了新的思路。 No 36. MGDebugger：多粒度LLM代码调试工具，通过分层调试方法精确定位并解决代码错误，提升代码正确率和调试效率 No 37. 基于 PyTorch 的分布式 VAE（变分自编码器）训练器的实现，该训练器用于训练潜在扩散模型（如稳定扩散模型、FLUX、SORA 等）中的 VAE，并包含了一些修改和优化，如固定方差、LPIPS 损失、低通滤波器重建损失等，以提高训练稳定性和性能 No 38. 《CNN笔记：通俗理解卷积神经网络》 No 39. [LG]《Large Language Models as Markov Chains》 No 40. 本文通过构建一个包含多种LLM生成正确和错误解答的合成数据集，利用无参考偏好调整方法训练验证器，结合CoT和PoT的协同验证方法CoTnPoT，显著提升了大型语言模型的推理能力，并在多个基准测试中取得了最先进的结果，发现基于较弱LLM数据训练的验证器可以显著提升更强LLM的性能。//[LG]《Improving LLM Reasoning through Scaling Inference Computation with Collaborative Verification》 No 41. [LG]《Everything Everywhere All at Once: LLMs can In-Context Learn Multiple Tasks in Superposition》 No 42. 「TAI前沿」第4期 SpaceX星舰突破——迈向火星的新纪元 No 43. WebChat：一款匿名聊天浏览器插件，能在任何网站上实现点对点加密通信，注重隐私，所有数据本地存储 No 44. [LG] Towards a Categorical Foundation of Deep Learning: A Survey ...... No 45. [LG]《Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion》 No 46. CogVideoX Factory：在 24GB GPU 内存下对 Cog 系列视频模型进行微调以实现自定义视频生成，支持多分辨率 No 47. 本文通过理论分析和实证实验，揭示了训练数据中少量合成数据即可导致“模型崩溃”的现象，并意外地发现模型大小对模型崩溃的影响存在双下降曲线，强调了数据质量控制和模型设计的重要性，同时指出现有数据混合策略的局限性。//[LG]《Strong Model Collapse》 No 48. [LG]《GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models》 No 49. 孤立森林异常检测 No 50. 《怎么知道某一学术领域有影响力的国外杂志有哪些？ - 知乎》