fly51fly / aicoco

“爱可可-爱生活”微博内容精选
495 stars 62 forks source link

爱可可微博热门分享(4.25) #139

Open fly51fly opened 3 weeks ago

fly51fly commented 3 weeks ago

No 1. #免费##抽奖# 携手@博文视点Broadview 送出3本《多模态大模型:新一代人工智能技术范式 (全彩)》 No 2. 用Pytorch从头实现Transformer No 3. tiny-gpu:开源的 Verilog 语言编写的 GPU 设计项目,旨在帮助人们从底层上理解 GPU 是如何工作的 No 4. 'Llama3-Chinese:以Meta-Llama-3-8B为底座,使用 DORA + LORA+ 的训练方法,在50w高质量中文多轮SFT数据 ...... No 5. phidata:为 LLM 添加长期记忆,旨在解决 LLM 有限的上下文和无法采取行动的问题 No 6. [CL] Achieving >97% on GSM8K: Deeply Understanding the Problems ...... No 7. 游戏是学习编程的最佳方式——从CSS、Python、JavaScript到区块链。十个最佳在线通过游戏学编程网站推荐: ...... No 8. [CL]《Transformers Can Represent nn-gram Language Models》 No 9. Unichat-llama3-Chinese:联通AI创新中心发布业界llama3中文指令微调模型 No 10. 信息图:商用LLM参数规模一览 src: ​ No 11. Infinite-Realities 展示了实时 3D/4D Gaussian splatting 的最新工作,可以捕捉从复杂的角色互动到动态的快速战斗场景,甚至是家人和朋友的记忆,其重点是高质量和高保真度。 ...... No 12. Snowflake Arctic:面向企业AI的大语言模型 No 13. 早![太阳] ​ No 14. llama2.cpp:C++ 版本的 Llama 2 推理库,支持 CPU 计算,并且计划支持 CUDA 和 AVX512 No 15. 用AI编辑人类基因 No 16. [CL]《Multi-Head Mixture-of-Experts》 No 17. 用了半个亿GPT Token得出的经验 No 18. 用AutoTrain Advanced在MacBook Pro上微调phi-3模型 No 19. A Trivial Jailbreak Against Llama 3:用于绕过 Llama 3 模型安全措施的程序,可以通过在助手角色中插入有害前缀来绕过 Llama 3 的安全措施,从而生成有害的文本,还可以通过调用其他模型生成有害前缀,然后将其传递给 Llama 3 No 20. LLMBox:用于实现大语言模型的综合库,提供统一的训练流程和全面的模型评估 No 21. Cohere Toolkit:一组预构建的组件,使用户能够快速构建和部署 RAG(Retrieval Augmented Generation)应用 No 22. Meta做了OpenAI本该做的 No 23. 通过构造等价的Transformer语言模型,证明了Transformer可以精确表示传统n-gram语言模型,建立了它们之间的确切数学关系,是理解Transformer概率表示能力的第一步。//[CL]《Transformers Can Represent nn-gram Language Models》 No 24. [CV] FlowMap: High-Quality Camera Poses, Intrinsics, and Depth ...... No 25. [LG]《NExT: Teaching Large Language Models to Reason about Code Execution》 No 26. seemore:用 PyTorch 从头开始实现的视觉语言模型 No 27. 使用PyTorch FSDP和Q-Lora高效微调Llama 3 No 28. [CL] Phi-3 Technical Report: A Highly Capable Language Model ...... No 29. 基于扩散模型的视频生成 No 30. 文档图像处理的论文和数据集列表,涵盖了外观增强、阴影消除、矫正、去模糊和二值化等方面 No 31. Diarizers:使用 Hugging Face 生态系统微调 Pyannote 说话人辨识模型的库 No 32. LangChain Rust:用 Rust 语言实现的 LangChain,提供了 LLM、Embeddings、VectorStores、Chain、Agents、Tools 等功能,并支持多种 LLM 和 VectorStores No 33. WebLlama:基于 Llama3 的能浏览网页、可以遵循指令并与用户交互的Agent No 34. 开源机器学习编译器的“理想与现实” src:http://t.cn/A6TEd5ne ​ No 35. [CL]《OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework》 No 36. 今日推介(第1386期):基于开源训练和推理框架的高效语言模型族、从对抗压缩角度重新思考LLM记忆、教大型语言模型推理代码执行、多头Mixture-of-Experts、Transformer可以表示n-gram语言模型 ...... No 37. 几篇论文实现代码 No 38. [CL]《Better Synthetic Data by Retrieving and Transforming Existing Datasets》 No 39. [LG]《Rethinking LLM Memorization through the Lens of Adversarial Compression》 No 40. [CL] A Survey on Self-Evolution of Large Language Models 网页链接 ...... No 41. llama3-Chinese-chat:首个llama3 中文版) ,供学习交流演示 No 42. MuKoe:开源的 MuZero 实现,利用 Ray 作为分布式调度器,在 GKE 上运行 No 43. [CL]《A Multimodal Automated Interpretability Agent》 No 44. [CL] AdvPrompter: Fast Adaptive Adversarial Prompting for ...... No 45. Terrarium - A Simple Python Sandbox:简单易用的 Python 沙箱,用于执行不受信任的用户或 LLM 生成的 Python 代码 No 46. 'QuickRecorder - A lightweight screen recorder based on ScreenCapture ...... No 47. 新书:《AI辅助编程》,关于如何利用人工智能开发工具进行代码创建的实用指南,适合初学者和经验丰富的开发者 No 48. OpenELM通过采用层级缩放策略、在公开数据集预训练后微调,实现了transformer语言模型效果的改进,并发布了完整的开源框架,以推动该领域的公开研究。//[CL]《OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework》 No 49. [CL] SnapKV: LLM Knows What You are Looking for Before Generation ...... No 50. LLM在多模态生成领域应用相关论文与资源列表