fly51fly / aicoco

“爱可可-爱生活”微博内容精选
495 stars 62 forks source link

爱可可微博热门分享(4.24) #138

Open fly51fly opened 3 weeks ago

fly51fly commented 3 weeks ago

No 1. 用Pytorch从头实现Transformer No 2. seemore:用 PyTorch 从头开始实现的视觉语言模型 No 3. #免费##抽奖# 携手@博文视点Broadview 送出3本《多模态大模型:新一代人工智能技术范式 (全彩)》 No 4. 游戏是学习编程的最佳方式——从CSS、Python、JavaScript到区块链。十个最佳在线通过游戏学编程网站推荐: ...... No 5. ai-diagram-generator:AI 流程图生成器,使用 LlamaIndex 和 Vercel AI SDK 构建的 AI 图表生成器,可以根据给定的主题生成图表,并在生成过程中实时流传输部分图表 No 6. Llama3-8B-Chinese-Chat:首个中文微调LLaMa 3模型,基于 Meta-Llama-3-8B-Instruct 模型,使用 ORPO 对其进行了中文微调,从而提高了其在中文问答中的表现 No 7. 开源机器学习编译器的“理想与现实” src:http://t.cn/A6TEd5ne ​ No 8. 使用PyTorch FSDP和Q-Lora高效微调Llama 3 No 9. llama2.cpp:C++ 版本的 Llama 2 推理库,支持 CPU 计算,并且计划支持 CUDA 和 AVX512 No 10. Unichat-llama3-Chinese:联通AI创新中心发布业界llama3中文指令微调模型 No 11. WebLlama:基于 Llama3 的能浏览网页、可以遵循指令并与用户交互的Agent No 12. [CL]《Better Synthetic Data by Retrieving and Transforming Existing Datasets》 No 13. 用了半个亿GPT Token得出的经验 No 14. jemma:用 AI 代理来将想法转化为代码,进而创建 web 原型 No 15. Demo: 网页链接 Models: 网页链接//[CL] Phi-3 Technical Report: A Highly ...... No 16. MuKoe:开源的 MuZero 实现,利用 Ray 作为分布式调度器,在 GKE 上运行 No 17. A Trivial Jailbreak Against Llama 3:用于绕过 Llama 3 模型安全措施的程序,可以通过在助手角色中插入有害前缀来绕过 Llama 3 的安全措施,从而生成有害的文本,还可以通过调用其他模型生成有害前缀,然后将其传递给 Llama 3 No 18. 早![太阳] No 19. 大模型训练成本估算 ​ No 20. llama3-Chinese-chat:首个llama3 中文版) ,供学习交流演示 No 21. [CL]《Mixture of LoRA Experts》 No 22. [CL] Phi-3 Technical Report: A Highly Capable Language Model ...... No 23. 晚安~ [月亮] ​ No 24. 基于扩散模型的视频生成 No 25. Lumina-T2X: 基于大型扩散Transformer的流式文本到任意模态生成 No 26. 用 Evolutionary Model Merging 优化模型性能 No 27. 免费课程:《Mistral入门》,面向初学者,旨在让学生了解并使用 Mistral AI 的先进开源和商业 LLM 模型 No 28. [CV] Scene Coordinate Reconstruction: Posing of Image Collections ...... No 29. PyPDFForm:Python 3的免费开源 PDF 表单处理库,提供了填充 PDF 表单、创建表单小部件和其他常见实用程序的功能 No 30. LLM在多模态生成领域应用相关论文与资源列表 No 31. [CL]《A Multimodal Automated Interpretability Agent》 No 32. CoreNet: Apple的深度网络训练库,用于训练深度神经网络,支持各种任务,包括基础模型(如 CLIP 和 LLM)、目标分类、目标检测和语义分割 No 33. 几篇论文实现代码 No 34. 提出MOLE方法,通过可学习门控函数实现LoRA层级权重控制,以最小计算开销实现多个LoRA的高效、动态组合,在保留各LoRA个性的同时发挥集成效应,在多任务上的泛化性取得显著提升。//[CL]《Mixture of LoRA Experts》 No 35. 新书:《AI辅助编程》,关于如何利用人工智能开发工具进行代码创建的实用指南,适合初学者和经验丰富的开发者 No 36. [CL]《The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions》 No 37. 'EmoLLM-心理健康大模型 - 心理健康大模型、LLM、The Big Model of Mental Health、Finetune、InternLM2、Qwen、ChatGLM、Baichuan、DeepSeek、Mixtral' ...... No 38. JAT:多功能Transformer智能体 No 39. LLM金融市场应用 No 40. 提出DataTune方法,通过改造现有数据集生成更高质量的任务定制合成训练数据,并在BIG-Bench任务上验证了其有效性。//[CL]《Better Synthetic Data by Retrieving and Transforming Existing Datasets》 No 41. Latent Box:AI、创意和艺术领域的精选合集 No 42. Anything:一个 Mac 应用,用 AI 自动化任何事,类似于 Zapier,但专注于 AI No 43. SnapKV:创新且出色的 KV 缓存压缩方法 No 44. 提出指令层次结构和自动生成训练数据的方法,可以显著提高大型语言模型对提示注入等攻击的鲁棒性,使其更安全可控,仅对能力造成轻微影响。//[CL]《The Instruction Hierarchy: Training LLMs to Prioritize Privileged Instructions》 No 45. Empirical:快速测试和评估 LLM、提示和其他配置,适用于应用的所有重要场景 No 46. MIT新书《计算机视觉基础》,一本关于计算机视觉基础的教材,该教材结合了计算机视觉的经典方法和深度学习的最新进展,并从全面的角度介绍了计算机视觉的基础问题和其与人类感知的关系 No 47. [CV] Groma: Localized Visual Tokenization for Grounding Multimodal ...... No 48. YouTube多语言数据集,包含 YouTube 上的视频信息和相关元数据,总共包含 400k 条记录,字段包括视频标题、链接、描述、发布日期、许可证、原始语言和转录语言等 No 49. 通过语言模型与爬虫技术的结合,提出了垂直信息网页的爬虫生成任务和AUTOCRAWLER框架,可以生成可在多个相似网页上执行的动作序列,从而实现对开放世界场景的更好适应性。//[CL]《AutoCrawler: A Progressive Understanding Web Agent for Web Crawler Generation》 No 50. [CL]《Modeling Emotions and Ethics with Large Language Models》