fly51fly / aicoco

“爱可可-爱生活”微博内容精选
495 stars 62 forks source link

爱可可微博热门分享(3.17) #102

Open fly51fly opened 2 months ago

fly51fly commented 2 months ago

No 1. 'Transformers 库快速入门教程' GitHub: github.com/jsksxs360/How-to-use-Transformers ...... No 2. #免费##抽奖# 携手@博文视点Broadview 送出3本《大语言模型:原理与工程实践(全彩)》 No 3. 'Awesome-AISourceHub - AI科技领域高质量信息源列表’ GitHub: github.com/AmbroseX/Awesome-AISourceHub ...... No 4. 对开源AI工具的观察总结 No 5. 帮你成为一名优秀工程师领导者的资源列表,项目涵盖软件工程、系统设计、数据工程、领导力和管理等所有领域,让你在2024年成为一名优秀的工程师领导者 No 6. MLGB是一个包含50+点击率预估和推荐系统深度模型的、通过TensorFlow和PyTorch撰写的库 No 7. StyleTTS 2: 可通过pip安装的Python包,用于实现人类水平的文本转语音和语音克隆 No 8. Data is Better Together:由Hugging Face、Argilla和开源机器学习社区共同合作的项目,旨在赋予开源社区共同构建有影响力的数据集的能力。目前,该项目已经创建了一个由10,000个提示组成的数据集,按质量进行了排名 No 9. 整数标记化(tokenization):语言模型数字处理的”bug'? No 10. 大型语言模型(LLM)文本生成的理论速度极限 No 11. Recommender AI Agent: 使用大语言模型提供交互式推荐功能的agent No 12. 大模型数据增强相关文献资源列表 No 13. ArXiv Paper Reader:旨在简化和流利的arXiv论文阅读,使用 LaTeX 代码转换为 HTML 页面,然后提取文本和公式,将其转换为视频,并创建与 PDF 文档匹配的图,以及文本分段并将其转换为音频 No 14. EasyDetect:易于使用的多模态幻觉检测框架,用于多模态大型语言模型(MLLMs)如GPT-4V、Gemini、LlaVA的研究实验,通过统一的视角对多模态幻觉进行检测,包括模态冲突幻觉和事实冲突幻觉 No 15. Local RAG:一个开源项目,使用 开源大预言模型 (LLM) 提取文件并进行检索增强生成 (RAG),无需第三方或敏感数据,在本地保持匿名 No 16. AI-in-a-Box:旨在帮助工程师建立人工智能和机器学习解决方案,并提供快速而高质量的解决方案,以减少架构师的成本和降低风险 No 17. 超赞列表合集,从各类Awesome list项目抓取而来 No 18. 开源路上,别让心理健康成了绊脚石 No 19. 终于回家了,真好,晚安~ [月亮] ​ No 20. AI for Mathematics (AI4Math) 相关文献列表 No 21. [LG]《Continual Learning and Catastrophic Forgetting》 No 22. NeMo Curator:一个 Python 库,用于创建和处理自然语言处理 (NLP) 数据集,以便训练大型语言模型 (LLM)。该库包含一些可扩展的模块,允许 NLP 研究人员从无标注 Web 采集高质量文本,并提供 GPU 加速功能 No 23. AutoDev:自动代码生成器,支持多语言的 AI 代码生成,提供自动代码生成、调试和文档功能,帮程序员提高效率 No 24. Cpptrace:一个简洁、可移植和自建的 C++ stacktracker 库,支持 C++11 及更高版本的 Linux、macOS 和 Windows 运行环境,包括 MinGW 和 Cygwingwin。其目的是简化堆栈追踪,使其变得更容易 No 25. DRL-Based Trajectory Tracking (DRLTT) 是一个用于自动驾驶轨迹跟踪的开源项目,它结合深度强化学习(DRL)技术,并具有高效性和准确性的功能,可用于轨迹跟踪任务 No 26. Deepfakes:从数字现实到虚假现实 No 27. BrowserGym: 用于 Web 任务自动化的开源项目,提供 Chrome 浏览器环境的 Gym 集成,用于自动化各种网站和应用的任务 No 28. [LG] Poly-View Contrastive Learning 展示了一种名为多视对比学习(Poly-View ...... No 29. Pretzel是一个开源,在线浏览器式数据探索和可视化的工具,提供快速便捷的数据分析和可视化功能。它无需后台设置,可在浏览器中实时运行,无需任何服务器连接。Pretzel通过视觉化的数据变换区块轻松操控数据,并实时更新所有与变换区块和图表相关的区块和图表 No 30. [CL]《Algorithmic progress in language models》 No 31. [CL]《RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation》 No 32. OPEN TEACH: 多功能遥操作框架,使用Meta Quest3进行机器人操作,具有灵活性和多样性,包括VR应用程序的Unity脚本、遥操作流程和演示数据收集流程,支持在各种机器人和仿真环境下进行遥操作和数据收集,并针对不同机器人和仿真进行策略训练 No 33. GPT Newspaper:是一个 AI 自动化的新闻平台,通过人工智能自动新闻创作,定制新闻页面,提供个性化的新闻体验 No 34. 提出一种新的检索增强思考(RAT)方法,通过在生成过程中逐步整合和修正检索到的信息,显著提高了大型语言模型在长期生成任务中的推理能力和生成质量,同时大幅降低了模型响应中的幻觉现象。//[CL]《RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation》 No 35. flybody是一个用于 MuJoCo 物理模拟和强化学习应用的果蝇模型,基于 Google DeepMind 和 HHMI Janelia 研究中心的相结合的作品,旨在建立果蝇体系生物物理模拟平台 No 36. Skyvern 利用 LLM 和计算机视觉,自动化浏览器基础工作流。它提供一个简洁的 API 端点,允许完全自动化手动工作流,取代难以维护或易于故障的自动化解决方案 No 37. ChatOllama:基于Nuxt 3和Ollama的聊天Web应用 No 38. 早![太阳] No 39. Flux 是一个 C++20 库,提供一系列用于序列处理的算法和适配器,类似于 C++20 ranges、Python itertools 和 Rust iterators No 40. 几篇论文实现代码 No 41. 视频生成相关研究列表 No 42. 通过分析超过200个语言模型的评估数据,揭示了在过去十年预训练算法带来的进步速率,强调尽管算法和架构创新进展迅速,但增大的计算资源对语言模型性能的提升贡献更大。//[CL]《Algorithmic progress in language models》 No 43. [LG]《AutoEval Done Right: Using Synthetic Data for Model Evaluation》 No 44. ShareGPT Builder:一个功能强大的 Flask 应用,用于创建和存储 ChatGPT 模型的训练样本,允许手动创建和存储 SFT 格式的聊天对话,并自动将其添加到 JSON 文件中,以便其他模型可访问 No 45. [IR]《ACORN: Performant and Predicate-Agnostic Search Over Vector Embeddings and Structured Data》 No 46. [CV] MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training ...... No 47. 'Campus2025 - 2025届互联网校招信息汇总' GitHub: github.com/NAOSI-DLUT/Campus2025 ...... No 48. 扩散蒸馏相关论文资源列表 No 49. 今日推介(第1346期):让语言模型教自己先想再说、通过结构化训练从灾难性遗忘中预期性恢复、用于验证马尔可夫决策过程的学习算法、用Moment ...... No 50. MIMo:用于婴儿认知发展研究的开源平台,提供分析婴儿认知发育的关键数据和功能