Open fly51fly opened 3 weeks ago
No 1. Tabled:一款能从PDF和图片中智能识别并提取表格数据的小工具,支持输出为Markdown和CSV格式,让你的数据整理工作更轻松 No 2. Adaline Gateway:一款本地生产级别的超级软件开发工具包SDK,提供简单、统一且强大的接口,可调用200多种大型语言模型LLMs,支持本地部署,功能丰富,不依赖外部代理 No 3. fastdata:高性能的 C++ 头文件库,用于实时对象检测,支持多版本 YOLO 模型,并通过 ONNX Runtime 和 OpenCV 实现了优化的 CPU 和 GPU 推理 No 4. [LG]《One Step Diffusion via Shortcut Models》 No 5. #免费##抽奖# 携手@图灵新知 送出3本《算法图解(第2版)》 No 6. #免费##抽奖# 携手@博文视点Broadview 送出3本《大模型推荐系统:算法原理、代码实战与案例分析》 No 7. [RO] 3D Gaussian Splatting in Robotics: A Survey 本文对 3D 高斯Splatting ...... No 8. Awesome O1:收集了与 OpenAI 的 o1 相关的研究论文,并提供了相关的文件和脚本 No 9. Mini-Omni2:一款多模态交互模型,能听懂图像、音频和文本输入,并能与用户进行端到端的语音对话,具有实时语音输出和灵活的交互能力 No 10. WePOINTS项目:由微信AI团队研发的多模态模型套件,旨在创建一个统一框架,以适应不同的模态,推动内容理解和生成的无缝统一 No 11. Cirkit:用于构建、学习和推理概率机器学习模型的 Python 框架,特别是用于概率电路和张量网络 No 12. [RO]《In-Context Learning Enables Robot Action Prediction in LLMs》 No 13. [LG]《Model Balancing Helps Low-data Training and Fine-tuning》 No 14. 早![太阳] No 15. 晚安~ [月亮] No 16. Ditto:简单的自我构建编码Agent,允许用户通过自然语言描述生成多文件的 Flask 应用程序 No 17. [CL]《OMCAT: Omni Context Aware Transformer》 No 18. DROID-Splat:一款结合了相机校准、单目深度预测和密集渲染的端到端SLAM系统,能够实时优化姿态和3D重建 No 19. Maroto:一种简单快速创建PDF文件的方法,灵感来源于Bootstrap,使用gofpdf库,让你像制作网站一样轻松制作PDF No 20. OpenAI实时API客户端:简单的Python客户端和工具,用于与OpenAI的实时API交互,特别适合快速构建自定义的语音助手 No 21. 几篇论文实现代码 No 22. Turbo-Alignment:专门用于大型语言模型微调和对齐的库,它提供了一系列高效和可扩展的技术,以及广泛的支持方法和指标,旨在简化模型的训练和部署过程 No 23. xfeatSLAM:集成了轻量级深度特征提取架构 XFeat 与 ORB-SLAM3 流程的实时同步定位与地图构建系统,旨在为有限计算资源的移动机器人和嵌入式系统提供高效的 SLAM 解决方案 No 24. TapeAgents:一款支持大型语言模型(LLM)Agent开发全周期的框架,能够通过处理会话日志(Tape)来辅助代理进行思考和行动,具有灵活性和调试工具 No 25. fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据 No 26. Open Canvas:开源的网络应用程序,旨在与代理合作编写文档,灵感来源于 OpenAI 的 'Canvas',但具有一些关键的差异,如开源代码、内置记忆功能、以及从现有文档开始工作的能力 No 27. Makedown:用Markdown编写可执行的脚本,让文档和命令行工具完美结合,支持多语言执行和语法高亮 No 28. //@爱可可-爱生活:欢迎参与~//#免费##抽奖# 携手@图灵新知 送出3本《算法图解(第2版)》 No 29. 今日推介(第1562期):通过捷径模型实现一步扩散、忠实逻辑辅助推理和探索、全方位上下文感知Transformer、用上下文学习实现LLM机器人行动预测、模型均衡有助于低数据训练和微调 ...... No 30. 「TAI前沿」第11期 Yann LeCun展望下一代AI系统:超越大型语言模型的未来之路 No 31. Nixiesearch 混合搜索引擎:一个混合搜索引擎,结合了传统文本搜索和语义搜索的最佳特性,专为云原生环境设计,支持自动扩展,并且能够通过机器学习模型对搜索结果进行优化 No 32. 本文提出了一种名为“捷径模型”的新型生成模型,通过巧妙的自一致性训练方法,在单步或少步采样中实现了高质量图像生成,并超越了现有方法,展现了其在不同领域的应用潜力,其反直觉的训练方法和优异的性能尤其引人注目。//[LG]《One Step Diffusion via Shortcut Models》 No 33. AI实操Excel:通过Excel实现人工智能基础算法的练习工具,让你亲手体验和学习AI的核心操作,如Softmax、LeakyReLU等,适合初学者和爱好者 No 34. AR智能数据采集:利用增强现实技术收集高质量人类示范数据,助力机器人学习,通过AR反馈提升数据采集效率 No 35. 今日推介(第1561期):通过群体智能协作搜索来自适应LLM专家、用Agent评估智Agent、连续时间一致性模型的简化稳定和扩展、智能体化信息检索、视频潜动作预训练 ...... No 36. UVR5 UI:一款用户友好的界面工具,旨在帮助用户从音频或视频中去除人声,支持多种模型和批量处理功能,让音频分离变得简单快捷 No 37. AI学习小径:一个专为中级到高级AI学习者设计的进阶学习路径,包含深度学习基础和进阶资源,特色在于精选的论文、博客和视频教程 No 38. MODEL SWARMS 提出了一种基于群体智能的LLM协同搜索适配算法,无需微调,在低数据场景下即可灵活适应多种目标,并能涌现出模型初始检查点中未曾预见的全新能力,显著优于现有基线方法。 No 39. [LG]《Simplifying, Stabilizing and Scaling Continuous-Time Consistency Models》 No 40. [LG]《FLARE: Faithful Logic-Aided Reasoning and Exploration》 No 41. [CL]《Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence》 No 42. Forscape:面向科学计算的编程语言和编辑器,旨在通过低成本的抽象、安全检查和直观的用户体验来解决工程问题,特别强调矩阵运算,并提供了一个支持数学渲染的编辑器 No 43. [IR]《Agentic Information Retrieval》 No 44. Skore:允许数据科学家通过 Python 代码创建跟踪和可视化的工具,支持存储多种类型的对象,并提供一个用户友好的仪表板来组织和导出这些对象到 HTML 文件 No 45. 本文提出了一种新型多模态大型语言模型 OMCAT,通过一个新的合成数据集 OCTAV 和改进的时间嵌入方法 RoTE,显著提升了细粒度跨模态时间理解能力,并在多个基准测试中取得了最先进的性能,尤其是在处理时间锚定任务和事件转换方面展现出反直觉的有效性。//[CL]《OMCAT: Omni Context Aware Transformer》 No 46. [CL]《Differential Transformer》 No 47. 智能模型融合DAM:一种自动化技术,能够将多个具有独特功能的大语言模型(LLM)合并,优化模型间的平衡,提高数据效率并降低计算成本,超越了传统和进化方法,为多样化的AI系统提供可扩展的解决方案 No 48. 三年面试五年模拟:AI行业面试笔试经验与知识宝典,专为算法工程师设计,覆盖AIGC、深度学习、自动驾驶等领域 No 49. Awesome_GPT_Super_Prompting:集合了GPT模型破解、提示注入、安全防护等资源的宝库,专注于探索和分享GPT模型的高级使用技巧和潜在漏洞 No 50. PyMOL-PUB:为出版物快速生成高质量结构图像的PyMOL扩展工具,通过简化操作和批量可视化协议,大幅减少手动操作,快速获得符合出版标准的图像输出
No 1. Tabled:一款能从PDF和图片中智能识别并提取表格数据的小工具,支持输出为Markdown和CSV格式,让你的数据整理工作更轻松 No 2. Adaline Gateway:一款本地生产级别的超级软件开发工具包SDK,提供简单、统一且强大的接口,可调用200多种大型语言模型LLMs,支持本地部署,功能丰富,不依赖外部代理 No 3. fastdata:高性能的 C++ 头文件库,用于实时对象检测,支持多版本 YOLO 模型,并通过 ONNX Runtime 和 OpenCV 实现了优化的 CPU 和 GPU 推理 No 4. [LG]《One Step Diffusion via Shortcut Models》 No 5. #免费##抽奖# 携手@图灵新知 送出3本《算法图解(第2版)》 No 6. #免费##抽奖# 携手@博文视点Broadview 送出3本《大模型推荐系统:算法原理、代码实战与案例分析》 No 7. [RO] 3D Gaussian Splatting in Robotics: A Survey 本文对 3D 高斯Splatting ...... No 8. Awesome O1:收集了与 OpenAI 的 o1 相关的研究论文,并提供了相关的文件和脚本 No 9. Mini-Omni2:一款多模态交互模型,能听懂图像、音频和文本输入,并能与用户进行端到端的语音对话,具有实时语音输出和灵活的交互能力 No 10. WePOINTS项目:由微信AI团队研发的多模态模型套件,旨在创建一个统一框架,以适应不同的模态,推动内容理解和生成的无缝统一 No 11. Cirkit:用于构建、学习和推理概率机器学习模型的 Python 框架,特别是用于概率电路和张量网络 No 12. [RO]《In-Context Learning Enables Robot Action Prediction in LLMs》 No 13. [LG]《Model Balancing Helps Low-data Training and Fine-tuning》 No 14. 早![太阳] No 15. 晚安~ [月亮] No 16. Ditto:简单的自我构建编码Agent,允许用户通过自然语言描述生成多文件的 Flask 应用程序 No 17. [CL]《OMCAT: Omni Context Aware Transformer》 No 18. DROID-Splat:一款结合了相机校准、单目深度预测和密集渲染的端到端SLAM系统,能够实时优化姿态和3D重建 No 19. Maroto:一种简单快速创建PDF文件的方法,灵感来源于Bootstrap,使用gofpdf库,让你像制作网站一样轻松制作PDF No 20. OpenAI实时API客户端:简单的Python客户端和工具,用于与OpenAI的实时API交互,特别适合快速构建自定义的语音助手 No 21. 几篇论文实现代码 No 22. Turbo-Alignment:专门用于大型语言模型微调和对齐的库,它提供了一系列高效和可扩展的技术,以及广泛的支持方法和指标,旨在简化模型的训练和部署过程 No 23. xfeatSLAM:集成了轻量级深度特征提取架构 XFeat 与 ORB-SLAM3 流程的实时同步定位与地图构建系统,旨在为有限计算资源的移动机器人和嵌入式系统提供高效的 SLAM 解决方案 No 24. TapeAgents:一款支持大型语言模型(LLM)Agent开发全周期的框架,能够通过处理会话日志(Tape)来辅助代理进行思考和行动,具有灵活性和调试工具 No 25. fastdata:轻量合成数据生成库,专为深度学习模型训练设计,能够快速生成用于语言模型训练的合成数据 No 26. Open Canvas:开源的网络应用程序,旨在与代理合作编写文档,灵感来源于 OpenAI 的 'Canvas',但具有一些关键的差异,如开源代码、内置记忆功能、以及从现有文档开始工作的能力 No 27. Makedown:用Markdown编写可执行的脚本,让文档和命令行工具完美结合,支持多语言执行和语法高亮 No 28. //@爱可可-爱生活:欢迎参与~//#免费##抽奖# 携手@图灵新知 送出3本《算法图解(第2版)》 No 29. 今日推介(第1562期):通过捷径模型实现一步扩散、忠实逻辑辅助推理和探索、全方位上下文感知Transformer、用上下文学习实现LLM机器人行动预测、模型均衡有助于低数据训练和微调 ...... No 30. 「TAI前沿」第11期 Yann LeCun展望下一代AI系统:超越大型语言模型的未来之路 No 31. Nixiesearch 混合搜索引擎:一个混合搜索引擎,结合了传统文本搜索和语义搜索的最佳特性,专为云原生环境设计,支持自动扩展,并且能够通过机器学习模型对搜索结果进行优化 No 32. 本文提出了一种名为“捷径模型”的新型生成模型,通过巧妙的自一致性训练方法,在单步或少步采样中实现了高质量图像生成,并超越了现有方法,展现了其在不同领域的应用潜力,其反直觉的训练方法和优异的性能尤其引人注目。//[LG]《One Step Diffusion via Shortcut Models》 No 33. AI实操Excel:通过Excel实现人工智能基础算法的练习工具,让你亲手体验和学习AI的核心操作,如Softmax、LeakyReLU等,适合初学者和爱好者 No 34. AR智能数据采集:利用增强现实技术收集高质量人类示范数据,助力机器人学习,通过AR反馈提升数据采集效率 No 35. 今日推介(第1561期):通过群体智能协作搜索来自适应LLM专家、用Agent评估智Agent、连续时间一致性模型的简化稳定和扩展、智能体化信息检索、视频潜动作预训练 ...... No 36. UVR5 UI:一款用户友好的界面工具,旨在帮助用户从音频或视频中去除人声,支持多种模型和批量处理功能,让音频分离变得简单快捷 No 37. AI学习小径:一个专为中级到高级AI学习者设计的进阶学习路径,包含深度学习基础和进阶资源,特色在于精选的论文、博客和视频教程 No 38. MODEL SWARMS 提出了一种基于群体智能的LLM协同搜索适配算法,无需微调,在低数据场景下即可灵活适应多种目标,并能涌现出模型初始检查点中未曾预见的全新能力,显著优于现有基线方法。 No 39. [LG]《Simplifying, Stabilizing and Scaling Continuous-Time Consistency Models》 No 40. [LG]《FLARE: Faithful Logic-Aided Reasoning and Exploration》 No 41. [CL]《Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence》 No 42. Forscape:面向科学计算的编程语言和编辑器,旨在通过低成本的抽象、安全检查和直观的用户体验来解决工程问题,特别强调矩阵运算,并提供了一个支持数学渲染的编辑器 No 43. [IR]《Agentic Information Retrieval》 No 44. Skore:允许数据科学家通过 Python 代码创建跟踪和可视化的工具,支持存储多种类型的对象,并提供一个用户友好的仪表板来组织和导出这些对象到 HTML 文件 No 45. 本文提出了一种新型多模态大型语言模型 OMCAT,通过一个新的合成数据集 OCTAV 和改进的时间嵌入方法 RoTE,显著提升了细粒度跨模态时间理解能力,并在多个基准测试中取得了最先进的性能,尤其是在处理时间锚定任务和事件转换方面展现出反直觉的有效性。//[CL]《OMCAT: Omni Context Aware Transformer》 No 46. [CL]《Differential Transformer》 No 47. 智能模型融合DAM:一种自动化技术,能够将多个具有独特功能的大语言模型(LLM)合并,优化模型间的平衡,提高数据效率并降低计算成本,超越了传统和进化方法,为多样化的AI系统提供可扩展的解决方案 No 48. 三年面试五年模拟:AI行业面试笔试经验与知识宝典,专为算法工程师设计,覆盖AIGC、深度学习、自动驾驶等领域 No 49. Awesome_GPT_Super_Prompting:集合了GPT模型破解、提示注入、安全防护等资源的宝库,专注于探索和分享GPT模型的高级使用技巧和潜在漏洞 No 50. PyMOL-PUB:为出版物快速生成高质量结构图像的PyMOL扩展工具,通过简化操作和批量可视化协议,大幅减少手动操作,快速获得符合出版标准的图像输出