Open fly51fly opened 3 weeks ago
No 1. CUDATutorial:手把手教你CUDA高性能编程,从入门到精通,一起学习一起进步 No 2. 小型模型的妙用:在大型语言模型时代,探索小型模型的独特角色和应用,包括数据筛选、推理增强和知识蒸馏等 No 3. TableStructureRec:文档中表格结构化识别工具,快速准确地识别有线和无线表格,支持多种表格类型分类,提高文档处理效率 No 4. GraphLLM:一个基于图的框架,用于通过大型语言模型(LLM)处理数据,支持网页搜索和运行Python代码,具有强大的工具集来抓取网页并重新格式化数据,使其对LLM更友好 No 5. O1 Nano:一个开源项目,旨在实现 OpenAI O1 模型系列的简化版本,专注于通过链式思维和强化学习解决算术问题 No 6. Moonshine:一款为边缘设备设计的快速准确的自动语音识别系统,特别适合实时、设备上的应用程序,如现场转录和语音命令识别,相比同类产品在多个数据集上拥有更低的词错误率 No 7. #免费##抽奖# 携手@图灵新知 送出3本《算法图解(第2版)》 No 8. Nymeria数据集:全球最大的日常人类运动数据集,捕捉丰富的活动场景,帮助研究者理解人类动作,推动增强现实和虚拟现实技术的发展 No 9. 今日推介(第1567期):Transformer是可证明的高效编译器、用于推理任务的自学习元策略Agent、深度均衡算法推理、通过压缩解决稀疏和高维输出回归问题、寻找模仿阈值 ...... No 10. Allegro:强大的文本到视频模型,可以从简单的文本输入生成高质量的6秒钟视频,每秒15帧,分辨率为720p No 11. Fast-LLM:一个开源库,用于加速大型语言模型的训练,它快速、可扩展、支持多种模型架构,并且易于使用 No 12. Whispo:一款AI驱动的语音听写工具,能够让你按住Ctrl键录音并自动转写文本,支持任何文本输入应用,数据仅存储在本地,还可以使用自定义API和后处理语言模型进行转写 No 13. PocketPal AI:手机里的AI助手,能直接在设备上运行小型语言模型,无需互联网连接即可提供智能互动 No 14. DataFusion Ray:分布式数据处理工具,利用Ray和Apache DataFusion进行分布式SQL查询,支持大规模数据集的快速分析 No 15. Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型 No 16. 早![太阳] No 17. OURS Project:开源、可升级、可修复、无大科技公司控制的智能手机项目,提供详细的组装指南,让你能自制一部完全属于自己的智能手机 No 18. 几篇论文实现代码 No 19. [LG]《Solving Sparse \& High-Dimensional-Output Regression via Compression》 No 20. TCF:一种高效的3D点云配准方法,通过两阶段的一致性过滤提升配准的速度和精度,非常适合实时应用 No 21. Lettuce CFD:基于PyTorch和格子玻尔兹曼方法的计算流体动力学框架,用于高效进行流体模拟,支持GPU加速和快速原型开发 No 22. Scalable and Performant Data Loading(SPDL):一个可扩展且高性能的数据加载库,旨在探索基于线程并行性能的数据加载设计 No 23. JoyCaption 批量工具:一款批量为图片生成描述的实用工具,使用Joytag Caption技术,帮助用户快速给图片添加文字说明 No 24. OpenAI实时语音API的TypeScript客户端:为OpenAI的实时语音API提供一个强类型、兼容性好且易于使用的TypeScript客户端,支持Node.js、浏览器、Deno等多种环境,还包含简单中继服务器和控制台示例 No 25. Inspira UI:一个为Vue和Nuxt框架精心设计的UI组件库,提供美观、可重用的组件,帮助你高效构建漂亮的网站 No 26. Epublifier电子书转换器:一键将网络小说转换成EPUB格式,方便导入电子书阅读器,支持自定义解析规则,适用于多种网站内容提取 No 27. Seelen UI:一款为Windows 10/11打造的全自定义桌面环境,支持70多种语言,让你的桌面更加个性化和高效 No 28. Sudoku in Python Packaging:用Python包管理器解数独,将数独游戏转化为依赖版本解析问题,以创新方式解决传统逻辑游戏 No 29. [LG]《Transformers are Efficient Compilers, Provably》 No 30. AgentJo:基于严格JSON核心的任务型Agent框架,用于创建和管理任务,简化复杂任务的执行流程 No 31. [LG]《SMART: Self-learning Meta-strategy Agent for Reasoning Tasks》 No 32. lapx:线性分配问题求解器,使用量子-沃尔根特算法高效解决稠密和稀疏的线性分配问题,支持多操作系统和Python版本,适合需要大规模优化的应用 No 33. KalmanGrad:能自动计算非均匀采样时间序列数据的平滑N阶导数的Python包,利用贝叶斯滤波技术提供稳健的导数估计,即使在数据存在噪声和采样不均匀的情况下也能保持准确性 No 34. [TAI快报]Vol.113 从编译器到推理框架,Transformer的无限可能 No 35. Stable Diffusion 3.5:一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成更便捷 No 36. 晚安~ [月亮] No 37. AI实操Excel:通过Excel实现人工智能基础算法的练习工具,让你亲手体验和学习AI的核心操作,如Softmax、LeakyReLU等,适合初学者和爱好者 No 38. AI世界接口:为AI代理设计的模拟操作系统,能与世界互动,特色包括多应用环境适配和开放式架构,易于扩展新环境 No 39. MisguidedAttention:挑战大型语言模型在误导信息面前的推理能力,通过一系列修改过的经典思维实验、谜题或悖论(“陷阱问题”)来测试 No 40. Flow:为ComfyUI设计的自定义节点,提供了一个用户友好的界面,让工作流程的运行更加直观和便捷 No 41. BitNet:微软推出的用于1bit大型语言模型推理的官方框架,支持在CPU上快速无损推理,未来还将支持NPU和GPU,显著提升性能和能效 No 42. SMART框架通过将策略选择建模为马尔可夫决策过程并利用强化学习,使大型语言模型能够在第一次尝试时就选择最佳推理策略,从而显著提高了推理任务的准确性和效率,并实现了反直觉的“一次性”策略选择能力。//[LG]《SMART: Self-learning Meta-strategy Agent for Reasoning Tasks》 No 43. 本文提出了寻找模仿阈值 (FIT) 的新问题,并提出了一种高效的 MIMETIC² 方法,利用预训练模型的观察数据估计文本到图像模型模仿特定概念所需的最小训练图像数量,实验结果表明该阈值在 200-600 张图像之间,并通过人工验证确认了其准确性,为解决文本到图像模型的版权和隐私问题提供了新的思路。//[CV]《How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold》 No 44. LangGraph 记忆Agent:一个简单的ReAct风格Agent工具,帮助聊天机器人保存重要信息以备后用,特色在于通过用户ID保存记忆,让机器人能够在不同对话中学习并记住用户的偏好 No 45. 数据科学家的小手册:《机器学习度量小册子》——旨在成为数据科学家桌面上的参考手册,涵盖从常见的准确率到较为边缘的 P4 指标的各种机器学习度量 No 46. 「TAI前沿」第17期 深入解析OpenAI的O1模型及其启示 No 47. 《LLM工程师手册》随书代码:一本深入浅出的指南,从基础到在AWS上部署高级LLM和RAG应用程序,使用LLMOps最佳实践 No 48. [LG]《Reward-free World Models for Online Imitation Learning》 No 49. ClooI:命令织布机界面,一个允许你通过命令行界面与聊天客户端互动并保存加载对话历史的实用工具 No 50. ComfyUI Yvann-Nodes:一款为ComfyUI打造的音频反应节点包,能够创建由AI生成的、随音频变化的动画效果,兼容IPAdapter、ControlNets、AnimateDiff等工具
No 1. CUDATutorial:手把手教你CUDA高性能编程,从入门到精通,一起学习一起进步 No 2. 小型模型的妙用:在大型语言模型时代,探索小型模型的独特角色和应用,包括数据筛选、推理增强和知识蒸馏等 No 3. TableStructureRec:文档中表格结构化识别工具,快速准确地识别有线和无线表格,支持多种表格类型分类,提高文档处理效率 No 4. GraphLLM:一个基于图的框架,用于通过大型语言模型(LLM)处理数据,支持网页搜索和运行Python代码,具有强大的工具集来抓取网页并重新格式化数据,使其对LLM更友好 No 5. O1 Nano:一个开源项目,旨在实现 OpenAI O1 模型系列的简化版本,专注于通过链式思维和强化学习解决算术问题 No 6. Moonshine:一款为边缘设备设计的快速准确的自动语音识别系统,特别适合实时、设备上的应用程序,如现场转录和语音命令识别,相比同类产品在多个数据集上拥有更低的词错误率 No 7. #免费##抽奖# 携手@图灵新知 送出3本《算法图解(第2版)》 No 8. Nymeria数据集:全球最大的日常人类运动数据集,捕捉丰富的活动场景,帮助研究者理解人类动作,推动增强现实和虚拟现实技术的发展 No 9. 今日推介(第1567期):Transformer是可证明的高效编译器、用于推理任务的自学习元策略Agent、深度均衡算法推理、通过压缩解决稀疏和高维输出回归问题、寻找模仿阈值 ...... No 10. Allegro:强大的文本到视频模型,可以从简单的文本输入生成高质量的6秒钟视频,每秒15帧,分辨率为720p No 11. Fast-LLM:一个开源库,用于加速大型语言模型的训练,它快速、可扩展、支持多种模型架构,并且易于使用 No 12. Whispo:一款AI驱动的语音听写工具,能够让你按住Ctrl键录音并自动转写文本,支持任何文本输入应用,数据仅存储在本地,还可以使用自定义API和后处理语言模型进行转写 No 13. PocketPal AI:手机里的AI助手,能直接在设备上运行小型语言模型,无需互联网连接即可提供智能互动 No 14. DataFusion Ray:分布式数据处理工具,利用Ray和Apache DataFusion进行分布式SQL查询,支持大规模数据集的快速分析 No 15. Video-XL:面向小时级视频理解的超长视觉语言模型,首个小时级视频理解模型 No 16. 早![太阳] No 17. OURS Project:开源、可升级、可修复、无大科技公司控制的智能手机项目,提供详细的组装指南,让你能自制一部完全属于自己的智能手机 No 18. 几篇论文实现代码 No 19. [LG]《Solving Sparse \& High-Dimensional-Output Regression via Compression》 No 20. TCF:一种高效的3D点云配准方法,通过两阶段的一致性过滤提升配准的速度和精度,非常适合实时应用 No 21. Lettuce CFD:基于PyTorch和格子玻尔兹曼方法的计算流体动力学框架,用于高效进行流体模拟,支持GPU加速和快速原型开发 No 22. Scalable and Performant Data Loading(SPDL):一个可扩展且高性能的数据加载库,旨在探索基于线程并行性能的数据加载设计 No 23. JoyCaption 批量工具:一款批量为图片生成描述的实用工具,使用Joytag Caption技术,帮助用户快速给图片添加文字说明 No 24. OpenAI实时语音API的TypeScript客户端:为OpenAI的实时语音API提供一个强类型、兼容性好且易于使用的TypeScript客户端,支持Node.js、浏览器、Deno等多种环境,还包含简单中继服务器和控制台示例 No 25. Inspira UI:一个为Vue和Nuxt框架精心设计的UI组件库,提供美观、可重用的组件,帮助你高效构建漂亮的网站 No 26. Epublifier电子书转换器:一键将网络小说转换成EPUB格式,方便导入电子书阅读器,支持自定义解析规则,适用于多种网站内容提取 No 27. Seelen UI:一款为Windows 10/11打造的全自定义桌面环境,支持70多种语言,让你的桌面更加个性化和高效 No 28. Sudoku in Python Packaging:用Python包管理器解数独,将数独游戏转化为依赖版本解析问题,以创新方式解决传统逻辑游戏 No 29. [LG]《Transformers are Efficient Compilers, Provably》 No 30. AgentJo:基于严格JSON核心的任务型Agent框架,用于创建和管理任务,简化复杂任务的执行流程 No 31. [LG]《SMART: Self-learning Meta-strategy Agent for Reasoning Tasks》 No 32. lapx:线性分配问题求解器,使用量子-沃尔根特算法高效解决稠密和稀疏的线性分配问题,支持多操作系统和Python版本,适合需要大规模优化的应用 No 33. KalmanGrad:能自动计算非均匀采样时间序列数据的平滑N阶导数的Python包,利用贝叶斯滤波技术提供稳健的导数估计,即使在数据存在噪声和采样不均匀的情况下也能保持准确性 No 34. [TAI快报]Vol.113 从编译器到推理框架,Transformer的无限可能 No 35. Stable Diffusion 3.5:一款用于简单推理的AI模型,能够快速生成高质量的图像,支持多种文本编码器和核心MM-DiT技术,让图像生成更便捷 No 36. 晚安~ [月亮] No 37. AI实操Excel:通过Excel实现人工智能基础算法的练习工具,让你亲手体验和学习AI的核心操作,如Softmax、LeakyReLU等,适合初学者和爱好者 No 38. AI世界接口:为AI代理设计的模拟操作系统,能与世界互动,特色包括多应用环境适配和开放式架构,易于扩展新环境 No 39. MisguidedAttention:挑战大型语言模型在误导信息面前的推理能力,通过一系列修改过的经典思维实验、谜题或悖论(“陷阱问题”)来测试 No 40. Flow:为ComfyUI设计的自定义节点,提供了一个用户友好的界面,让工作流程的运行更加直观和便捷 No 41. BitNet:微软推出的用于1bit大型语言模型推理的官方框架,支持在CPU上快速无损推理,未来还将支持NPU和GPU,显著提升性能和能效 No 42. SMART框架通过将策略选择建模为马尔可夫决策过程并利用强化学习,使大型语言模型能够在第一次尝试时就选择最佳推理策略,从而显著提高了推理任务的准确性和效率,并实现了反直觉的“一次性”策略选择能力。//[LG]《SMART: Self-learning Meta-strategy Agent for Reasoning Tasks》 No 43. 本文提出了寻找模仿阈值 (FIT) 的新问题,并提出了一种高效的 MIMETIC² 方法,利用预训练模型的观察数据估计文本到图像模型模仿特定概念所需的最小训练图像数量,实验结果表明该阈值在 200-600 张图像之间,并通过人工验证确认了其准确性,为解决文本到图像模型的版权和隐私问题提供了新的思路。//[CV]《How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold》 No 44. LangGraph 记忆Agent:一个简单的ReAct风格Agent工具,帮助聊天机器人保存重要信息以备后用,特色在于通过用户ID保存记忆,让机器人能够在不同对话中学习并记住用户的偏好 No 45. 数据科学家的小手册:《机器学习度量小册子》——旨在成为数据科学家桌面上的参考手册,涵盖从常见的准确率到较为边缘的 P4 指标的各种机器学习度量 No 46. 「TAI前沿」第17期 深入解析OpenAI的O1模型及其启示 No 47. 《LLM工程师手册》随书代码:一本深入浅出的指南,从基础到在AWS上部署高级LLM和RAG应用程序,使用LLMOps最佳实践 No 48. [LG]《Reward-free World Models for Online Imitation Learning》 No 49. ClooI:命令织布机界面,一个允许你通过命令行界面与聊天客户端互动并保存加载对话历史的实用工具 No 50. ComfyUI Yvann-Nodes:一款为ComfyUI打造的音频反应节点包,能够创建由AI生成的、随音频变化的动画效果,兼容IPAdapter、ControlNets、AnimateDiff等工具