Open fly51fly opened 6 days ago
No 1. Browser-Use:开源的网页自动化库,可以让大型语言模型(LLM)与网站互动,通过简单接口实现网页自动化操作,支持多标签管理、XPath提取和视觉模型处理 No 2. 数学好书推荐:一个汇集了各种数学书籍资源的宝库,无论你是数学专业的学生还是对数学感兴趣的爱好者,都能在这里找到丰富的学习材料和参考书籍 No 3. #抽奖# 携手@图灵文化 @图灵新知 送出3本《MySQL必知必会(第2版)》 No 4. Aide:开源人工智能原生代码编辑器,集成了强大的VS Code功能和先进的AI能力,提供聊天+编辑工作流、主动代理、内联编辑小部件、智能代码补全和AST导航 No 5. NVIDIA Cosmos Tokenizer:高效的图像和视频神经 tokenizer 套件,它提高了视觉 tokenization 的状态艺术,并为大型自回归变换器(如 LLMs)或扩散生成器的可扩展、健壮和高效开发铺平了道路 No 6. SylphAI-Inc LLM-engineer-handbook:大型语言模型资源手册,汇集模型训练、部署、微调和构建应用的精选资源,覆盖AI社区的热门领域 No 7. [CL] A Comprehensive Survey of Small Language Models in the Era ...... No 8. [LG]《Long Context RAG Performance of Large Language Models》 No 9. InkSight:通过学习阅读和书写实现离线到在线... No 10. #转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 11. 早![太阳] No 12. [LG]《How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis》 No 13. 今日推介(第1583期):Transformer如何解决命题逻辑问题、基于自动软参数重置的神经网络非平稳学习、基于指数变换的注意力、大语言模型的越狱提示有哪些特征、大型语言模型的长上下文RAG性能 ...... No 14. Digit 360:一个模块化平台,旨在开启新的触觉研究能力,并提供丰富的多模态数字触觉功能 No 15. 几篇论文实现代码 No 16. [TAI快报]从逻辑推理到安全防护 No 17. 晚安~ [月亮] No 18. Hunyuan-Large:腾讯推出的大型 MoE(Mixture of Experts)模型,该模型拥有 3890 亿参数和 520 亿激活参数,是业界目前最大的开源 Transformer 基础 MoE 模型,专注于自然语言处理和长文本理解 No 19. 本文揭示了Adam优化算法收敛性问题的根本原因,并提出了一种新的自适应梯度方法ADOPT,该方法通过巧妙地去除当前梯度与二阶矩估计的相关性,在理论上保证了最优收敛速度,并在实践中展现出优越的性能和鲁棒性,尤其在高噪声环境下优势明显。 No 20. LLaMA-O1:一个大型推理模型框架,用于 PyTorch 和 HuggingFace 的训练、推理和评估,集成了蒙特卡洛树搜索(MCTS)、自我对弈强化学习、PPO、AlphaGo Zero 的双策略范式和大型语言模型 No 21. [TAI快报]从事实性到联邦学习:五项研究引领大型语言模型新方向 No 22. 该论文通过对20个大型语言模型在不同上下文长度下的RAG性能进行全面评估,发现长上下文并非总是提升性能,不同模型存在独特的失效模式,并指出OpenAI o1和Google Gemini 1.5在长上下文处理上展现出显著优势,但同时也需关注高昂的计算成本。//[LG]《Long Context RAG Performance of Large Language Models》 No 23. [LG]《LASER: Attention with Exponential Transformation》 No 24. 机器人操控相关资源列表:汇集了关于机器人操控的论文、代码和相关网站的全面列表,是机器人研究者的宝贵资源 No 25. FlowToken:一款旨在提升大型语言模型(LLM)文本流输出视觉效果的UI库,提供多种动画效果,让文本平滑动态地展现,增强用户体验 No 26. 一直都很关注大语言模型及其应用,尤其在翻译领域。平时科研工作中会同时使用多个翻译工具,包括有道翻译、Google翻译等,不得不说真正把这个技术应用好的软件,真不多。大语言模型技术的核心优势就在于对语言的深刻理解和卓越的表达能力,也因此翻译地更加自然和准确。用下来发现有道翻译在专业文献 ...... No 27. [LG]《What Features in Prompts Jailbreak LLMs? Investigating the Mechanisms Behind Attacks》 No 28. 本文通过构建大型越狱数据集并利用线性与非线性探测器分析提示特征,揭示了大型语言模型越狱攻击的非线性本质,并提出了一种基于非线性探测器的机制性越狱方法,该方法显著提升了越狱成功率,为 LLM 安全研究提供了新的方向。//[LG]《What Features in Prompts Jailbreak LLMs? Investigating the Mechanisms Behind Attacks》 No 29. Semantic Search:一款简单高效的语义搜索库,专为小型至中型项目提供嵌入式向量搜索和语义嵌入功能,支持BERT模型,无需复杂的传统搜索系统 No 30. Meme Search:一键索引表情包,让它们根据内容和文字快速被检索,为网络斗图增添乐趣 No 31. Claude Vision Object Detection:一款强大的Python图像识别工具,能够利用Claude 3.5 Sonnet Vision API检测并可视化图像中的对象,自动绘制边界框、标注对象并显示置信度分数 No 32. OuteTTS:一款实验性的文本转语音模型,利用纯语言模型进行文本到语音转换的创新方法,通过音频标记和强制对齐学习语音合成,让你可以用自己的声音生成文本语音 No 33. MiniMates:极速数字人算法,让你的桌面电脑也能拥有定制化的AI伙伴,支持语音和表情驱动 No 34. ChatGPT Plugin for Zotero:Zotero的ChatGPT插件,可以方便地访问概念解释、内容摘要和双向翻译功能 No 35. GPT4V-Image-Captioner / GPT4V图像打标器:用Gradio构建的多功能图像处理工具箱,可以使用GPT-4-vision API或cogVLM模型对图像进行标记,支持一键安装和使用、单图像和多图像批量标记、在线GPT4V和本地CogVLM模型选择、视觉标记分析和处理、图像预压缩、关键词过滤和水印图像识别等功能 No 36. pg_flo:实时数据流、转换和路由工具,用于PostgreSQL数据库,能够捕捉数据变更并进行处理 No 37. 具身智能入门指南:为新手提供快速建立关于具身智能领域认知的路径和有用信息,帮助理解智能体与环境的交互获取信息、理解问题、做出决策并实现行动的过程 No 38. Anthropic提示工程交互式教程:深入理解如何在Claude中构建最优提示的全面步骤指南,帮助用户掌握构建有效提示的基本结构,识别常见失败模式,并利用'80/20'技巧进行应对,理解Claude的优势和局限,从头开始构建针对常见用例的强大提示 No 39. 过节了,推荐一些微博上的程序员大佬。排名不分先后,简介如有错误欢迎指出。也欢迎评论增加你知道的程序员@刘群MT-to-Death ...... No 40. PaperVision:自定义OpenCV算法的图形化节点编辑器,灵感来源于Blender和Unreal Engine的蓝图,提供直观的用户界面和实时预览功能 No 41. tiny-gpu:开源的 Verilog 语言编写的 GPU 设计项目,旨在帮助人们从底层上理解 GPU 是如何工作的 No 42. PDF Extract API:一个文档(PDF)提取和解析 API,使用先进的现代 OCR 技术和 Ollama 支持的模型,能匿名化文档、移除个人识别信息(PII),并将任何文档或图片转换为结构化的 JSON 或 Markdown 格式 No 43. Someday:免费开源的Gmail用户日程安排工具,使用Google Apps Script搭建,提供类似Calendly的简单替代方案 No 44. Spio:提升卷积神经网络训练效率的工具,专为PyTorch设计的高效CUDA内核,优化了分组卷积的性能 No 45. //@爱可可-爱生活:欢迎参与抽奖~//#转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 46. [LG]《Discovering Data Structures: Nearest Neighbor Search and Beyond》 No 47. Screenshot to Code:一款能将截图转换成干净代码的工具,支持HTML、Tailwind、React、Vue等,让你的设计图快速变成网页 No 48. AI数据中心警报:GPU寿命暴跌,仅1-3年 No 49. 本地多智能体RAG超级助手:集成了GraphRAG知识搜索方法与AutoGen智能体,由Ollama提供的本地大型语言模型(LLM)支持,实现免费且离线嵌入和推理 No 50. '基于AI的视频硬字幕去除、水印去除,无损分辨率生成去字幕、去水印后的视频文件。无需申请第三方API,本地实现。AI-based ......
No 1. Browser-Use:开源的网页自动化库,可以让大型语言模型(LLM)与网站互动,通过简单接口实现网页自动化操作,支持多标签管理、XPath提取和视觉模型处理 No 2. 数学好书推荐:一个汇集了各种数学书籍资源的宝库,无论你是数学专业的学生还是对数学感兴趣的爱好者,都能在这里找到丰富的学习材料和参考书籍 No 3. #抽奖# 携手@图灵文化 @图灵新知 送出3本《MySQL必知必会(第2版)》 No 4. Aide:开源人工智能原生代码编辑器,集成了强大的VS Code功能和先进的AI能力,提供聊天+编辑工作流、主动代理、内联编辑小部件、智能代码补全和AST导航 No 5. NVIDIA Cosmos Tokenizer:高效的图像和视频神经 tokenizer 套件,它提高了视觉 tokenization 的状态艺术,并为大型自回归变换器(如 LLMs)或扩散生成器的可扩展、健壮和高效开发铺平了道路 No 6. SylphAI-Inc LLM-engineer-handbook:大型语言模型资源手册,汇集模型训练、部署、微调和构建应用的精选资源,覆盖AI社区的热门领域 No 7. [CL] A Comprehensive Survey of Small Language Models in the Era ...... No 8. [LG]《Long Context RAG Performance of Large Language Models》 No 9. InkSight:通过学习阅读和书写实现离线到在线... No 10. #转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 11. 早![太阳] No 12. [LG]《How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis》 No 13. 今日推介(第1583期):Transformer如何解决命题逻辑问题、基于自动软参数重置的神经网络非平稳学习、基于指数变换的注意力、大语言模型的越狱提示有哪些特征、大型语言模型的长上下文RAG性能 ...... No 14. Digit 360:一个模块化平台,旨在开启新的触觉研究能力,并提供丰富的多模态数字触觉功能 No 15. 几篇论文实现代码 No 16. [TAI快报]从逻辑推理到安全防护 No 17. 晚安~ [月亮] No 18. Hunyuan-Large:腾讯推出的大型 MoE(Mixture of Experts)模型,该模型拥有 3890 亿参数和 520 亿激活参数,是业界目前最大的开源 Transformer 基础 MoE 模型,专注于自然语言处理和长文本理解 No 19. 本文揭示了Adam优化算法收敛性问题的根本原因,并提出了一种新的自适应梯度方法ADOPT,该方法通过巧妙地去除当前梯度与二阶矩估计的相关性,在理论上保证了最优收敛速度,并在实践中展现出优越的性能和鲁棒性,尤其在高噪声环境下优势明显。 No 20. LLaMA-O1:一个大型推理模型框架,用于 PyTorch 和 HuggingFace 的训练、推理和评估,集成了蒙特卡洛树搜索(MCTS)、自我对弈强化学习、PPO、AlphaGo Zero 的双策略范式和大型语言模型 No 21. [TAI快报]从事实性到联邦学习:五项研究引领大型语言模型新方向 No 22. 该论文通过对20个大型语言模型在不同上下文长度下的RAG性能进行全面评估,发现长上下文并非总是提升性能,不同模型存在独特的失效模式,并指出OpenAI o1和Google Gemini 1.5在长上下文处理上展现出显著优势,但同时也需关注高昂的计算成本。//[LG]《Long Context RAG Performance of Large Language Models》 No 23. [LG]《LASER: Attention with Exponential Transformation》 No 24. 机器人操控相关资源列表:汇集了关于机器人操控的论文、代码和相关网站的全面列表,是机器人研究者的宝贵资源 No 25. FlowToken:一款旨在提升大型语言模型(LLM)文本流输出视觉效果的UI库,提供多种动画效果,让文本平滑动态地展现,增强用户体验 No 26. 一直都很关注大语言模型及其应用,尤其在翻译领域。平时科研工作中会同时使用多个翻译工具,包括有道翻译、Google翻译等,不得不说真正把这个技术应用好的软件,真不多。大语言模型技术的核心优势就在于对语言的深刻理解和卓越的表达能力,也因此翻译地更加自然和准确。用下来发现有道翻译在专业文献 ...... No 27. [LG]《What Features in Prompts Jailbreak LLMs? Investigating the Mechanisms Behind Attacks》 No 28. 本文通过构建大型越狱数据集并利用线性与非线性探测器分析提示特征,揭示了大型语言模型越狱攻击的非线性本质,并提出了一种基于非线性探测器的机制性越狱方法,该方法显著提升了越狱成功率,为 LLM 安全研究提供了新的方向。//[LG]《What Features in Prompts Jailbreak LLMs? Investigating the Mechanisms Behind Attacks》 No 29. Semantic Search:一款简单高效的语义搜索库,专为小型至中型项目提供嵌入式向量搜索和语义嵌入功能,支持BERT模型,无需复杂的传统搜索系统 No 30. Meme Search:一键索引表情包,让它们根据内容和文字快速被检索,为网络斗图增添乐趣 No 31. Claude Vision Object Detection:一款强大的Python图像识别工具,能够利用Claude 3.5 Sonnet Vision API检测并可视化图像中的对象,自动绘制边界框、标注对象并显示置信度分数 No 32. OuteTTS:一款实验性的文本转语音模型,利用纯语言模型进行文本到语音转换的创新方法,通过音频标记和强制对齐学习语音合成,让你可以用自己的声音生成文本语音 No 33. MiniMates:极速数字人算法,让你的桌面电脑也能拥有定制化的AI伙伴,支持语音和表情驱动 No 34. ChatGPT Plugin for Zotero:Zotero的ChatGPT插件,可以方便地访问概念解释、内容摘要和双向翻译功能 No 35. GPT4V-Image-Captioner / GPT4V图像打标器:用Gradio构建的多功能图像处理工具箱,可以使用GPT-4-vision API或cogVLM模型对图像进行标记,支持一键安装和使用、单图像和多图像批量标记、在线GPT4V和本地CogVLM模型选择、视觉标记分析和处理、图像预压缩、关键词过滤和水印图像识别等功能 No 36. pg_flo:实时数据流、转换和路由工具,用于PostgreSQL数据库,能够捕捉数据变更并进行处理 No 37. 具身智能入门指南:为新手提供快速建立关于具身智能领域认知的路径和有用信息,帮助理解智能体与环境的交互获取信息、理解问题、做出决策并实现行动的过程 No 38. Anthropic提示工程交互式教程:深入理解如何在Claude中构建最优提示的全面步骤指南,帮助用户掌握构建有效提示的基本结构,识别常见失败模式,并利用'80/20'技巧进行应对,理解Claude的优势和局限,从头开始构建针对常见用例的强大提示 No 39. 过节了,推荐一些微博上的程序员大佬。排名不分先后,简介如有错误欢迎指出。也欢迎评论增加你知道的程序员@刘群MT-to-Death ...... No 40. PaperVision:自定义OpenCV算法的图形化节点编辑器,灵感来源于Blender和Unreal Engine的蓝图,提供直观的用户界面和实时预览功能 No 41. tiny-gpu:开源的 Verilog 语言编写的 GPU 设计项目,旨在帮助人们从底层上理解 GPU 是如何工作的 No 42. PDF Extract API:一个文档(PDF)提取和解析 API,使用先进的现代 OCR 技术和 Ollama 支持的模型,能匿名化文档、移除个人识别信息(PII),并将任何文档或图片转换为结构化的 JSON 或 Markdown 格式 No 43. Someday:免费开源的Gmail用户日程安排工具,使用Google Apps Script搭建,提供类似Calendly的简单替代方案 No 44. Spio:提升卷积神经网络训练效率的工具,专为PyTorch设计的高效CUDA内核,优化了分组卷积的性能 No 45. //@爱可可-爱生活:欢迎参与抽奖~//#转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 46. [LG]《Discovering Data Structures: Nearest Neighbor Search and Beyond》 No 47. Screenshot to Code:一款能将截图转换成干净代码的工具,支持HTML、Tailwind、React、Vue等,让你的设计图快速变成网页 No 48. AI数据中心警报:GPU寿命暴跌,仅1-3年 No 49. 本地多智能体RAG超级助手:集成了GraphRAG知识搜索方法与AutoGen智能体,由Ollama提供的本地大型语言模型(LLM)支持,实现免费且离线嵌入和推理 No 50. '基于AI的视频硬字幕去除、水印去除,无损分辨率生成去字幕、去水印后的视频文件。无需申请第三方API,本地实现。AI-based ......