Open fly51fly opened 4 days ago
No 1. PDFMathTranslate:一款PDF科学论文翻译和双语对比工具,能保留原文排版,支持全文双语翻译,并且兼容多种翻译服务 No 2. 数据科学家手册:为数据科学爱好者提供的学习资源库,包含从入门到进阶的各类免费和付费资源,助力数据科学家学习成长和职业发展 No 3. LLM Prompt Tuning Playbook:一本教你如何高效“提示”训练后的大型语言模型(LLM)的手册,主要功能是提供心智模型和具体指导,帮你更好地与LLM互动 No 4. Scrapling:一个为Python设计的超快速、自适应的网页抓取工具,能够自动适应网站变化,显著提高网页抓取性能 No 5. 免费讲义《数学基础》 No 6. 免费书《证明之书(第三版)》:旨在揭示数学的理论基础,将学习重点从计算转向证明,引导读者探索数学原理背后的“为什么”,而非仅仅停留在“如何做”。通过学习数学家验证定理、探索数学真理和创造新理论的方法,读者将掌握批判性思维和探究能力,能够理解、编写严谨的数学证明 No 7. solidtime - 现代开源时间追踪应用:专为自由职业者和代理机构设计,提供时间跟踪、项目管理、任务分配等多功能的现代界面 No 8. reCamera:开源相机平台,集成处理器和摄像头传感器,用于基本检测和控制任务,特点是模块化、高性能和易用性 No 9. Offmute:智能会议记录与分析工具,能够将音视频内容转换为文本,同时识别不同发言人,生成结构化会议报告 No 10. TkEasyGUI:Python最简单的GUI库,让你轻松创建图形用户界面,无需深入了解Tkinter No 11. [LG]《LoRA vs Full Fine-tuning: An Illusion of Equivalence》 No 12. #抽奖# 携手@图灵文化 @图灵新知 送出3本《MySQL必知必会(第2版)》 No 13. Llama3.2-Vision-Finetune:开源项目,专为Meta的Llama3.2-Vision系列模型提供微调功能,支持8位高效训练和Liger-Kernel No 14. IronCalc:新一代现代电子表格引擎,用于多样化环境中处理电子表格数据,支持多种编程语言集成,旨在构建不同界面如终端、桌面应用或网页应用 No 15. 免费书《智能之痛:从人工智能看人类的痛苦 》:运用... No 16. AdvancedLivePortrait-WebUI:基于Gradio的Web界面,让你能轻松编辑图片中的人脸表情,体验AI技术带来的便捷与乐趣 No 17. TutoriaLLM:面向中小学生的自托管编程学习平台,由LLM提供,旨在帮助教育者创建和学生学习编程教育内容 No 18. Visprex:一款无需发送数据即可快速可视化CSV文件的工具,主打数据安全和便捷性 No 19. GUI Agents 论文列表:汇总GUI智能代理相关论文的资源库 No 20. TI-32:一款为TI-84计算器设计的改装工具,能将其变成作弊设备,具有 Gemini API支持、分页响应支持和回复GPT的功能 No 21. 本文揭示了LoRA与全参数微调在大型语言模型微调中尽管目标任务性能相似,却存在显著的结构差异(LoRA模型中存在“入侵维度”),导致其泛化能力和持续学习能力不如全微调,并提出了改进LoRA方法的策略。//[LG]《LoRA vs Full Fine-tuning: An Illusion of Equivalence》 No 22. VLA-3D数据集:一个为视觉语言导航任务设计的3D对象参照数据集,包含超过9百万条为7635个3D场景合成生成的语言描述,适用于视觉语言定位和导航任务 No 23. Promptwright:一个用本地大型语言模型生成合成数据的Python库,提供灵活易用的接口,帮助用户创建由提示引导的数据集 No 24. [CL]《Evaluation data contamination in LLMs: how do we measure it and (when) does it matter?》 No 25. Intentrace:一款增强版的系统调用跟踪工具,帮助用户全面追踪并理解程序执行过程中的系统调用,特别适合程序员调试程序 No 26. DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点 No 27. SmolLM2:一款轻量级语言模型,包括 135M、360M 和 1.7B 参数版本,适合在设备上运行,能处理多种任务,特色是体积小、速度快 No 28. #转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 29. ComfyUI-GIMM-VFI:一款用户界面工具,用于实现视频帧插值技术,提升视频流畅度 No 30. Scraperr:自托管的网页数据抓取工具,让用户通过指定XPath来抓取网页元素,支持提交URL和元素进行数据抓取,并将结果以表格形式展示,用户还可以下载结果的Excel表格,并重新运行抓取任务 No 31. Protenix:基于PyTorch的AlphaFold 3可训练复现,专注于蛋白质结构预测,以其高性能和开源特色助力科学研究 No 32. 今日推介(第1585期):面向医疗挑战问题的运行时策略探索、LoRA与完全微调的显著不同、通过归纳头Ngram模型实现可解释语言建模、用弹窗攻击视觉语言计算机操纵Agent、大语言模型数据污染评估 ...... No 33. 早![太阳] No 34. Agora协议:一个让不同大型语言模型(LLMs)高效沟通的跨平台协议,通过协商实现不同系统间的高效数据交换 No 35. Sidecar:CodeStoryAI 开发的 Aide 编辑器的 AI 大脑,本地运行于用户的机器上,负责创建提示、与大型语言模型(LLM)交流以及其他相关任务的协调工作 No 36. WassersteinFlowMatching:点云和高斯分布的流匹配工具,用于实现数据的高效匹配和分析 No 37. Twilio语音助手:通过Twilio语音服务和OpenAI实时API,实现电话中与AI助手对话的应用,特色在于双向语音交流和AI优先发言功能 No 38. 神经网络加速器 Muon:提升样本效率超25%,wallclock开销低于3%,专为神经网络设计的优化器,快速提升训练效率 No 39. Browser-Use:开源的网页自动化库,可以让大型语言模型(LLM)与网站互动,通过简单接口实现网页自动化操作,支持多标签管理、XPath提取和视觉模型处理 No 40. [LG]《From Medprompt to o1: Exploration of Run-Time Strategies for Medical Challenge Problems and Beyond》 No 41. Chat UI:为大型语言模型(LLM)应用设计的聊天界面组件库,提供预构建的聊天组件,支持高度定制化,易于与LLM后端集成 No 42. 语音语言模型宝典:汇集语音语言模型和端到端语音对话系统的论文、代码和资源 No 43. OpenAI 的 o1-preview 模型在医学基准测试中超越了使用高级提示策略的 GPT-4,表明模型内在推理能力的提升比复杂的提示工程更有效,但也揭示了成本与性能间的权衡以及现有基准测试的局限性。//[LG]《From Medprompt to o1: Exploration of Run-Time Strategies for Medical Challenge Problems and Beyond》 No 44. llama-swap:用于在需求时自动加载模型的 HTTP 代理服务器,能根据请求动态切换 llama.cpp 或其他与 OpenAI 兼容的后端服务器 No 45. [TAI快报]从医疗挑战到模型安全 No 46. TemporalBench:视频理解基准测试工具,专门评估多模态视频模型对细节时间动态和动作的理解能力,包含约10K视频问答对,源自2K高质量的人工注释视频字幕 No 47. 几篇论文实现代码 No 48. [LG]《How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis》 No 49. Kube Startup CPU Boost:一个在Kubernetes工作负载启动时增加CPU资源请求和限制的控制器,特别适合启动阶段需要额外CPU资源的应用,如基于JVM的应用 No 50. mochi-xdit:视频生成模型的加速并行推理工具,让视频生成更快更高效,特别适用于需要大规模视频生成的场景
No 1. PDFMathTranslate:一款PDF科学论文翻译和双语对比工具,能保留原文排版,支持全文双语翻译,并且兼容多种翻译服务 No 2. 数据科学家手册:为数据科学爱好者提供的学习资源库,包含从入门到进阶的各类免费和付费资源,助力数据科学家学习成长和职业发展 No 3. LLM Prompt Tuning Playbook:一本教你如何高效“提示”训练后的大型语言模型(LLM)的手册,主要功能是提供心智模型和具体指导,帮你更好地与LLM互动 No 4. Scrapling:一个为Python设计的超快速、自适应的网页抓取工具,能够自动适应网站变化,显著提高网页抓取性能 No 5. 免费讲义《数学基础》 No 6. 免费书《证明之书(第三版)》:旨在揭示数学的理论基础,将学习重点从计算转向证明,引导读者探索数学原理背后的“为什么”,而非仅仅停留在“如何做”。通过学习数学家验证定理、探索数学真理和创造新理论的方法,读者将掌握批判性思维和探究能力,能够理解、编写严谨的数学证明 No 7. solidtime - 现代开源时间追踪应用:专为自由职业者和代理机构设计,提供时间跟踪、项目管理、任务分配等多功能的现代界面 No 8. reCamera:开源相机平台,集成处理器和摄像头传感器,用于基本检测和控制任务,特点是模块化、高性能和易用性 No 9. Offmute:智能会议记录与分析工具,能够将音视频内容转换为文本,同时识别不同发言人,生成结构化会议报告 No 10. TkEasyGUI:Python最简单的GUI库,让你轻松创建图形用户界面,无需深入了解Tkinter No 11. [LG]《LoRA vs Full Fine-tuning: An Illusion of Equivalence》 No 12. #抽奖# 携手@图灵文化 @图灵新知 送出3本《MySQL必知必会(第2版)》 No 13. Llama3.2-Vision-Finetune:开源项目,专为Meta的Llama3.2-Vision系列模型提供微调功能,支持8位高效训练和Liger-Kernel No 14. IronCalc:新一代现代电子表格引擎,用于多样化环境中处理电子表格数据,支持多种编程语言集成,旨在构建不同界面如终端、桌面应用或网页应用 No 15. 免费书《智能之痛:从人工智能看人类的痛苦 》:运用... No 16. AdvancedLivePortrait-WebUI:基于Gradio的Web界面,让你能轻松编辑图片中的人脸表情,体验AI技术带来的便捷与乐趣 No 17. TutoriaLLM:面向中小学生的自托管编程学习平台,由LLM提供,旨在帮助教育者创建和学生学习编程教育内容 No 18. Visprex:一款无需发送数据即可快速可视化CSV文件的工具,主打数据安全和便捷性 No 19. GUI Agents 论文列表:汇总GUI智能代理相关论文的资源库 No 20. TI-32:一款为TI-84计算器设计的改装工具,能将其变成作弊设备,具有 Gemini API支持、分页响应支持和回复GPT的功能 No 21. 本文揭示了LoRA与全参数微调在大型语言模型微调中尽管目标任务性能相似,却存在显著的结构差异(LoRA模型中存在“入侵维度”),导致其泛化能力和持续学习能力不如全微调,并提出了改进LoRA方法的策略。//[LG]《LoRA vs Full Fine-tuning: An Illusion of Equivalence》 No 22. VLA-3D数据集:一个为视觉语言导航任务设计的3D对象参照数据集,包含超过9百万条为7635个3D场景合成生成的语言描述,适用于视觉语言定位和导航任务 No 23. Promptwright:一个用本地大型语言模型生成合成数据的Python库,提供灵活易用的接口,帮助用户创建由提示引导的数据集 No 24. [CL]《Evaluation data contamination in LLMs: how do we measure it and (when) does it matter?》 No 25. Intentrace:一款增强版的系统调用跟踪工具,帮助用户全面追踪并理解程序执行过程中的系统调用,特别适合程序员调试程序 No 26. DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点 No 27. SmolLM2:一款轻量级语言模型,包括 135M、360M 和 1.7B 参数版本,适合在设备上运行,能处理多种任务,特色是体积小、速度快 No 28. #转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 29. ComfyUI-GIMM-VFI:一款用户界面工具,用于实现视频帧插值技术,提升视频流畅度 No 30. Scraperr:自托管的网页数据抓取工具,让用户通过指定XPath来抓取网页元素,支持提交URL和元素进行数据抓取,并将结果以表格形式展示,用户还可以下载结果的Excel表格,并重新运行抓取任务 No 31. Protenix:基于PyTorch的AlphaFold 3可训练复现,专注于蛋白质结构预测,以其高性能和开源特色助力科学研究 No 32. 今日推介(第1585期):面向医疗挑战问题的运行时策略探索、LoRA与完全微调的显著不同、通过归纳头Ngram模型实现可解释语言建模、用弹窗攻击视觉语言计算机操纵Agent、大语言模型数据污染评估 ...... No 33. 早![太阳] No 34. Agora协议:一个让不同大型语言模型(LLMs)高效沟通的跨平台协议,通过协商实现不同系统间的高效数据交换 No 35. Sidecar:CodeStoryAI 开发的 Aide 编辑器的 AI 大脑,本地运行于用户的机器上,负责创建提示、与大型语言模型(LLM)交流以及其他相关任务的协调工作 No 36. WassersteinFlowMatching:点云和高斯分布的流匹配工具,用于实现数据的高效匹配和分析 No 37. Twilio语音助手:通过Twilio语音服务和OpenAI实时API,实现电话中与AI助手对话的应用,特色在于双向语音交流和AI优先发言功能 No 38. 神经网络加速器 Muon:提升样本效率超25%,wallclock开销低于3%,专为神经网络设计的优化器,快速提升训练效率 No 39. Browser-Use:开源的网页自动化库,可以让大型语言模型(LLM)与网站互动,通过简单接口实现网页自动化操作,支持多标签管理、XPath提取和视觉模型处理 No 40. [LG]《From Medprompt to o1: Exploration of Run-Time Strategies for Medical Challenge Problems and Beyond》 No 41. Chat UI:为大型语言模型(LLM)应用设计的聊天界面组件库,提供预构建的聊天组件,支持高度定制化,易于与LLM后端集成 No 42. 语音语言模型宝典:汇集语音语言模型和端到端语音对话系统的论文、代码和资源 No 43. OpenAI 的 o1-preview 模型在医学基准测试中超越了使用高级提示策略的 GPT-4,表明模型内在推理能力的提升比复杂的提示工程更有效,但也揭示了成本与性能间的权衡以及现有基准测试的局限性。//[LG]《From Medprompt to o1: Exploration of Run-Time Strategies for Medical Challenge Problems and Beyond》 No 44. llama-swap:用于在需求时自动加载模型的 HTTP 代理服务器,能根据请求动态切换 llama.cpp 或其他与 OpenAI 兼容的后端服务器 No 45. [TAI快报]从医疗挑战到模型安全 No 46. TemporalBench:视频理解基准测试工具,专门评估多模态视频模型对细节时间动态和动作的理解能力,包含约10K视频问答对,源自2K高质量的人工注释视频字幕 No 47. 几篇论文实现代码 No 48. [LG]《How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis》 No 49. Kube Startup CPU Boost:一个在Kubernetes工作负载启动时增加CPU资源请求和限制的控制器,特别适合启动阶段需要额外CPU资源的应用,如基于JVM的应用 No 50. mochi-xdit:视频生成模型的加速并行推理工具,让视频生成更快更高效,特别适用于需要大规模视频生成的场景