fly51fly / aicoco

“爱可可-爱生活”微博内容精选
496 stars 62 forks source link

爱可可微博热门分享(2.12) #72

Open fly51fly opened 3 months ago

fly51fly commented 3 months ago

No 1. (开源硬件)平衡立方体,可以在一个顶点上保持平衡并旋转 No 2. 关于高质量人工标注数据的思考 No 3. DataDreamer:一个强大的开源Python库,用于提示、合成数据生成和训练工作流,旨在简单、高效,且适用于研究。使用DataDreamer,可以轻松创建和运行多步骤的提示工作流,生成合成数据集,对模型进行训练 No 4. AutoRAG:RAG工作流自动化优化工具 No 5. TheProfessor-155b:一个特殊的大型... No 6. DEUS:超灵活的实时图像生成引擎,基于StableDiffusion和LCM Lora No 7. BUD-E: 开源的AI语音助手,旨在实现实时回复用户请求、使用自然语音、具备共情和情感智能、处理之前对话的长上下文、处理多人对话中的打断、肯定和思考暂停,并且完全在消费级硬件(如NVIDIA GTX 4090)上本地运行 No 8. cvGPUSpeedup:旨在利用内存读取的机会来提高OpenCV-CUDA代码在GPU上的运行速度,尤其是针对深度学习网络的典型预处理和后处理操作 No 9. Whishper:开源100%本地的音频转录和字幕套件,具有完整的网页用户界面,可以将任何媒体(音频、视频等)转录成文本,支持从URL转录和上传文件转录 No 10. [AS]《MusicRL: Aligning Music Generation to Human Preferences》 No 11. 晚安~ [月亮] ​ No 12. 早![太阳] ​ No 13. rexi:简单而强大的命令行正则表达式测试工具,专为开发人员、数据科学家和任何有兴趣直接从终端操作正则表达式的人而设计 No 14. HelixML:私人GenAI平台,可以在自己的数据中心或VPC上部署最优秀的开放式AI,并保持完整的数据安全性和控制 No 15. LLM的高效线性模型融合 No 16. [CL]《Getting the most out of your tokenizer for pre-training and domain adaptation》 No 17. Web2pdf:一个命令行工具,用于将网页转换成精美格式的PDF文件,具有批量转换、自定义样式、多列支持、页码添加、目录生成等功能,还支持自定义CSS以进一步定制PDF外观,可以帮助用户轻松地将多个网页转换为PDF文件,并在格式和样式上进行灵活的调整 No 18. [LG] Approximate Nearest Neighbor Search with Window Filters ...... No 19. [CL] Executable Code Actions Elicit Better LLM Agents 使用可执行的Python代码来扩展大型语言模型(LLM)Agent的行动空间,提供了更高的灵活性和性能。CodeAct框架可以执行代码行动,并在多轮交互中动态调整之前的行动或根据新的观察产生新的行动。通过对17个LLM进行广泛分 ...... No 20. 2023年最值得关注的顶级Python库 No 21. 研究了tokenizer在预训练和领域自适应中的优化方法和影响,发现专门设计的tokenizer可以显著提高生成速度和有效上下文大小。//[CL]《Getting the most out of your tokenizer for pre-training and domain adaptation》 No 22. 几篇论文实现代码 No 23. 'tt-zhipin - 头头直聘,仿Boss直聘实现。SpringCloud Alibaba 构建后端,React ...... No 24. Notty:开源、简约的AI笔记应用,强大的 Markdown 编辑器。特点包括:简洁易用、AI 助力、内置 Markdown 编辑器、云同步、冲突解决、本地优先和快速响应 No 25. 神经科学和生物医学大语言模型的数据科学机遇 No 26. chinchilla:一个研究工具包,旨在估计缩放律并为各种深度学习任务训练计算最优化的模型 No 27. Redis作者antirez关于LLM的分享 No 28. [CL]《When Benchmarks are Targets: Revealing the Sensitivity of Large Language Model Leaderboards》 No 29. [CL] Large Language Model based Multi-Agents: A Survey of Progress ...... No 30. RLX: 基于MLX的强化学习框架,旨在利用Apple M系列芯片的统一内存功能来增强强化学习算法的性能和效率 No 31. 通过整合人工反馈,提出MusicRL系统用于音乐生成,通过强化学习进行微调,提高音乐生成模型的性能,充分考虑了音乐的主观性和用户偏好。 No 32. [CL] More Agents Is All You Need 通过简单的采样和投票方法,大型语言模型(LLM)的性能与实例化的agent数量成比例。这种方法与现有的复杂方法无关,同时增强LLM的程度与任务难度相关。通过在广泛的LLM基准测试上进行全面实验,验证了该发现,并研究了能够促进其发生的属性。 ...... No 33. 提出一种顺序相关的候选补全方法Hydra heads,通过引入顺序相关性提高了预测准确性和解码速度,相比于传统方法和自回归解码具有更高的解码吞吐量。//[LG]《Hydra: Sequentially-Dependent Draft Heads for Medusa Decoding》 No 34. Adam 优化器背后的数学原理 No 35. NanoDL:基于Jax构建的库,用于从头设计和训练transformer模型支持广泛的模型选择、数据并行分布式训练、数据加载器、自定义层和GPU/TPU加速的经典机器学习模型等 No 36. [LG]《Hydra: Sequentially-Dependent Draft Heads for Medusa Decoding》 No 37. [LG]《Let Your Graph Do the Talking: Encoding Structured Data for LLMs》 No 38. ai-benchmarks:用于测试流行AI服务响应延迟的实用,支持大型语言模型(LLM)如OpenAI GPT-3.5、GPT-4、Anthropic Claude 2、Google Gemini Pro和PaLM 2 Bison等 No 39. GitButler:基于Git支持的版本控制客户端... No 40. Shoggoth:点对点匿名网络,用于发布和分发开... No 41. 今日推介(第1313期):Medusa解码的序列相关Draft Heads、语音和文本交织语言模型、揭示大语言模型排行榜的敏感性、面向预训练和领域自适应的tokenizer优化、用人工偏好微调音乐生成模型 ...... No 42. OpenAI Batcher (oaib):用于向OpenAI API发出有限速异步批量请求的Python库,使用Batch可以在TPM/RPM限制下尽快进行批量请求,使用Auto可以自动从OpenAI的响应头中读取速率限制,并尽快运行任务 No 43. [LG] Leveraging Large Language Models for Structure Learning ...... No 44. [CL] Large Language Models are Geographically Biased 大型语言模型存在地理偏见。研究发现,大型语言模型(LLM)在地理空间预测中存在系统性错误,表现为对低社会经济条件地区的偏见。这种偏见涉及了主观和客观主题,如吸引力、道德和智力。研究还提出了一种衡量偏见程度的 ...... No 45. Pod-Helper:一款先进的音频处理工具,不仅可以以极快的速度转录音频,还可以利用MLM(Masked Language Model)目标进行音频修复,以确保内容保持其质量和氛围,其功能包括实时音频转录、音频损坏修复以及情感分析,帮助用户理解内容的情绪 No 46. IntelliScraper:高级的Python网... No 47. LionAGI:先进的智能agent框架,集成了数据处理和先进的机器学习工具,如大型语言模型(如OpenAI的GPT),专为以数据为中心的生产级项目设计,大大降低了创建能够理解和与大量数据进行有意义交互的智能自动化系统的门槛 No 48. AlgoPlus:一个C++库,包含了现成的复杂数据结构和算法,支持图结构、最短路径计算以及可视化 No 49. MLX Embedding Models:用MLX在苹果电脑上本地运行基于BERT- 或 RoBERTa- 的高性能嵌入模型 No 50. Vaibhav (VB) Srivastav总结的中国LLM/VLMM/TTS模型重要贡献: LLM/ VLM ......