爱可可微博热门分享(4.9) - Githubissues

fly51fly / aicoco

“爱可可-爱生活”微博内容精选

495 stars 62 forks source link

爱可可微博热门分享(4.9) #123

Open fly51fly opened 1 month ago

fly51fly commented 1 month ago

No 1. QAnything：致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用 No 2. [CL] Chinese Tiny LLM: Pretraining a Chinese-Centric Large ...... No 3. #免费##抽奖# 携手@异步图书送出3本《大语言模型：基础与前沿》 No 4. 用大语言模型(LLM)处理表格数据相关论文资源列表 No 5. llm.c：实现了大语言模型(LLM)训练的简单、纯 C/CUDA 版本，无需 PyTorch 或 cPython No 6. Financial Datasets：开源 Python 库，用于利用大语言模型(LLM)生成合成的金融/财务数据集 No 7. Ollama新增对嵌入(Embedding)模型的支持，可用于构建检索增强生成(RAG)应用，提供了若干预训练好的嵌入模型,包括mxbai-embed-large、nomic-embed-text、all-minilm等 No 8. 'linux-tutorial - Linux教程，主要内容：Linux 命令、Linux 系统运维、软件运维、精选常用Shell脚本' ...... No 9. 生成式AI高峰已过？ No 10. 元编程新思路：用Claude 3 Opus打造'files-to-prompt'工具 No 11. 晚安～ [月亮] No 12. HammerLLM：1.4B参数量的LLM，提供简洁高效的训练代码库，并完全开源了模型权重、环境、代码库和超参数 No 13. MLIR-EmitC：将 ML 模型转换为 C++ 代码的工具，它包含将 Keras 和 TensorFlow 模型转换为 TOSA 和 StableHLO dialect，以及将这些dialect转换为 EmitC 的脚本和工具 No 14. 几篇论文实现代码 No 15. [LG] Stream of Search (SoS): Learning to Search in Language 网页链接 ...... No 16. Morphic：AI驱动的回答引擎，类似Perplexity，可以提供准确和实时的答案，配备生成式 UI No 17. Inqwire：主打不用LLM提供智能服务的软件，可应用于生活决策、困难情况、关系等诸多方面，致力于增强人们的天然智能，以帮助人们理解事物，创造有意义的世界 No 18. [CV]《No 'Zero-Shot' Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance》 No 19. 通过大规模分析发现当下多模态模型存在数据饥渴性和样本低效问题，预训练数据频率与下游泛化性能呈对数线性关系，需要重新审视大规模泛化学习范式。//[CV]《No 'Zero-Shot' Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance》 No 20. 旨在收集和整理语音/音频领域的大语言模型(LLM)、表示学习和编解码模型列表 No 21. FastAPI-Amis-Admin：拥有高性能,高效率,易拓展的fastapi管理后台框架 No 22. [RO] MM-Gaussian: 3D Gaussian-based Multi-modal Fusion for ...... No 23. LLM入门：不涉及太多数学和术语的LLM基本原理通俗讲解 No 24. AutoMQ: 用于 Apache Kafka 的云原生实现，旨在缩减云基础设施费用，使用类似 Kubernetes 的方式来部署和管理 Kafka 集群，并提供了自动伸缩、故障迁移和监控等功能 No 25. [LG] Transformers for molecular property prediction: Lessons ...... No 26. [IR]《Dwell in the Beginning: How Language Models Embed Long Documents for Dense Retrieval》 No 27. JORA：解决了 LLM 在 RAG 中的内存限制问题，提供了一种基于 JAX 的分布式训练方法 No 28. 今日推介(第1370期)：基于大语言模型的社交技能训练、鲁棒高斯Splatting、机器人装配的数据高效模仿学习、语言模型如何嵌入长文档以进行稠密检索、指数数据增长才能实现“零样本” ...... No 29. 从0到1构建一个MiniLLM No 30. 基于生成式模型的推荐系统相关论文列表 No 31. 早！[太阳] No 32. ΦML：数学和神经网络库，专门为科学应用设计，支持 Jax、PyTorch、TensorFlow 和 NumPy，并提供了许多有用的特性 No 33. 'Bili2text - Bilibili视频转文字，一步到位，输入链接即可使用' GitHub: github.com/lanbinshijie/bili2text ...... No 34. 'stable-diffusion-tutorial - 全网最全Stable Diffusion全套教程，从入门到进阶' ...... No 35. Julius：个人AI数据分析师，连接数据并进行提问，支持Excel表格、Google表格和Postgres，生成各种数据可视化 No 36. Neco：C 语言编写的并发库，提供了使用 coroutines(协程)的方式进行并发编程 No 37. GigaAM: 一个基础模型，专门为语音识别任务设计，包括 GigaAM、GigaAM-CTC 和 GigaAM-Emo 三个模型 No 38. [CL] Towards a Robust Retrieval-Based Summarization System ...... No 39. LLM“红队”课程：教你如何测试和发现LLM应用中的漏洞，以使其更安全。通过提示注入攻击各种聊天机器人应用，看系统如何反应，理解安全失败。LLM失败会导致法律责任、声誉损害和代价高昂的服务中断。该课程帮助你积极测试、攻击和改进LLM应用的健壮性 No 40. zeabur：帮开发者使用一键部署服务的平台，无论使用哪种编程语言或框架，都可以使用一键部署服务 No 41. ZhiJian：基于 PyTorch 的模型重用工具包，旨在利用预训练模型和其微调后版本来提取知识并加速实际任务的处理，根据模型准备、模型学习和模型推断三个阶段分别提供了架构、微调和合并模块 No 42. 通过建模运动模糊、散焦模糊和颜色偏差，提高了3D高斯Splatting方法在真实场景重建中的鲁棒性和重建质量。//[CV]《Robust Gaussian Splatting》 No 43. 'MaxKB - 基于 LLM 大语言模型的知识库问答系统，开箱即用，支持快速嵌入到第三方业务系统' GitHub: ...... No 44. Fuwari：用 Astro 构建的漂亮静态博客模板 No 45. ai-researcher：AI 研究助手，基于 Anthropic Claude 和 SERPAPI，可以对给定的主题进行详细的研究。它将研究过程分解为子主题，为每个子主题生成单独的报告，然后将它们合并为最终的综合报告 No 46. [CV]《Robust Gaussian Splatting》 No 47. 发现Transformer检索模型存在偏好输入前段信息的“序处停滞”效应，这种位置偏差源自对比预训练过程。//[IR]《Dwell in the Beginning: How Language Models Embed Long Documents for Dense Retrieval》 No 48. 'Mistral 7B v0.2 JAX - JAX implementation of the Mistral 7b v0.2 ...... No 49. RAG进化之路 No 50. 用于Python数据工程师的Kurtosis包，可部署Jupyter笔记本、可配置的数据库和可视化工具（Streamlit)，将Jupyter、选择的数据库以及Streamlit无缝连接，使用Jupyter原型化数据收集，使用Streamlit原型化数据可视化