向量库与RAG·2 天前
Hugging Face 博客发布 IBM Granite Embedding Multilingual R2,这是一款采用 Apache 2.0 开源许可的多语言 Embedding 模型。该模型支持 32K 上下文窗口,参数量低于 100M,在检索质量上达到同规模最佳水平。模型面向多语言检索与 RAG 场景设计,支持长文档嵌入,适合资源受限的部署环境。
大模型·2 天前
Anthropic 发布了 Claude Certified Architect 认证考试,面向使用 LLM 的工程人员。考试内容涵盖评估(evals)、护栏(guardrails)、RAG 的正确实现、多智能体编排,以及何时不应使用 LLM。考试难度在于材料本身不繁重,但考题全面深入,需要真正理解工程实践而非死记硬背。认证入口通过 Skilljar 平台开放,同时配套官方学习视频。
向量库与RAG·3 天前
Reddit 用户发帖询问是否有人真正把本地 LLM 当作日常个人知识库使用(非编码、非实验),引发社区讨论。核心痛点集中在三方面:消费级硬件上 RAG 的检索精度不可靠,用户需要反复核对结果;LlamaIndex、Ollama 等工具链变化太快,两年前的教程已失效;个人文档积累后上下文长度管理困难。社区反馈显示,目前尚无开箱即用的方案,维护成本接近一份兼职工作。