









这些真题来自字节和阿里等大模型岗位真题:
在查看学生项目后追问:RAG vs 微调?LoRA不能替代RAG吗?—— 斩获Offer必答的“场景划分”题
RAG 适用场景主要考虑有“外部知识库”,且经常变,先考虑 RAG。经典的场景有如下几种:
1. 知识更新频繁 法规、券商研报、公司内文档、FAQ、wiki,这类内容每周都在变。 → RAG 不需要改模型,只更新向量库即可。
2 知识量大 / 长尾很重 几十 GB 文档、不停新增的新产品、新客户。 → 全塞进微调里不现实,一方面容易遗忘,另外一方面盲目塞这么多数据进去训练,也会影响模型训练数据的分布。
3. 需要可追溯、可解释 客户问“这个结论哪来的?”,RAG 能把原文段 / 链接贴出来。 → 合规、金融、医疗等场景很看重。
4. 不同租户/客户的私有知识 每个客户自己的文档、知识库。 → RAG 可以做多用户隔离,不需要为每个客户单独微调一个模型。
5. 数据量不大、噪声多 几百到几千条文档,质量参差不齐。 → 微调很容易过拟合,RAG 更稳。
微调(包括 LoRA)适用场景:要“教模型新知识/能力 / 说话风格 / 格式习惯”时用微调。
更多相关面试真题详解欢迎加入 AgentAlpha训练营 ~ ~
#大模型 #agent #互联网大厂 #面经 #人工智能就业 #算法 #rag
在查看学生项目后追问:RAG vs 微调?LoRA不能替代RAG吗?—— 斩获Offer必答的“场景划分”题
RAG 适用场景主要考虑有“外部知识库”,且经常变,先考虑 RAG。经典的场景有如下几种:
1. 知识更新频繁 法规、券商研报、公司内文档、FAQ、wiki,这类内容每周都在变。 → RAG 不需要改模型,只更新向量库即可。
2 知识量大 / 长尾很重 几十 GB 文档、不停新增的新产品、新客户。 → 全塞进微调里不现实,一方面容易遗忘,另外一方面盲目塞这么多数据进去训练,也会影响模型训练数据的分布。
3. 需要可追溯、可解释 客户问“这个结论哪来的?”,RAG 能把原文段 / 链接贴出来。 → 合规、金融、医疗等场景很看重。
4. 不同租户/客户的私有知识 每个客户自己的文档、知识库。 → RAG 可以做多用户隔离,不需要为每个客户单独微调一个模型。
5. 数据量不大、噪声多 几百到几千条文档,质量参差不齐。 → 微调很容易过拟合,RAG 更稳。
微调(包括 LoRA)适用场景:要“教模型新知识/能力 / 说话风格 / 格式习惯”时用微调。
更多相关面试真题详解欢迎加入 AgentAlpha训练营 ~ ~
#大模型 #agent #互联网大厂 #面经 #人工智能就业 #算法 #rag

研报速递
发表评论
发表评论: