📌 回顾
上篇我们讲了模型评测工具箱——如何用自动化评测脚本、标准 Benchmark 和 LLM-as-Judge 来判断微调效果。但系列里所有的微调样例都是单轮问答:一个 user 消息,一个 assistant 回复。
现实中的对话不是这样的。用户会追问、补充、切换话题,模...
神棍
2天前 18℃ 0评论
0喜欢
开篇:微调一时爽,评测火葬场
前两篇文章我们学会了 LoRA 和 QLoRA 微调,把通用大模型变成了”专属小助手”。但有一个灵魂拷问始终绕不过去——微调完之后,怎么知道它真的变好了?
只看 Loss 曲线下降就高兴得太早了。我见过很多人微调后模型反而变笨...
神棍
7天前 26℃ 0评论
0喜欢
QLoRA 微调:4GB 显存也能跑大模型训练
上篇文章我们聊了 LoRA——用两张小矩阵代替全量参数更新,把 7B 模型的微调显存需求从 60GB 打到了 12GB 左右。这个门槛对一张 RTX 4070 或 3080 来说已经可以接受了。
但问题来了:如果你只有一张老旧的 R...
神棍
1周前 (06-07) 32℃ 0评论
0喜欢
LoRA 微调实战:在自己电脑上给大模型”打补丁”
上篇文章我们用手写200行代码,搭了一个本地 RAG 知识库问答系统。RAG 解决了”让模型知道你的私有数据”这个问题——把文档切片、向量化、检索,再丢给大模型回答。
但 RAG ...
神棍
2周前 (06-01) 68℃ 0评论
0喜欢
上篇文章《从零学大模型》我们聊了入门路线图,其中反复提到一个观点:RAG 解决 90% 的问题,微调只解决剩下的 10%。今天就来兑现这个承诺——从零搭一个能用的 RAG 系统,全程不超过 200 行 Python。
RAG 到底是什么?一句话说清楚
大模型的知识截止于训练数据那...
神棍
2周前 (06-01) 89℃ 0评论
0喜欢
从零学大模型:一个前端开发者的入门路线图
ChatGPT 横空出世两年多了,大模型早已不是科研圈的专属玩具。如果你是个普通开发者,看别人用 AI 写代码、做自动化、搭智能体,心里痒痒但又觉得门槛太高——这篇文章就是写给你的。
零基础,纯实操,不讲数学公式,不推晦涩论文,只告诉你一...
神棍
3周前 (05-29) 63℃ 0评论
0喜欢