返回上一页 教你一键把微信接入AI【免费】本地化教程 网站建设公司资讯 【3分钟】深度剖析软件行业定价规则(为什么100万开发的程序只卖10万)

当前位置:首页 > 观点资讯 > 软件定制开发 > 详细内容

【小白教程】带你上手微调大模型,仅需4步

时间:2024-11-26 浏览:163次 + 打印

嗨,朋友们!今天我来给大家分享超实用的大模型微调教程,哪怕你是小白,跟着做也能轻松上手哦,草侣虫都能学会,所以大家赶紧收藏点赞关注呀!

AI,大模型,微调,LLM,OpenAI

咱们直接在 openAI 的 dashboard 里进行可视化微调,操作那是相当简单。虽说这教程有点长,但咱得先在简单操作里把微调的关键搞清楚。

首先,来到 openAI 官网,看看官方咋说微调的。官方讲微调就 4 个步骤:一是准备数据集,二是训练,三是评估测试效果,四是开始使用。听起来挺简单吧?但啥时候用微调呢?官方说了,先试试靠提示词能不能解决问题,很多时候调整提示词就行,因为迭代提示词比微调结果方便多了,这有点劝退的意思哦。不过要是试了提示词还不行,那之前试的提示词也不浪费,用在微调模型上效果更好。

那微调能改善啥情况呢?像设定风格,比如模仿谁说话、固定回答格式啥的。还有些难懂的,咱就重点理解这条:有些东西靠嘴说不清楚,但给例子展示结果就容易,就像让模型理解网友幽默感,或者训练温柔暖心的心理医生,形容词太虚说不明白,给它看很多相关例子让它自己悟,这就是微调的厉害之处。而且微调里最重要的是先想好目标和结果,没考核标准,做啥都可能白搭。

接着说给 AI 看啥示范数据,格式是 jsonl 格式,看着晕别慌,其实就是一组组对话,一行就是一组,写明希望啥输入对应啥输出。比如我准备训练一个偶尔会写错字拼错词的医生,像 “左手用力或者变换成一定的姿势是吴腕背部精疼,有时候睡觉疼醒了。”“你好,你说的情况可能是韧带肌腱炎引起的啊,建议指导你注意休息,不要着凉服用这个片,祝你健康” 这样的对话,就是我们期望模型达到的效果。这里面一条信息有 3 个角色,系统内容(如 “你是一个偶尔会拼错单词的助手”,数据少更好写上)、用户输入、助手回答。练习时可以网上找公开数据集或者按格式自己准备,我也会给大家打包好哦。准备数据集时,openAI 提示至少 10 组示例,50 - 100 个效果更好,还建议分成训练和测试两部分。

数据集好了就到 dashboard 微调。点击左边 fine tuning 微调再点创建。这里 base model 选基础模型,比如 4.0 啥的,然后上传训练数据(jsonl 文件),验证数据可传可不传。给模型起个名字,像我叫 tengsheji。种子能固定训练效果,相同种子和参数训练结果相同,不写系统随机生成。还有超参数,batch size 批次大小,就像人学习听完知识得总结更新参数,它规定大模型看多少数据更新一次参数,太大太小都不好,得选合适的;学习率呢,大模型找更优解就像在山里找低谷,学习率决定步子迈多大,高了找不到更低点,低了可能只找到局部更低点,影响学习速度和稳定性;训练轮数就是大模型看完整遍数据集算一轮,轮数太多会过拟合,像人学傻了一样,问啥只按数据答,没泛化能力。openAI 建议开始别指定参数,用默认值,不行再调整,训练是个反复调整检验的过程。

点击创建,很快就训练好了,有成功模型后就能去 Playground 测试,还能在外部通过 API 调用。好啦,这次简单的大模型微调之旅就到这,记得点赞收藏关注哦,下次再见!
网站建设公司项目经理

扫二维码与项目经理沟通

我们在微信上24小时期待你的声音
解答:网站优化、网站建设、APP开发、小程序开发

藤设计是一家互联网开发公司,专注于为客户提供供网站建设网站优化APP开发小程序开发、网络营销推广等一系列解决方案。我们以客户需求为导向,并以客户利益为出发点,充分发挥自身的设计及专业建站优势,从基础建设到营销推广,为客户探索并实现商业价值的最大化,致力于为所有谋求长远发展的企业做出贡献。

Learn more

Teng Design 专业网站设计制作

Learn more

Our Service 上海网站建设
QQ客服 微信客服 返回顶部
网站制作
扫二维码与项目经理沟通
×