01
资料拆解
读取课程总说明、PDF、作业和实战视频,把 PEFT/LoRA/Whisper 学习内容转成数据准备、训练评估、测试复盘三个工作任务。
交付物:课程资料拆解表 + 实训蓝图
宇树
加入 Voke 教研实验室 AI 工程组,基于 LoRA 对 Whisper-Large-v2 进行中文语音识别微调,完成从环境搭建、数据准备、LoRA 训练到 WER/CER 评估的全流程工程闭环。
✓完成对应前置课程或通过岗位能力测评
✓能按任务节点提交代码、文档、截图或复盘报告
✓理解企业真实岗位要求中的能力点,并能解释自己的方案取舍
✓项目代码或配置文件链接
✓项目演示 PPT / 录屏 / 关键截图
✓技术复盘报告:需求理解、实现过程、问题与改进
工单式推进 · 每步留证据
读取课程总说明、PDF、作业和实战视频,把 PEFT/LoRA/Whisper 学习内容转成数据准备、训练评估、测试复盘三个工作任务。
交付物:课程资料拆解表 + 实训蓝图
检查中文语音数据集格式、采样率、转写文本和划分比例,记录异常样本与清洗规则,确保后续训练可复现。
交付物:数据划分表 + 清洗记录
基于课程 notebook 跑通 LoRA 微调 Whisper-Large-v2,并补充 Train Loss / Validation Loss 过程评估和关键超参记录。
交付物:训练日志 + loss 曲线截图
使用测试集完成完整评估,输出 WER/CER、错误样例和下一轮改进建议,整理为作品集可讲述案例。
交付物:测试评估报告 + 作品集复盘
4 / 10 人已加入 · 还差 6 人