研究历史
2026年 博四
| 月份 | 内容 |
|---|---|
| 1 | 1.Logic完成ICML 转投 2.LRM完成整体算法设计和基本工程规划,论文初稿形成 3.项目/申报:国自科(循证医学 + LLM 协同决策)方向材料 |
2025年 博三
- 博士三年级,研究主线:超越人类专家顶尖水平的 LLM 研究,聚焦大模型逻辑推理能力提升
- 核心工作:Logic 项目(数据构造 14 万+、训练 47+ SFT/CPT 模型)、benchmark 建设、元评估(诗歌等艺术性场景)、类 o1 模型泛化性评估
- 论文投稿:Logic 工作 ARR→ICLR→ICML 在投;另合作 1 篇、在研 1 篇;疾病因果关系发现(SCI 二区)定稿;AI4Sports EDMIT 论文;综述撰写推进
- 荣誉:清华大学健美比赛第五名、博士生学术论坛第一名(oral + poster)
- 其他:腾讯青云奖学金申请、开题准备、雁行计划「大模型驱动数字中国建设」项目实施(报告 1.1 万字)
| 月份 | 内容 |
|---|---|
| 12 | 1. LRM文献调研 2. ICML投稿准备 3. 健美比赛第五名 |
| 11 | 1. Logic修改;2. 综述;3.算法研究;3. 开题准备 1. 腾讯青云奖学金申请 2. Logic训练 3. 论文ICLR出分 ICLR审稿意见,Logic补充实验 |
| 10 | 1. ICLR2026投稿+ICLR审稿 2. 开源SFT+RL方法复现与使用评测与数据合成实验设计训练实验结果 3. poster与oral准备:博硕学术论坛第一名 |
| 9 | Logic工作投ICLR:补实验 / 打磨论文稿件 |
| 8 | 1. Logic:论文修改 2. 综述:大纲;论文收集 3. 其他论文:AI4Sports类文章《EDMIT:An End-to-End Agentic Framework for Enhanced Decision-Making in Interactive Motion Tutoring 》 头脑风暴:dLLM 扩散语言模型Universal Model 通用大模型 论文定稿:Towards Artificial Intelligence for Science: A Case Study of Using ChatGPT for Disease Causality Discovery from Biomedical Literature (SCI二区) 4. 其他:党建论文;雁行计划:数实融合新引擎·智创产业新未来——大模型驱动数字中国建设 项目实施,报告1.1W字+外宣 |
| 7 | 1. benchmark工作初步结束 |
| 6 | 1. 梳理了整体论文写作思路,大体完成论文核心部分的初稿 2. 代码开发初步完成核心功能 3. 收集10个元数据 |
| 5 | 1. 【科研】benchmark写代码、论文草稿 2. 【论文】迈向科学的人工智能:使用 ChatGPT 进行疾病因果关系发现的案例研究-审稿意见思考 |
| 4 | 1. 逻辑推理训练28个SFT模型、2个CPT模型 2. 修改1篇论文 3. 构造数据14W 4. 2篇文章初步构造框架 |
| 3 | 1. 基座逻辑推理能力提升:模型训练 47个模型 |
| 2 | 1. 基座逻辑推理能力提升项目启动 2. 调研 3. 基本数据构造 4. 基本训练尝试 |
| 1 | 1. 类o1模型的泛化性评估与研究 第一个月 2. 超越人类专家顶尖水平的LLM研究 研究方向确定 3. 元评估-诗歌场景算法实现 |
2024年 博二
- 博士二年级,导师唐杰,在智谱AI实习,担任AML&ML课程助教、KEG大模型训练营讲师(深度学习基础)
- 核心研究:ChatGLM数学推理(PRM、RLHF全流程)、多模态数学推理、MalayGLM国际化、ChatGLM中英混杂问题、元评估(诗歌等艺术性文本评测)
- 论文与成果:6篇投稿(IJCAI、CogSci、ICML等);2篇发表(联邦学习、医学知识库);AiMed软件著作权;担任两个论文会议场地主编
- 荣誉:挑战杯首都大学生创业计划竞赛金奖(北京市一等)、国三等奖;社会实践金奖(全校第二);优秀共青团员、计算机系优秀学生干部;公安机关外聘专家;2封市级政府感谢信
- 奖学金:社会实践奖学金、校级惠妍英才奖学金(二等)
- 社工:计算机系党支部书记、带班助理,负责学校团委公共系统「同行」平台
- 应用落地:公安系统、医疗系统、LLMDailyDigest 网站、AML课程对外网站(aminer.cn/aml2024)
| 论文标题 | 投稿期刊 |
|---|---|
| ChatFUV:Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案 | IJCAI人工智能 |
| AiMed: Artificial Intelligence large language model for chinese Medicine 面向中文医学的人工智能大语言模型 | IJCAI人工智能 |
| NewMed:Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care 大语言模型技术赋能全流程数智医疗 | CogSci认知科学 |
| MedRad:一个医学大模型的可靠辅助决策框架 | ICML机器学习 |
| Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准 | ICML机器学习 |
| Doctor:The Most Reliable Digital Intelligence Healthcare Large Language Model System 最可靠的数智医疗大模型系统 | - |
| OpenMonet:Open Model Orchestration Network 开放模型协作网络 | - |
| MedLib: Research on the construction of a knowledge library for medical large language modeling 面向医学大语言模型的知识库构建研究 | - |
| 月份 | 月总结 |
|---|---|
| 12 | KEG大模型训练营讲师-深度度学习基础 Malay LLM AML课程结课筹备:作业baseline、panel、评分标准与大作业节课、论文场地申请AML书籍编撰 |
| 11 | 课程对外网站搭建https://www.aminer.cn/aml2024 AML算力平台搭建 Computing Platform 教程 Tutorial Meta Evaluation: Use LLM to evaluate the LLM evaluator 元评估:用LLM来评估LLM评估器 立项申请-诗歌等艺术性文本的评测平台 |
| 10 | Reinforcement Learning Survey、Self-Learning:Evaluation& Data & New Scaling Law课件制作 Post_Training_Scaling_Laws_Survey综述改修 |
| 9 | Enhancing Mathematical Reasoning in Multimodal Large Language Models 提升多模态大型语言模型的数学推理能力 |
| 8 | 社会实践总结math文献调研 |
| 7 | chatglm数学推理|项目进展-month4:math2-prm evaluation fix暑期博士生必修实践项目 |
| 6 | chatglm数学推理|项目进展-month3:模型|PPO Training 训练RLHF模型模型检验|PRM] |
| 5 | chatglm数学推理|项目进展-month2:模型|PRM Inference 采用过程奖励模型进行基本推理模型|PRM Training 训练过程奖励模型模型|PRM Evaluation 对过程奖励模型进行评估 |
| 4 | chatglm数学推理|项目进展-month1:数据构造|自动化逐步标注人类反馈算法|前向自动标注与后向评分反馈结合进行计算过程奖励 |
| 3 | 1.chatglm国际化 2.中英混杂问题处理 |
| 2 | 个人材料准备 |
| 1 | 论文投稿*6 |
2023年 博一
- 研究重心聚焦医学大模型与知识工程
- 核心成果:AiMed 1.0 开源发布、Doctor 1.0 部署上线、Med-Eval 测评基准建设启动
- 论文方向:AiMed、ChatFUV、NewMed、Med-Eval、MedRad 等多篇医疗大模型相关工作推进
- 课程:高级机器学习(RLHF、RAG 等作业与项目)、CSE 论文汇报(KrNER、PoKG)、中国马克思主义与当代
- 数据建设:预处理 8 万条电子病历数据、构建指南库与病历库、药品说明书与检验知识库
- 其他:系实践述职、智源活动、软件学报材料、联邦学习论文等
| 序 | 任务 | 任务详述 |
|---|---|---|
| 1 | 模型选择 | 分开单独链接 |
| 2 | 知识库外挂 | 相似患者第一批:预处理2万条电子病历数据:从SQL导出为格式化json |
| 3 | 知识库统计 | AiMed现行数据 |
| 4 | 知识库外挂 | 指南 |
| 5 | 系实践述职 | 材料准备 |
| 6 | CSE论文report | KrNER:PPT |
| 7 | CSE论文report | PoKG:PPT |
| 8 | 系实践述职 | 现场述职 |
| 9 | AiMed1.0发布:版权 | 版权问题 |
| 10 | CSE论文report | KrNER:对应讲稿准备,外加视频录制 |
| 11 | CSE论文report | PoKG:对应讲稿准备,外加视频录制 |
| 12 | AiMed1.0发布:服务 | 敏感信息过滤 |
| 13 | CSE论文report | 参会做现场汇报 |
| 14 | 多模型链条 | 相关研究调研 |
| 15 | 高级机器学习 | HW1-Tokenization及压缩率比较-共计5篇论文/5个实验 |
| 16 | AiMed1.0发布 | AiMed1.0项目开源 |
| 17 | AiMed1.0发布 | AiMed1.0-chat参数发布 |
| 18 | AiMed1.0发布 | AiMed1.0-paperabs参数发布 |
| 19 | AiMed1.0发布 | AiMed1.0-前端对接 |
| 20 | AiMed1.0发布 | AiMed1.0-后端对接 |
| 21 | AiMed1.0发布:参数 | 我们可以发布一个基本的AiMed走完全程的模型参数AiMed-Base |
| 22 | 中国马克思主义与当代 | 选题确定 |
| 23 | 社工 | 软件合办智源活动 |
| 24 | AiMed1.0发布 | 对接医信所工作 |
| 25 | LLM调研 | |
| 26 | AiMed2.0 | 数据准备 |
| 27 | LLM | 相关调研 |
| 28 | 高级机器学习 | Project proposal |
| 29 | 高级机器学习 | 项目提案 |
| 30 | AiMed2.0训练 | AiMed2.0-Chat对话模型训练-第一轮 |
| 31 | AiMed2.0训练 | AiMed2.0-Chat对话模型训练-第一轮-相关测试 |
| 32 | 高级机器学习 | 项目提案PPT |
| 33 | 中国马克思主义与当代 | PPT |
| 34 | 专利 | 邱师兄专利修改 |
| 35 | 高级机器学习 | 项目提案PPT |
| 36 | 中国马克思主义与当代 | PPT |
| 37 | 专利 | 邱师兄专利修改 |
| 38 | 高级机器学习 | Project proposal PPT |
| 39 | 高级机器学习 | 项目提案PPT |
| 40 | 高级机器学习 | Project proposal PPT对应讲稿 |
| 41 | 医信所汇报PPT | |
| 42 | 高级机器学习 | 项目提案PPT对应讲稿 |
| 43 | 高级机器学习 | 项目讨论 |
| 44 | 张瑞麟师兄 | 软件学报材料准备 |
| 45 | 高级机器学习 | 准备小组讨论 |
| 46 | AiMed接口优化 | 敏感信息 |
| 47 | Doctor1.0部署 | 模型部署到长沙机房 |
| 48 | LLM | 相关调研 |
| 49 | 张瑞麟师兄 | 软件学报材料准备 |
| 50 | 高级机器学习 | 项目讨论 |
| 51 | Doctor | 完成指南库和病历库的相关开发 |
| 52 | AiMed1.0发布:服务 | 相似患者第二批:预处理6万条电子病历数据:从SQL导出为格式化json |
| 53 | 工程库与检索 | 药品说明书、检验、指南库 |
| 54 | 处理长沙文档 | 切换到长沙权限才可访问 |
| 55 | 高级机器学习 | 第二次作业:RLHF在多模态领域的应用 |
| 56 | Med-eval | 制定整体推进计划 |
| 57 | Med-eval | 相关同事分工推进 |
| 58 | 高级机器学习 | poster |
| 59 | 高级机器学习 | PPT |
| 60 | Med-eval | 制定整体推进计划 |
| 61 | Med-eval | 相关同事分工推进 |
| 62 | Med-eval | 数据集的构建:3个数据集 |
| 63 | Med-eval | 以及点对点和各位同学的分工 |
| 64 | Med-eval | RAG相关整理 |
| 65 | 高级机器学习 | 第三次作业:RAG |
| 66 | 区块链 | 大作业 |
| 67 | 高级机器学习 | MedRed:论文维护位置 |
| 68 | AiMed1.0 | AiMed: 面向中文医学的人工智能大语言模型 |
| 69 | ChatFUV1.0 | ChatFUV:Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案 |
| 70 | NewMed1.0 | NewMed:Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care |
| 71 | Med-Eval1.0 | Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准 |
| 72 | MedRad1.0 | MedRed:论文维护位置 |
| 73 | 联邦学习论文 | 软件学报材料邮寄 |
2022年 博零
- 本科毕业 + 博士入学:完成本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》(院系、校级答辩),9 月进入清华大学计算机系攻读博士学位
- 科研论文:MoNER(面向医疗的命名实体识别)研究性论文投稿与多轮修改,综述完稿
- 竞赛与调研:CBLUE/CBLUE2 打榜,BioNLP 测评基准调研,CCKS/EMNLP 会议解析,区块链重点研发指标调研
- 暑期实践:清华大学 & 中南大学医工交叉夏令营,长沙项目(AI 问诊机器人、实体识别、疾病预测、湘雅医院实地测试)
- 博士阶段初探:知识图谱综述、以患者为中心的知识图谱、数据与知识联合驱动的智慧患者管理
- 其他:个人 WIKI 搭建,与中国医学科学院/中国科学院医学信息研究所交流
| 月份 | 周次 | 内容 |
|---|---|---|
| 1 | 1 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》开题答辩 |
| 2 | 个人 WIKI 搭建 / BERT实验 / 综述修改 | |
| 3 | 中文医疗信息处理挑战榜CBLUE打榜 / 综述修改 | |
| 2 | 1 | 中文医疗信息处理挑战榜CBLUE2打榜 / 综述修改 |
| 2 | 国外BioNLP测评基准调研 / 国内推进中文医疗信息处理的相关会议赛事调研 / 医疗数据来源调研 / 综述修改 / 实验 | |
| 3 | 综述理论性调研分析 / 实验 | |
| 3 | 1 | 精读2篇论文 |
| 2 | 精读16篇论文 | |
| 3 | 综述完稿 / 区块链重点研发指标解析调研 | |
| 4 | 区块链重点研发指标解析调研2 / 实验 | |
| 4 | 1 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》中期答辩 |
| 2 | CCKS会议解析 / EMNLP会议解析 | |
| 3 | EMNLP细致调研 / 中国医学科学院医学信息研究所会议总结 / 综述 / 实验 | |
| 4 | 综述定稿 / 区块链重点研发指标补充调研 | |
| 5 | 1 | 研究性论文初稿 / 医疗知识图谱调研 / 实验室主页调研与设计 |
| 2 | 实验室细节页调研与设计 / 毕业设计 | |
| 3 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》论文定稿 | |
| 4 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》PPT | |
| 6 | 1 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》结题一次院系答辩、二次校级答辩 / 嵌套命名实体识别研究 |
| 2 | 慢性肾病全病程服务系统BRD文档1.0版对应技术研判 / 数字疗法洞察研究报告 | |
| 3 | MoNER:一种新的基于远程监督的面向医疗的命名实体识别方法 研究性论文书写 | |
| 4 | 研究性论文投稿 / 综述修改 / 命名实体识别接口封装与接口文档设计 / 词库更新 / 邹煌师兄工作对接 / 中南大学暑期的相关科研计划清单 | |
| 7 | 1 | 分词所需要的词库更新 / 针对科研分析平台的思考 / 预问诊接口更新 / 中南大学暑期夏令营合作计划 / 疾病预测之前的研究情况汇总 / 医学信息所可合作论文方向 |
| 2 | 清华大学&中南大学暑期夏令营医工交叉项目介绍 | |
| 3 | 思考科研要积累什么 & 长沙项目要积累什么 / 学术期刊会议调研 / 长沙工作细化 / 实体识别&疾病预测&问诊小程序的部署架构 / 专病知识图谱的研究与进展 / 疾病预测算法调研 | |
| 4 | 对期刊Nature Medicine的具体调研 / 疾病预测工作的细化 / 长沙工作计划 / 专病知识图谱调研 | |
| 5 | 长沙环境部署调试 / 实体识别&疾病预测&问诊小程序等服务的部署架构 / 数据流通过程 / 目前GPU使用情况 / 动态词库更新机制 / 对接过程尚待廓清的其他问题 / 以患者为中心的知识图谱构建研究情况 | |
| 8 | 1 | AI问诊机器人 需求分析/整体架构/具体设计/推进计划 |
| 2 | 命名实体识别模型训练 / 疾病预测模型训练 / 动态词库更新 / 长沙数据了解 | |
| 3 | 湘雅一医院实地测试 / 湘雅二医院实地测试 / 工作交接 | |
| 4 | 暑期团校 / 电子病历数据需求分析 / 研究性论文修改 | |
| 9 | 1 | * 已形成基本工作流程,逐步调整中(比较乱,心不静) * 目标仍然不够明确 新生入学教育 / 研究性论文作者响应 |
| 2 | 上课 / 成果开放周报告 / 期刊调研 / 研究性论文MoNER书写 | |
| 3 | 上课 / 知识图谱综述 | |
| 4 | 上课 / 中国科学院医学信息研究所交流 | |
| 10 | 1 | 知识图谱实验 |
| 2 | 上课 / 研究性论文MoNER二修 | |
| 3 | 上课 / 研究性论文MoNER整体修改计划 | |
| 4 | 上课 / 数据与知识联合驱动的智慧患者管理 | |
| 11 | 1 | 上课 / 研究性论文MoNER三修 / 患者为中心知识图谱综述 |
| 2 | 上课 / 老年肾功能减退临评估及预警-语言处理交流会议 / 预训练语言模型看作知识图谱的研究趋势 | |
| 12 | 1 | 1上半个月:新冠 2.下半个月:忙期末 上课 / 研究性论文MoNER四修 / 数据与知识联合驱动的智慧患者管理2.0 / 嵌套类实体识别实验 |