研究历史

2026年博四

月份	内容
1	1.Logic完成ICML 转投 2.LRM完成整体算法设计和基本工程规划，论文初稿形成 3.项目/申报：国自科（循证医学 + LLM 协同决策）方向材料

2025年博三

博士三年级，研究主线：超越人类专家顶尖水平的 LLM 研究，聚焦大模型逻辑推理能力提升
核心工作：Logic 项目（数据构造 14 万+、训练 47+ SFT/CPT 模型）、benchmark 建设、元评估（诗歌等艺术性场景）、类 o1 模型泛化性评估
论文投稿：Logic 工作 ARR→ICLR→ICML 在投；另合作 1 篇、在研 1 篇；疾病因果关系发现（SCI 二区）定稿；AI4Sports EDMIT 论文；综述撰写推进
荣誉：清华大学健美比赛第五名、博士生学术论坛第一名（oral + poster）
其他：腾讯青云奖学金申请、开题准备、雁行计划「大模型驱动数字中国建设」项目实施（报告 1.1 万字）

月份	内容
12	1. LRM文献调研 2. ICML投稿准备 3. 健美比赛第五名
11	1. Logic修改；2. 综述；3.算法研究；3. 开题准备 1. 腾讯青云奖学金申请 2. Logic训练 3. 论文ICLR出分 ICLR审稿意见，Logic补充实验
10	1. ICLR2026投稿+ICLR审稿 2. 开源SFT+RL方法复现与使用评测与数据合成实验设计训练实验结果 3. poster与oral准备：博硕学术论坛第一名
9	Logic工作投ICLR：补实验 / 打磨论文稿件
8	1. Logic：论文修改 2. 综述：大纲；论文收集 3. 其他论文：AI4Sports类文章《EDMIT：An End-to-End Agentic Framework for Enhanced Decision-Making in Interactive Motion Tutoring 》头脑风暴：dLLM 扩散语言模型Universal Model 通用大模型论文定稿：Towards Artificial Intelligence for Science: A Case Study of Using ChatGPT for Disease Causality Discovery from Biomedical Literature （SCI二区） 4. 其他：党建论文；雁行计划：数实融合新引擎·智创产业新未来——大模型驱动数字中国建设项目实施，报告1.1W字+外宣
7	1. benchmark工作初步结束
6	1. 梳理了整体论文写作思路，大体完成论文核心部分的初稿 2. 代码开发初步完成核心功能 3. 收集10个元数据
5	1. 【科研】benchmark写代码、论文草稿 2. 【论文】迈向科学的人工智能：使用 ChatGPT 进行疾病因果关系发现的案例研究-审稿意见思考
4	1. 逻辑推理训练28个SFT模型、2个CPT模型 2. 修改1篇论文 3. 构造数据14W 4. 2篇文章初步构造框架
3	1. 基座逻辑推理能力提升：模型训练 47个模型
2	1. 基座逻辑推理能力提升项目启动 2. 调研 3. 基本数据构造 4. 基本训练尝试
1	1. 类o1模型的泛化性评估与研究第一个月 2. 超越人类专家顶尖水平的LLM研究研究方向确定 3. 元评估-诗歌场景算法实现

2024年博二

博士二年级，导师唐杰，在智谱AI实习，担任AML&ML课程助教、KEG大模型训练营讲师（深度学习基础）
核心研究：ChatGLM数学推理（PRM、RLHF全流程）、多模态数学推理、MalayGLM国际化、ChatGLM中英混杂问题、元评估（诗歌等艺术性文本评测）
论文与成果：6篇投稿（IJCAI、CogSci、ICML等）；2篇发表（联邦学习、医学知识库）；AiMed软件著作权；担任两个论文会议场地主编
荣誉：挑战杯首都大学生创业计划竞赛金奖（北京市一等）、国三等奖；社会实践金奖（全校第二）；优秀共青团员、计算机系优秀学生干部；公安机关外聘专家；2封市级政府感谢信
奖学金：社会实践奖学金、校级惠妍英才奖学金（二等）
社工：计算机系党支部书记、带班助理，负责学校团委公共系统「同行」平台
应用落地：公安系统、医疗系统、LLMDailyDigest 网站、AML课程对外网站（aminer.cn/aml2024）

论文标题	投稿期刊
ChatFUV：Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案	IJCAI人工智能
AiMed: Artificial Intelligence large language model for chinese Medicine 面向中文医学的人工智能大语言模型	IJCAI人工智能
NewMed：Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care 大语言模型技术赋能全流程数智医疗	CogSci认知科学
MedRad:一个医学大模型的可靠辅助决策框架	ICML机器学习
Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准	ICML机器学习
Doctor：The Most Reliable Digital Intelligence Healthcare Large Language Model System 最可靠的数智医疗大模型系统	-
OpenMonet：Open Model Orchestration Network 开放模型协作网络	-
MedLib: Research on the construction of a knowledge library for medical large language modeling 面向医学大语言模型的知识库构建研究	-

月份	月总结
12	KEG大模型训练营讲师-深度度学习基础 Malay LLM AML课程结课筹备：作业baseline、panel、评分标准与大作业节课、论文场地申请AML书籍编撰
11	课程对外网站搭建https://www.aminer.cn/aml2024 AML算力平台搭建 Computing Platform 教程 Tutorial Meta Evaluation: Use LLM to evaluate the LLM evaluator 元评估：用LLM来评估LLM评估器立项申请-诗歌等艺术性文本的评测平台
10	Reinforcement Learning Survey、Self-Learning：Evaluation& Data & New Scaling Law课件制作 Post_Training_Scaling_Laws_Survey综述改修
9	Enhancing Mathematical Reasoning in Multimodal Large Language Models 提升多模态大型语言模型的数学推理能力
8	社会实践总结math文献调研
7	chatglm数学推理\|项目进展-month4：math2-prm evaluation fix暑期博士生必修实践项目
6	chatglm数学推理\|项目进展-month3：模型\|PPO Training 训练RLHF模型模型检验\|PRM]
5	chatglm数学推理\|项目进展-month2：模型\|PRM Inference 采用过程奖励模型进行基本推理模型\|PRM Training 训练过程奖励模型模型\|PRM Evaluation 对过程奖励模型进行评估
4	chatglm数学推理\|项目进展-month1：数据构造\|自动化逐步标注人类反馈算法\|前向自动标注与后向评分反馈结合进行计算过程奖励
3	1.chatglm国际化 2.中英混杂问题处理
2	个人材料准备
1	论文投稿*6

2023年博一

研究重心聚焦医学大模型与知识工程
核心成果：AiMed 1.0 开源发布、Doctor 1.0 部署上线、Med-Eval 测评基准建设启动
论文方向：AiMed、ChatFUV、NewMed、Med-Eval、MedRad 等多篇医疗大模型相关工作推进
课程：高级机器学习（RLHF、RAG 等作业与项目）、CSE 论文汇报（KrNER、PoKG）、中国马克思主义与当代
数据建设：预处理 8 万条电子病历数据、构建指南库与病历库、药品说明书与检验知识库
其他：系实践述职、智源活动、软件学报材料、联邦学习论文等

序	任务	任务详述
1	模型选择	分开单独链接
2	知识库外挂	相似患者第一批：预处理2万条电子病历数据：从SQL导出为格式化json
3	知识库统计	AiMed现行数据
4	知识库外挂	指南
5	系实践述职	材料准备
6	CSE论文report	KrNER：PPT
7	CSE论文report	PoKG：PPT
8	系实践述职	现场述职
9	AiMed1.0发布：版权	版权问题
10	CSE论文report	KrNER：对应讲稿准备，外加视频录制
11	CSE论文report	PoKG：对应讲稿准备，外加视频录制
12	AiMed1.0发布：服务	敏感信息过滤
13	CSE论文report	参会做现场汇报
14	多模型链条	相关研究调研
15	高级机器学习	HW1-Tokenization及压缩率比较-共计5篇论文/5个实验
16	AiMed1.0发布	AiMed1.0项目开源
17	AiMed1.0发布	AiMed1.0-chat参数发布
18	AiMed1.0发布	AiMed1.0-paperabs参数发布
19	AiMed1.0发布	AiMed1.0-前端对接
20	AiMed1.0发布	AiMed1.0-后端对接
21	AiMed1.0发布：参数	我们可以发布一个基本的AiMed走完全程的模型参数AiMed-Base
22	中国马克思主义与当代	选题确定
23	社工	软件合办智源活动
24	AiMed1.0发布	对接医信所工作
25	LLM调研
26	AiMed2.0	数据准备
27	LLM	相关调研
28	高级机器学习	Project proposal
29	高级机器学习	项目提案
30	AiMed2.0训练	AiMed2.0-Chat对话模型训练-第一轮
31	AiMed2.0训练	AiMed2.0-Chat对话模型训练-第一轮-相关测试
32	高级机器学习	项目提案PPT
33	中国马克思主义与当代	PPT
34	专利	邱师兄专利修改
35	高级机器学习	项目提案PPT
36	中国马克思主义与当代	PPT
37	专利	邱师兄专利修改
38	高级机器学习	Project proposal PPT
39	高级机器学习	项目提案PPT
40	高级机器学习	Project proposal PPT对应讲稿
41	医信所汇报PPT
42	高级机器学习	项目提案PPT对应讲稿
43	高级机器学习	项目讨论
44	张瑞麟师兄	软件学报材料准备
45	高级机器学习	准备小组讨论
46	AiMed接口优化	敏感信息
47	Doctor1.0部署	模型部署到长沙机房
48	LLM	相关调研
49	张瑞麟师兄	软件学报材料准备
50	高级机器学习	项目讨论
51	Doctor	完成指南库和病历库的相关开发
52	AiMed1.0发布：服务	相似患者第二批：预处理6万条电子病历数据：从SQL导出为格式化json
53	工程库与检索	药品说明书、检验、指南库
54	处理长沙文档	切换到长沙权限才可访问
55	高级机器学习	第二次作业：RLHF在多模态领域的应用
56	Med-eval	制定整体推进计划
57	Med-eval	相关同事分工推进
58	高级机器学习	poster
59	高级机器学习	PPT
60	Med-eval	制定整体推进计划
61	Med-eval	相关同事分工推进
62	Med-eval	数据集的构建：3个数据集
63	Med-eval	以及点对点和各位同学的分工
64	Med-eval	RAG相关整理
65	高级机器学习	第三次作业：RAG
66	区块链	大作业
67	高级机器学习	MedRed：论文维护位置
68	AiMed1.0	AiMed: 面向中文医学的人工智能大语言模型
69	ChatFUV1.0	ChatFUV：Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案
70	NewMed1.0	NewMed：Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care
71	Med-Eval1.0	Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准
72	MedRad1.0	MedRed：论文维护位置
73	联邦学习论文	软件学报材料邮寄

2022年博零

本科毕业 + 博士入学：完成本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》（院系、校级答辩），9 月进入清华大学计算机系攻读博士学位
科研论文：MoNER（面向医疗的命名实体识别）研究性论文投稿与多轮修改，综述完稿
竞赛与调研：CBLUE/CBLUE2 打榜，BioNLP 测评基准调研，CCKS/EMNLP 会议解析，区块链重点研发指标调研
暑期实践：清华大学 & 中南大学医工交叉夏令营，长沙项目（AI 问诊机器人、实体识别、疾病预测、湘雅医院实地测试）
博士阶段初探：知识图谱综述、以患者为中心的知识图谱、数据与知识联合驱动的智慧患者管理
其他：个人 WIKI 搭建，与中国医学科学院/中国科学院医学信息研究所交流

月份	周次	内容
1	1	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》开题答辩
	2	个人 WIKI 搭建 / BERT实验 / 综述修改
	3	中文医疗信息处理挑战榜CBLUE打榜 / 综述修改
2	1	中文医疗信息处理挑战榜CBLUE2打榜 / 综述修改
	2	国外BioNLP测评基准调研 / 国内推进中文医疗信息处理的相关会议赛事调研 / 医疗数据来源调研 / 综述修改 / 实验
	3	综述理论性调研分析 / 实验
3	1	精读2篇论文
	2	精读16篇论文
	3	综述完稿 / 区块链重点研发指标解析调研
	4	区块链重点研发指标解析调研2 / 实验
4	1	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》中期答辩
	2	CCKS会议解析 / EMNLP会议解析
	3	EMNLP细致调研 / 中国医学科学院医学信息研究所会议总结 / 综述 / 实验
	4	综述定稿 / 区块链重点研发指标补充调研
5	1	研究性论文初稿 / 医疗知识图谱调研 / 实验室主页调研与设计
	2	实验室细节页调研与设计 / 毕业设计
	3	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》论文定稿
	4	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》PPT
6	1	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》结题一次院系答辩、二次校级答辩 / 嵌套命名实体识别研究
	2	慢性肾病全病程服务系统BRD文档1.0版对应技术研判 / 数字疗法洞察研究报告
	3	MoNER:一种新的基于远程监督的面向医疗的命名实体识别方法研究性论文书写
	4	研究性论文投稿 / 综述修改 / 命名实体识别接口封装与接口文档设计 / 词库更新 / 邹煌师兄工作对接 / 中南大学暑期的相关科研计划清单
7	1	分词所需要的词库更新 / 针对科研分析平台的思考 / 预问诊接口更新 / 中南大学暑期夏令营合作计划 / 疾病预测之前的研究情况汇总 / 医学信息所可合作论文方向
	2	清华大学&中南大学暑期夏令营医工交叉项目介绍
	3	思考科研要积累什么 & 长沙项目要积累什么 / 学术期刊会议调研 / 长沙工作细化 / 实体识别&疾病预测&问诊小程序的部署架构 / 专病知识图谱的研究与进展 / 疾病预测算法调研
	4	对期刊Nature Medicine的具体调研 / 疾病预测工作的细化 / 长沙工作计划 / 专病知识图谱调研
	5	长沙环境部署调试 / 实体识别&疾病预测&问诊小程序等服务的部署架构 / 数据流通过程 / 目前GPU使用情况 / 动态词库更新机制 / 对接过程尚待廓清的其他问题 / 以患者为中心的知识图谱构建研究情况
8	1	AI问诊机器人需求分析/整体架构/具体设计/推进计划
	2	命名实体识别模型训练 / 疾病预测模型训练 / 动态词库更新 / 长沙数据了解
	3	湘雅一医院实地测试 / 湘雅二医院实地测试 / 工作交接
	4	暑期团校 / 电子病历数据需求分析 / 研究性论文修改
9	1	* 已形成基本工作流程，逐步调整中（比较乱，心不静） * 目标仍然不够明确新生入学教育 / 研究性论文作者响应
	2	上课 / 成果开放周报告 / 期刊调研 / 研究性论文MoNER书写
	3	上课 / 知识图谱综述
	4	上课 / 中国科学院医学信息研究所交流
10	1	知识图谱实验
	2	上课 / 研究性论文MoNER二修
	3	上课 / 研究性论文MoNER整体修改计划
	4	上课 / 数据与知识联合驱动的智慧患者管理
11	1	上课 / 研究性论文MoNER三修 / 患者为中心知识图谱综述
	2	上课 / 老年肾功能减退临评估及预警-语言处理交流会议 / 预训练语言模型看作知识图谱的研究趋势
12	1	1上半个月：新冠 2.下半个月：忙期末上课 / 研究性论文MoNER四修 / 数据与知识联合驱动的智慧患者管理2.0 / 嵌套类实体识别实验

研究历史

2026年 博四

2025年 博三

2024年 博二

2023年 博一

2022年 博零

2026年博四

2025年博三

2024年博二

2023年博一

2022年博零