研究历史

2025年

月份	周次	日期	内容
		9	1. banlan ｜文档整理：v1.0-语音问题集中反馈 2. banlan ｜文档整理：Coaiching1.0 语音技术文档 3. banlan ｜iPhone侧测试：移动端视觉和语音的跑通和性能测试（iphone） 4. 计研五三党团班工作台账未完成工作 1h已投入
2	1	8	1. ✅ dujh22/LLM-DailyDigest ｜修改自动运行脚本的潜在bug 25min 2. ✅ 安装Vscode Insiders 的 Copilot Agent功能 33min 3. ⭕️ 更新个人wiki 4. ❌ o1模型的泛化性评估与研究 5. ❌ 整理微信近日新增工作｜微信即时文档解析
		1:7	1. ✅ 读O1 Replication Journey – Part 2- Surpassing O1-preview through Simple Distillation Big Progress or Bitter Lesson 2. ✅ 读State-of-the-art generalisation research in NLP: A taxonomy and review 3. ⭕️ 参与kaggle竞赛：AI Mathematical Olympiad - Progress Prize 2 4. ✅ 考虑形成较好的记录流 5. dujh22/LLM-DailyDigest ｜优化arxiv完成构建pipeline ✅｜新增每日可以自动执行程序 ✅｜自动新增1.27～2.6arxiv日报 ✅
1	总结		1. o1模型的泛化性评估与研究第一个月 2. 超越人类专家顶尖水平的LLM研究研究方向确定 3. 元评估-诗歌场景算法实现
	5	27:31	o1模型的泛化性评估与研究：文献整理，关键文献阅读
	4	20:26	1. o1模型的泛化性评估与研究：基本复现，研究计划，原始代码整理，文献搜集 2. 如何写一篇论文 3. 超越人类专家顶尖水平的LLM研究回顾元评估和元学习 4. AML-LLM-V1.pdf 写书
	3	13:19	1. aml课程总分合计 2. 元评估工作回顾 3. o1模型的泛化性评估与研究
	2	6:12	1. o1基本实现 2. 元评估-诗歌场景算法实现 3. aml课程大小作品批改
	1	1:5	1. o1基本实现 2. malaymmlu细分评测

2024年

论文标题	投稿期刊
ChatFUV：Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案	IJCAI人工智能
AiMed: Artificial Intelligence large language model for chinese Medicine 面向中文医学的人工智能大语言模型	IJCAI人工智能
NewMed：Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care 大语言模型技术赋能全流程数智医疗	CogSci认知科学
MedRad:一个医学大模型的可靠辅助决策框架	ICML机器学习
Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准	ICML机器学习
Doctor：The Most Reliable Digital Intelligence Healthcare Large Language Model System 最可靠的数智医疗大模型系统	-
OpenMonet：Open Model Orchestration Network 开放模型协作网络	-
MedLib: Research on the construction of a knowledge library for medical large language modeling 面向医学大语言模型的知识库构建研究	-

月份	周次	周总结
12		1. KEG大模型训练营讲师深度学习基础 2. Malay LLM 3. AML课程结课筹备：作业baseline、panel、评分标准与大作业节课、论文场地申请 4. AML书籍编撰
	5	1. 大模型最新研究和技术探讨 2. O1标准程序提供
	4	1. 2024秋季学期系内述职、校内述职 2. AML结课筹备
	3	1. 评估说明 2. O1作业设计 3. AML课程第二次panel组织 4. AML课程评分标准制定
	2	1. 预训练代码解析 2. 数据说明 3. 课程大作业说明PPT
	1	1. KEG大模型训练营讲师深度学习基础 2. Malay LLM：讨论后续工作分工-Internal Progress Notes \|内部进展记录 3. 课程最终大作业相关通知：场地申请、网站维护
11		1. 课程对外网站搭建https://www.aminer.cn/aml2024 2. AML算力平台搭建Computing Platform 教程 Tutorial 3. Meta Evaluation: Use LLM to evaluate the LLM evaluator 元评估：用LLM来评估LLM评估器 4. 立项申请-诗歌等艺术性文本的评测平台
	5	1. 古诗评测GLM写诗立项申请-诗歌等艺术性文本的评测平台 2. Meta Evaluation 3. 课程对外的网站 4. 准备写大模型书 5. Malay LLM 6. 校级惠妍英才奖学金(二等)奖学金 7. KEG大模型训练营讲师
	4	1. Meta Evaluation: Use LLM to evaluate the LLM evaluator 元评估：用LLM来评估LLM评估器 2. 暑期必修实践获得金奖
	3	1. 课程对外网站搭建https://www.aminer.cn/aml2024 2. AML算力平台搭建Computing Platform 教程 Tutorial
	2	1. Openreview互评 2. 学习：DPO、PPO、easyRL、cursor、RL+Agent
	1	1. Chat课件制作Decoding & Decoding Acceleration 2. Self-Play课件制作Self-Learning

1-10月份数据未同步，得空同步～～～

2023年

序	任务	任务详述
1	模型选择	分开单独链接
2	知识库外挂	相似患者第一批：预处理2万条电子病历数据：从SQL导出为格式化json
3	知识库统计	AiMed现行数据
4	知识库外挂	指南
5	系实践述职	材料准备
6	CSE论文report	KrNER：PPT
7	CSE论文report	PoKG：PPT
8	系实践述职	现场述职
9	AiMed1.0发布：版权	版权问题
10	CSE论文report	KrNER：对应讲稿准备，外加视频录制
11	CSE论文report	PoKG：对应讲稿准备，外加视频录制
12	AiMed1.0发布：服务	敏感信息过滤
13	CSE论文report	参会做现场汇报
14	多模型链条	相关研究调研
15	高级机器学习	HW1-Tokenization及压缩率比较-共计5篇论文/5个实验
16	AiMed1.0发布	AiMed1.0项目开源
17	AiMed1.0发布	AiMed1.0-chat参数发布
18	AiMed1.0发布	AiMed1.0-paperabs参数发布
19	AiMed1.0发布	AiMed1.0-前端对接
20	AiMed1.0发布	AiMed1.0-后端对接
21	AiMed1.0发布：参数	我们可以发布一个基本的AiMed走完全程的模型参数AiMed-Base
22	中国马克思主义与当代	选题确定
23	社工	软件合办智源活动
24	AiMed1.0发布	对接医信所工作
25	LLM调研
26	AiMed2.0	数据准备
27	LLM	相关调研
28	高级机器学习	Project proposal
29	高级机器学习	项目提案
30	AiMed2.0训练	AiMed2.0-Chat对话模型训练-第一轮
31	AiMed2.0训练	AiMed2.0-Chat对话模型训练-第一轮-相关测试
32	高级机器学习	项目提案PPT
33	中国马克思主义与当代	PPT
34	专利	邱师兄专利修改
35	高级机器学习	项目提案PPT
36	中国马克思主义与当代	PPT
37	专利	邱师兄专利修改
38	高级机器学习	Project proposal PPT
39	高级机器学习	项目提案PPT
40	高级机器学习	Project proposal PPT对应讲稿
41	医信所汇报PPT
42	高级机器学习	项目提案PPT对应讲稿
43	高级机器学习	项目讨论
44	张瑞麟师兄	软件学报材料准备
45	高级机器学习	准备小组讨论
46	AiMed接口优化	敏感信息
47	Doctor1.0部署	模型部署到长沙机房
48	LLM	相关调研
49	张瑞麟师兄	软件学报材料准备
50	高级机器学习	项目讨论
51	Doctor	完成指南库和病历库的相关开发
52	AiMed1.0发布：服务	相似患者第二批：预处理6万条电子病历数据：从SQL导出为格式化json
53	工程库与检索	药品说明书、检验、指南库
54	处理长沙文档	切换到长沙权限才可访问
55	高级机器学习	第二次作业：RLHF在多模态领域的应用
56	Med-eval	制定整体推进计划
57	Med-eval	相关同事分工推进
58	高级机器学习	poster
59	高级机器学习	PPT
60	Med-eval	制定整体推进计划
61	Med-eval	相关同事分工推进
62	Med-eval	数据集的构建：3个数据集
63	Med-eval	以及点对点和各位同学的分工
64	Med-eval	RAG相关整理
65	高级机器学习	第三次作业：RAG
66	区块链	大作业
67	高级机器学习	MedRed：论文维护位置
68	AiMed1.0	AiMed: 面向中文医学的人工智能大语言模型
69	ChatFUV1.0	ChatFUV：Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案
70	NewMed1.0	NewMed：Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care
71	Med-Eval1.0	Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准
72	MedRad1.0	MedRed：论文维护位置
73	联邦学习论文	软件学报材料邮寄

2022年

月份	周次	内容
1	1	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》开题答辩
	2	个人 WIKI 搭建 / BERT实验 / 综述修改
	3	中文医疗信息处理挑战榜CBLUE打榜 / 综述修改
2	1	中文医疗信息处理挑战榜CBLUE2打榜 / 综述修改
	2	国外BioNLP测评基准调研 / 国内推进中文医疗信息处理的相关会议赛事调研 / 医疗数据来源调研 / 综述修改 / 实验
	3	综述理论性调研分析 / 实验
3	1	精读2篇论文
	2	精读16篇论文
	3	综述完稿 / 区块链重点研发指标解析调研
	4	区块链重点研发指标解析调研2 / 实验
4	1	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》中期答辩
	2	CCKS会议解析 / EMNLP会议解析
	3	EMNLP细致调研 / 中国医学科学院医学信息研究所会议总结 / 综述 / 实验
	4	综述定稿 / 区块链重点研发指标补充调研
5	1	研究性论文初稿 / 医疗知识图谱调研 / 实验室主页调研与设计
	2	实验室细节页调研与设计 / 毕业设计
	3	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》论文定稿
	4	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》PPT
6	1	本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》结题一次院系答辩、二次校级答辩 / 嵌套命名实体识别研究
	2	慢性肾病全病程服务系统BRD文档1.0版对应技术研判 / 数字疗法洞察研究报告
	3	MoNER:一种新的基于远程监督的面向医疗的命名实体识别方法研究性论文书写
	4	研究性论文投稿 / 综述修改 / 命名实体识别接口封装与接口文档设计 / 词库更新 / 邹煌师兄工作对接 / 中南大学暑期的相关科研计划清单
7	1	分词所需要的词库更新 / 针对科研分析平台的思考 / 预问诊接口更新 / 中南大学暑期夏令营合作计划 / 疾病预测之前的研究情况汇总 / 医学信息所可合作论文方向
	2	清华大学&中南大学暑期夏令营医工交叉项目介绍
	3	思考科研要积累什么 & 长沙项目要积累什么 / 学术期刊会议调研 / 长沙工作细化 / 实体识别&疾病预测&问诊小程序的部署架构 / 专病知识图谱的研究与进展 / 疾病预测算法调研
	4	对期刊Nature Medicine的具体调研 / 疾病预测工作的细化 / 长沙工作计划 / 专病知识图谱调研
	5	长沙环境部署调试 / 实体识别&疾病预测&问诊小程序等服务的部署架构 / 数据流通过程 / 目前GPU使用情况 / 动态词库更新机制 / 对接过程尚待廓清的其他问题 / 以患者为中心的知识图谱构建研究情况
8	1	AI问诊机器人需求分析/整体架构/具体设计/推进计划
	2	命名实体识别模型训练 / 疾病预测模型训练 / 动态词库更新 / 长沙数据了解
	3	湘雅一医院实地测试 / 湘雅二医院实地测试 / 工作交接
	4	暑期团校 / 电子病历数据需求分析 / 研究性论文修改
9	1	* 已形成基本工作流程，逐步调整中（比较乱，心不静） * 目标仍然不够明确新生入学教育 / 研究性论文作者响应
	2	上课 / 成果开放周报告 / 期刊调研 / 研究性论文MoNER书写
	3	上课 / 知识图谱综述
	4	上课 / 中国科学院医学信息研究所交流
10	1	知识图谱实验
	2	上课 / 研究性论文MoNER二修
	3	上课 / 研究性论文MoNER整体修改计划
	4	上课 / 数据与知识联合驱动的智慧患者管理
11	1	上课 / 研究性论文MoNER三修 / 患者为中心知识图谱综述
	2	上课 / 老年肾功能减退临评估及预警-语言处理交流会议 / 预训练语言模型看作知识图谱的研究趋势
12	1	1上半个月：新冠 2.下半个月：忙期末上课 / 研究性论文MoNER四修 / 数据与知识联合驱动的智慧患者管理2.0 / 嵌套类实体识别实验