研究历史
2025年
月份 | 周次 | 日期 | 内容 |
---|---|---|---|
9 | 1. banlan |文档整理 :v1.0-语音问题集中反馈 2. banlan |文档整理 :Coaiching1.0 语音技术文档 3. banlan |iPhone侧测试:移动端视觉和语音的跑通和性能测试(iphone) 4. 计研五三党团班工作台账未完成工作 1h已投入 |
||
2 | 1 | 8 | 1. ✅ dujh22/LLM-DailyDigest |修改自动运行脚本的潜在bug 25min 2. ✅ 安装Vscode Insiders 的 Copilot Agent功能 33min 3. ⭕️ 更新个人wiki 4. ❌ o1模型的泛化性评估与研究 5. ❌ 整理微信近日新增工作 | 微信即时文档解析 |
1:7 | 1. ✅ 读O1 Replication Journey – Part 2- Surpassing O1-preview through Simple Distillation Big Progress or Bitter Lesson 2. ✅ 读State-of-the-art generalisation research in NLP: A taxonomy and review 3. ⭕️ 参与kaggle竞赛:AI Mathematical Olympiad - Progress Prize 2 4. ✅ 考虑形成较好的记录流 5. dujh22/LLM-DailyDigest | 优化arxiv完成构建pipeline ✅| 新增每日可以自动执行程序 ✅| 自动新增1.27~2.6arxiv日报 ✅ |
||
1 | 总结 | 1. o1模型的泛化性评估与研究 第一个月 2. 超越人类专家顶尖水平的LLM研究 研究方向确定 3. 元评估-诗歌场景算法实现 |
|
5 | 27:31 | o1模型的泛化性评估与研究:文献整理,关键文献阅读 | |
4 | 20:26 | 1. o1模型的泛化性评估与研究:基本复现,研究计划,原始代码整理,文献搜集 2. 如何写一篇论文 3. 超越人类专家顶尖水平的LLM研究 回顾元评估和元学习 4. AML-LLM-V1.pdf 写书 |
|
3 | 13:19 | 1. aml课程总分合计 2. 元评估工作回顾 3. o1模型的泛化性评估与研究 |
|
2 | 6:12 | 1. o1基本实现 2. 元评估-诗歌场景算法实现 3. aml课程大小作品批改 |
|
1 | 1:5 | 1. o1基本实现 2. malaymmlu细分评测 |
2024年
论文标题 | 投稿期刊 |
---|---|
ChatFUV:Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案 | IJCAI人工智能 |
AiMed: Artificial Intelligence large language model for chinese Medicine 面向中文医学的人工智能大语言模型 | IJCAI人工智能 |
NewMed:Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care 大语言模型技术赋能全流程数智医疗 | CogSci认知科学 |
MedRad:一个医学大模型的可靠辅助决策框架 | ICML机器学习 |
Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准 | ICML机器学习 |
Doctor:The Most Reliable Digital Intelligence Healthcare Large Language Model System 最可靠的数智医疗大模型系统 | - |
OpenMonet:Open Model Orchestration Network 开放模型协作网络 | - |
MedLib: Research on the construction of a knowledge library for medical large language modeling 面向医学大语言模型的知识库构建研究 | - |
月份 | 周次 | 周总结 |
---|---|---|
12 | 1. KEG大模型训练营讲师深度学习基础 2. Malay LLM 3. AML课程结课筹备:作业baseline、panel、评分标准与大作业节课、论文场地申请 4. AML书籍编撰 |
|
5 | 1. 大模型最新研究和技术探讨 2. O1标准程序提供 |
|
4 | 1. 2024秋季学期系内述职、校内述职 2. AML结课筹备 |
|
3 | 1. 评估说明 2. O1作业设计 3. AML课程第二次panel组织 4. AML课程评分标准制定 |
|
2 | 1. 预训练代码解析 2. 数据说明 3. 课程大作业说明PPT |
|
1 | 1. KEG大模型训练营讲师深度学习基础 2. Malay LLM:讨论后续工作分工-Internal Progress Notes |内部进展记录 3. 课程最终大作业相关通知:场地申请、网站维护 |
|
11 | 1. 课程对外网站搭建https://www.aminer.cn/aml2024 2. AML算力平台搭建Computing Platform 教程 Tutorial 3. Meta Evaluation: Use LLM to evaluate the LLM evaluator 元评估:用LLM来评估LLM评估器 4. 立项申请-诗歌等艺术性文本的评测平台 |
|
5 | 1. 古诗评测GLM写诗 立项申请-诗歌等艺术性文本的评测平台 2. Meta Evaluation 3. 课程对外的网站 4. 准备写大模型书 5. Malay LLM 6. 校级惠妍英才奖学金(二等)奖学金 7. KEG大模型训练营讲师 |
|
4 | 1. Meta Evaluation: Use LLM to evaluate the LLM evaluator 元评估:用LLM来评估LLM评估器 2. 暑期必修实践获得金奖 |
|
3 | 1. 课程对外网站搭建https://www.aminer.cn/aml2024 2. AML算力平台搭建Computing Platform 教程 Tutorial |
|
2 | 1. Openreview互评 2. 学习:DPO、PPO、easyRL、cursor、RL+Agent |
|
1 | 1. Chat课件制作Decoding & Decoding Acceleration 2. Self-Play课件制作Self-Learning |
1-10月份数据未同步,得空同步~~~
2023年
序 | 任务 | 任务详述 |
---|---|---|
1 | 模型选择 | 分开单独链接 |
2 | 知识库外挂 | 相似患者第一批:预处理2万条电子病历数据:从SQL导出为格式化json |
3 | 知识库统计 | AiMed现行数据 |
4 | 知识库外挂 | 指南 |
5 | 系实践述职 | 材料准备 |
6 | CSE论文report | KrNER:PPT |
7 | CSE论文report | PoKG:PPT |
8 | 系实践述职 | 现场述职 |
9 | AiMed1.0发布:版权 | 版权问题 |
10 | CSE论文report | KrNER:对应讲稿准备,外加视频录制 |
11 | CSE论文report | PoKG:对应讲稿准备,外加视频录制 |
12 | AiMed1.0发布:服务 | 敏感信息过滤 |
13 | CSE论文report | 参会做现场汇报 |
14 | 多模型链条 | 相关研究调研 |
15 | 高级机器学习 | HW1-Tokenization及压缩率比较-共计5篇论文/5个实验 |
16 | AiMed1.0发布 | AiMed1.0项目开源 |
17 | AiMed1.0发布 | AiMed1.0-chat参数发布 |
18 | AiMed1.0发布 | AiMed1.0-paperabs参数发布 |
19 | AiMed1.0发布 | AiMed1.0-前端对接 |
20 | AiMed1.0发布 | AiMed1.0-后端对接 |
21 | AiMed1.0发布:参数 | 我们可以发布一个基本的AiMed走完全程的模型参数AiMed-Base |
22 | 中国马克思主义与当代 | 选题确定 |
23 | 社工 | 软件合办智源活动 |
24 | AiMed1.0发布 | 对接医信所工作 |
25 | LLM调研 | |
26 | AiMed2.0 | 数据准备 |
27 | LLM | 相关调研 |
28 | 高级机器学习 | Project proposal |
29 | 高级机器学习 | 项目提案 |
30 | AiMed2.0训练 | AiMed2.0-Chat对话模型训练-第一轮 |
31 | AiMed2.0训练 | AiMed2.0-Chat对话模型训练-第一轮-相关测试 |
32 | 高级机器学习 | 项目提案PPT |
33 | 中国马克思主义与当代 | PPT |
34 | 专利 | 邱师兄专利修改 |
35 | 高级机器学习 | 项目提案PPT |
36 | 中国马克思主义与当代 | PPT |
37 | 专利 | 邱师兄专利修改 |
38 | 高级机器学习 | Project proposal PPT |
39 | 高级机器学习 | 项目提案PPT |
40 | 高级机器学习 | Project proposal PPT对应讲稿 |
41 | 医信所汇报PPT | |
42 | 高级机器学习 | 项目提案PPT对应讲稿 |
43 | 高级机器学习 | 项目讨论 |
44 | 张瑞麟师兄 | 软件学报材料准备 |
45 | 高级机器学习 | 准备小组讨论 |
46 | AiMed接口优化 | 敏感信息 |
47 | Doctor1.0部署 | 模型部署到长沙机房 |
48 | LLM | 相关调研 |
49 | 张瑞麟师兄 | 软件学报材料准备 |
50 | 高级机器学习 | 项目讨论 |
51 | Doctor | 完成指南库和病历库的相关开发 |
52 | AiMed1.0发布:服务 | 相似患者第二批:预处理6万条电子病历数据:从SQL导出为格式化json |
53 | 工程库与检索 | 药品说明书、检验、指南库 |
54 | 处理长沙文档 | 切换到长沙权限才可访问 |
55 | 高级机器学习 | 第二次作业:RLHF在多模态领域的应用 |
56 | Med-eval | 制定整体推进计划 |
57 | Med-eval | 相关同事分工推进 |
58 | 高级机器学习 | poster |
59 | 高级机器学习 | PPT |
60 | Med-eval | 制定整体推进计划 |
61 | Med-eval | 相关同事分工推进 |
62 | Med-eval | 数据集的构建:3个数据集 |
63 | Med-eval | 以及点对点和各位同学的分工 |
64 | Med-eval | RAG相关整理 |
65 | 高级机器学习 | 第三次作业:RAG |
66 | 区块链 | 大作业 |
67 | 高级机器学习 | MedRed:论文维护位置 |
68 | AiMed1.0 | AiMed: 面向中文医学的人工智能大语言模型 |
69 | ChatFUV1.0 | ChatFUV:Chat Chain for Follow-Up Visit 用聊天链开发个性化随访方案 |
70 | NewMed1.0 | NewMed:Large Language Modeling Technology Enables Full Process Digital Intelligence in Medical Care |
71 | Med-Eval1.0 | Med-Eval: Benchmarks for the Medical Large Language Model 医疗大语言模型测评基准 |
72 | MedRad1.0 | MedRed:论文维护位置 |
73 | 联邦学习论文 | 软件学报材料邮寄 |
2022年
月份 | 周次 | 内容 |
---|---|---|
1 | 1 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》开题答辩 |
2 | 个人 WIKI 搭建 / BERT实验 / 综述修改 | |
3 | 中文医疗信息处理挑战榜CBLUE打榜 / 综述修改 | |
2 | 1 | 中文医疗信息处理挑战榜CBLUE2打榜 / 综述修改 |
2 | 国外BioNLP测评基准调研 / 国内推进中文医疗信息处理的相关会议赛事调研 / 医疗数据来源调研 / 综述修改 / 实验 | |
3 | 综述理论性调研分析 / 实验 | |
3 | 1 | 精读2篇论文 |
2 | 精读16篇论文 | |
3 | 综述完稿 / 区块链重点研发指标解析调研 | |
4 | 区块链重点研发指标解析调研2 / 实验 | |
4 | 1 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》中期答辩 |
2 | CCKS会议解析 / EMNLP会议解析 | |
3 | EMNLP细致调研 / 中国医学科学院医学信息研究所会议总结 / 综述 / 实验 | |
4 | 综述定稿 / 区块链重点研发指标补充调研 | |
5 | 1 | 研究性论文初稿 / 医疗知识图谱调研 / 实验室主页调研与设计 |
2 | 实验室细节页调研与设计 / 毕业设计 | |
3 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》论文定稿 | |
4 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》PPT | |
6 | 1 | 本科毕业设计《面向中文电子病历命名实体识别的深度学习模型研究》结题一次院系答辩、二次校级答辩 / 嵌套命名实体识别研究 |
2 | 慢性肾病全病程服务系统BRD文档1.0版对应技术研判 / 数字疗法洞察研究报告 | |
3 | MoNER:一种新的基于远程监督的面向医疗的命名实体识别方法 研究性论文书写 | |
4 | 研究性论文投稿 / 综述修改 / 命名实体识别接口封装与接口文档设计 / 词库更新 / 邹煌师兄工作对接 / 中南大学暑期的相关科研计划清单 | |
7 | 1 | 分词所需要的词库更新 / 针对科研分析平台的思考 / 预问诊接口更新 / 中南大学暑期夏令营合作计划 / 疾病预测之前的研究情况汇总 / 医学信息所可合作论文方向 |
2 | 清华大学&中南大学暑期夏令营医工交叉项目介绍 | |
3 | 思考科研要积累什么 & 长沙项目要积累什么 / 学术期刊会议调研 / 长沙工作细化 / 实体识别&疾病预测&问诊小程序的部署架构 / 专病知识图谱的研究与进展 / 疾病预测算法调研 | |
4 | 对期刊Nature Medicine的具体调研 / 疾病预测工作的细化 / 长沙工作计划 / 专病知识图谱调研 | |
5 | 长沙环境部署调试 / 实体识别&疾病预测&问诊小程序等服务的部署架构 / 数据流通过程 / 目前GPU使用情况 / 动态词库更新机制 / 对接过程尚待廓清的其他问题 / 以患者为中心的知识图谱构建研究情况 | |
8 | 1 | AI问诊机器人 需求分析/整体架构/具体设计/推进计划 |
2 | 命名实体识别模型训练 / 疾病预测模型训练 / 动态词库更新 / 长沙数据了解 | |
3 | 湘雅一医院实地测试 / 湘雅二医院实地测试 / 工作交接 | |
4 | 暑期团校 / 电子病历数据需求分析 / 研究性论文修改 | |
9 | 1 | * 已形成基本工作流程,逐步调整中(比较乱,心不静) * 目标仍然不够明确 新生入学教育 / 研究性论文作者响应 |
2 | 上课 / 成果开放周报告 / 期刊调研 / 研究性论文MoNER书写 | |
3 | 上课 / 知识图谱综述 | |
4 | 上课 / 中国科学院医学信息研究所交流 | |
10 | 1 | 知识图谱实验 |
2 | 上课 / 研究性论文MoNER二修 | |
3 | 上课 / 研究性论文MoNER整体修改计划 | |
4 | 上课 / 数据与知识联合驱动的智慧患者管理 | |
11 | 1 | 上课 / 研究性论文MoNER三修 / 患者为中心知识图谱综述 |
2 | 上课 / 老年肾功能减退临评估及预警-语言处理交流会议 / 预训练语言模型看作知识图谱的研究趋势 | |
12 | 1 | 1上半个月:新冠 2.下半个月:忙期末 上课 / 研究性论文MoNER四修 / 数据与知识联合驱动的智慧患者管理2.0 / 嵌套类实体识别实验 |