2025-09-18to26科研追新
2025-09-18to26科研追新
1. 源数据
1.1 媒体
From:量子位、机器之心、新智元、AGI Hunt、小红书、X其他
1.2 Arxiv
1.2.1 Computation and Language
From:https:// /arxiv/cs.CLhttps://arxiv.org/list/cs.CL/recent
1.2.2 Artificial Intelligence
From:https://papers.cool/arxiv/cs.AIhttps://arxiv.org/list/cs.AI/recent
1.3 Huggingface
0925:
- 视频模型是零射击学习器和推理器(43▲)
- SIM-CoT:监督隐式思维链(28▲)
- EmbeddingGemma:强大而轻量级的文本表示(17▲)
- 利用GRPO推进语音感知语言模型中的语音理解(13▲)
- EditVerse:统一图像和视频的编辑和生成与上下文学习(9▲)
- LLMs4All:面向学科研究与应用的大型语言模型综述(8▲)
- Lavida-O:统一多模态理解和生成的弹性大掩模扩散模型(6▲)
- phystrl:生成物理用于可控和基于物理的视频生成(4▲)
- 逻辑分析技术报告(3▲)
- SimpleFold:折叠蛋白质比你想象的要简单(2▲)
- 关于代理编码的使用:对GitHub上Pull请求的实证研究(1▲)
- ATLAS:通过统一关税代码分类为全球贸易制定基准和调整llm(1▲)
- 要查看更多信息,请查看今天的日报页面。
0924:(wait)
- Baseer:用于阿拉伯语文档到标记OCR的视觉语言模型(82▲)
- 基于预训练数据的强化学习(43▲)
- 视觉运动策略需要本体感觉状态吗? (40▲)
- MiniCPM-V 4.5:通过架构,数据和训练配方烹饪高效mlm(32▲)
- MAPO:混合优势策略优化(18▲)
- Hyper-Bagel:多模态理解和生成的统一加速框架(17▲)
- VolSplat:重新思考前馈三维高斯飞溅与体素对齐预测(11▲)
- 有效推理的特点是什么? 回顾CoT的长度、回顾与结构(11▲)
- Lyra:通过视频扩散模型自蒸馏生成3D场景重建(11▲)
- 大型语言模型歧视德语方言使用者(5▲)
- HyRF:用于高效存储和高质量新视图合成的混合辐射场(3▲)
- CAR-Flow:状态感知的重新参数化将源和目标对齐,以实现更好的流匹配(3▲)
- 还有10多篇论文
2. 简单记录
3. 其他
正则表达式删除无关字符串
\[PDF\d*\] \[Copy\d*\] \[Kimi\d*\] \[REL\d*\]
\[PDF( \d+)? \] \[复制\] \[Kimi( \d+)? \] \[(?:REL|相关)\]图片插入
