数据

数据

推理

科学推理

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

  1. 最大的开源科学推理后训练数据集
  2. 上海创智学院、上海交通大学(GAIR Lab)发布 MegaScience 。该数据集包含约 125万条问答对及其参考答案 ,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

视频生成

  1. 2025-07-02 14:22:34 Wednesday| 1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限 https://mp.weixin.qq.com/s/wVLTTmbvTToW70Qqw7p80g

浙江大学APRIL实验室联合多家高校推出的 高质量开源UHD-4K(其中22.4%为8K)文本到视频数据集——UltraVideo ,破解了这一困局。

该数据集涵盖广泛主题(超过100种),每个视频配备9个结构化字幕及一个总结性字幕(平均824词)。

0%