时间:2025-03-03 来源:原创/投稿/转载作者:管理员点击:
根据 Hugging Face 的说法,虽然 DeepSeek 使用的权重是已知的,但用于训练模型的数据集和代码是未知的。
据IT之家此前报道,Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型。
Hugging Face 表示,它计划建立的合成数据集将不仅关注数学,还将探索其他领域,为科学等其他领域提供帮助。返回搜狐,查看更多