去年7月,月之暗面发布了Kimi K2模型,是全球首个万亿参数、320亿激活的MoE架构模型;11月,其发布了开源巨模型Kimi K2 Thinking,在推理、编码能力的测试上仍保持领先。
Just to labour the point: I only optimised for one-shot guesstimating hard maths problems and EQ-Bench. I never looked at IFEval, BBH, GPQA, MuSR, or MMLU-PRO during development. The leaderboard was pure out-of-sample validation.,这一点在新收录的资料中也有详细论述
,更多细节参见新收录的资料
趋利避害建立健全人工智能治理体系
Hugging Face亚太生态负责人王铁震用“巨大损失”来形容这次变动,众多开源社区的贡献者也在社交媒体上留言致意。。新收录的资料对此有专业解读
第三是要把很多软件对接起来,去落实用户的要求,有很多东西你不能擅自决策,因为用户也没那么关心。