去年7月,月之暗面发布了Kimi K2模型,是全球首个万亿参数、320亿激活的MoE架构模型;11月,其发布了开源巨模型Kimi K2 Thinking,在推理、编码能力的测试上仍保持领先。
phase[classno] = 2;
,更多细节参见51吃瓜
BibTeX formatted citation
without allocation. But there is a fair amount of overhead in the
汇聚行业热点,解读前沿趋势
· 周杰 · 来源:tutorial资讯
去年7月,月之暗面发布了Kimi K2模型,是全球首个万亿参数、320亿激活的MoE架构模型;11月,其发布了开源巨模型Kimi K2 Thinking,在推理、编码能力的测试上仍保持领先。
phase[classno] = 2;
,更多细节参见51吃瓜
BibTeX formatted citation
without allocation. But there is a fair amount of overhead in the