月之暗面发布万亿参数开源模型 Kimi K2,多位研发工程师在知乎“亲自答” “参与过Kimi K2的接生,自己的孩子怎么看都顺眼”。7月11日晚,国内大模型独角兽月之暗面正式发布并开源了其最新一代MoE架构基础模型Kimi K2,总参数量达到1万亿,这一消息迅速引发了AI领域的广泛关注,Kimi内部则将K2研发群戏称为“接生群”。多位参与“接生”的Kimi研发人员随后在知乎展开“亲自答”,从多个角度深入讲述了其背后研发历程。 作为月之暗面 Infra侧推理方面研发人员,知乎答主刘少伟谈及了K2模型结构的设计宗旨。他称K2模型是在DeepSeek V3结构的框架之下,如何选择合适的参数,使得模型在训练、推理成本与v3相当的前提下,获得明显更低的loss。“综合以上四个相比v3的改动,我们能够得到一个在相同EP数量下,虽然总参数增大到1.5倍,但除去通信部分,理论的prefill和decode耗时都更小的推理方案”。 月之暗面研究员、知乎答主Flood Sung则表示,Kimi K2最值得关注的信息,除了MuonClip带来的漂亮得起飞的loss曲线,还有就是Agent能力。他透露,为了实现更好的通用Agent能力,构建了一个大规模的agent合成数据pipeline:简单的说是一个完全自动化的agent数据生产工厂,通过全流程的模拟来过滤出好的Agent轨迹数据。Flood Sung称,“这个生产线非常符合老子的思想:‘一生二,二生三,三生万物’。” 另一位月之暗面研发人员、知乎答主Justin Wong谈到Kimi K2为何会选择开源时称,开源意味着能够借助社区力量完善技术生态,“在我们开源不到24小时就看到有社区做出K2的MLX实现、4bit量化等等,这些凭我们这点人力真的做不出来”。月之暗面研究员、知乎答主Dylan则表示,K2实际上就是一个刚出生的baby,虽然略显“灵性”,但和很多已久的frontier model相比,还是有很多、很明显的缺点,“作为post-train(后训练)相关的同学,还是略感惭愧,希望后面的版本迭代里面能够持续释放K2 base model的潜力”。 开发者在AI成果发布的同时,越来越多选择来知乎发布背后的详尽思考。6月,月之暗面也曾发布一款Agent产品,Kimi-researcher两位主要研发人员也在知乎亲自答,解读产品背后的技术思考和亮点。更早之前,月之暗面开源MoBA框架研发人员鹿恩哲、苏剑林分别在知乎上讲述了研发思路,引发了业界对“稀疏注意力”框架的讨论。 2025年以来,伴随AI技术新浪潮的蔓延,知乎引领了一系列全网重要的AI趋势发布。3月,DeepSeek在知乎开设官方账号,并独 家发布《DeepSeek-V3/R1 推理系统概览》技术文章;智元机器人联合创始人彭志辉在知乎以视频形式发布了人形机器人灵犀X2;10年“老答主”王兴兴在知乎与网友大量互动,分享宇树机器人最新研发动态…… 在顶流创业者们的一次次分享中,知乎见证了中国创新科技势力的一次次突破,也凸显了知乎作为AI领域核心交流阵地的独特价值——以其浓厚的技术讨论氛围,搭建起开发者与行业、创新成果与大众认知之间的桥梁,让前沿技术不再是晦涩难懂的孤岛,持续推动着AI行业在“思维链开源”交流下向前发展跃迁。 郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。 |
十年前,想要买一台家轿,身边的朋友毫无例外都会推荐合资品牌。而最近,当我和亲朋好友们谈论买车话题时,...
年轻人买车不只是为了方便日常通勤,也为了能随时随地去郊外“撒撒野”来场说走就走的旅行。在过去,能够满...
自北京冬奥会开幕以来,吉祥物冰墩墩逐渐成为新晋顶流网红,有的商场把它当成吸睛神器,有的家庭把它作为温...
双十一临近,各种福利攻略铺面而来。奇瑞诚意满满,新世代潮跑SUV欧萌达“神助攻”,送上双十一限时五重...
当下10多万级的紧凑型SUV市场,自主品牌还是占据了绝大部分的话语权。不过,随着合资品牌新车型的不断...
估计任何一个花粉都没有想到被余承东疯狂吹捧的问界M7安全性如此之差吧,不知道多少理性的消费者感到庆幸...
随着空气慢慢暖和起来,无论是在家里还是在车上,通风都是一件需要落实的事情了。尤其是春季有利于病毒传染,如...查看全文
掐指一算,立冬已过,winter is coming!每年都是还没做好入冬的准备,人...查看全文
2022G20峰会将在印度尼西亚巴厘岛召开,作为G20峰会官方用车,300台五菱首款新能源全球车Aire...查看全文
11月8日至10日,由中国汽车工业协会主办的2022中国汽车论坛在上海举行。论坛期间正式发布了“2022...查看全文
中国服务机器人何以在全球脱颖而出 在欧洲家庭的庭院中割草,在北美酒店的泳池里自动清污,在日韩的餐厅...查看全文