入行仅一年!深圳17岁高中生破解AI底层难题 获马斯克点赞
摘要
快科技3月19日消息,3月16日晚间,特斯拉CEO马斯克在社交平台公开发声,点赞中国人工智能企业月之暗面(Kimi)团队的最新技术成果,直言这项......
快科技3月19日消息,3月16日晚间,
伴随技术论文同步公开,作者名单中位列首位的GuangyuChen(
据论文附录标注信息显示,陈广宇与张宇、苏剑林三人同为同等贡献共同
其中,张宇是Kimi高效模型架构的核心研发人员,苏剑林则是旋转位置编码(RoPE)的提出者。
值得一提的是,陈广宇真正深耕AI领域仅一年时间。起步阶段,他凭借自主研读前沿论文、追踪GitHub开源项目等方式,快速补齐AI基础知识与实践能力。
去年暑假,他远赴旧金山完成7周实习历练,回国后于去年11月加入Kimi团队参与实习。
论文发布后,陈广宇在朋友圈发文复盘成果,特意提及三位同等贡献作者,以及负责模型扩展、基础设施搭建的团队同事。他低调回应称是团队成果,不要造神。”
据报道,Kimi团队发布的这项技术报告,提出全新AttentionResiduals(注意力残差)机制,对深度学习领域沿用近十年的传统残差连接实现颠覆性重构。
Kimi的创新相当于给AI装了智能筛选器”,将Transformer注意力机制迁移到模型深度维度,让每一层动态筛选此前有用信息、压低冗余,提升传递效率。
