4月23日,腾讯混元Hy3 preview语言模型发布并开源。据介绍,Hy3 preview是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,据称在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅提升。
腾讯首席AI科学家姚顺雨表示,Hy3 preview是混元大模型重建的第一步,希望通过这次开源和发布,获得来自开源社区和用户的真实反馈,帮助提升Hy3正式版的实用性。同时,腾讯也在继续扩大预训练和强化学习的规模,提升模型的智能上限,并通过与腾讯众多产品的深度Co-Design,提升模型在真实场景中的综合表现,并开始探索特色模型能力。