上证报中国证券网7月26日消息,记者刘怡鹤报道,在2025世界人工智能大会“AI焕新产业共赢”企业人工智能产业发展论坛上,中国移动正式发布“九天”基础大模型3.0。
据了解,“九天”基础大模型3.0进一步突出了“高安全、高可控、全国产、全行业”四大特性,主要有三大亮点。
其一,九天众擎语言大模型在架构与性能上实现双重飞跃。该模型开创性地运用可扩展至万亿级的MoE架构,借助15T token多阶段配比预训练数据与全流程治理体系,强化推理能力。同时,创新构建113域×53能力的二维分级后训练框架,并结合动态强化学习策略,使复杂推理能力提升了35%。此外,模型还增强了可控生成能力,攻克了沉浸式角色演绎、精确流程内置等技术难题,达成专业场景零幻觉。基于此语言大模型,中国移动此次还推出了多个专项模型,如九天代码大模型、九天数学大模型等。
其二,九天善智多模态大模型全方位提升了生成可控性与理解能力。该模型依托复杂时空建模、流匹配图片视频渐进式联合训练、端到端局部可控注意力机制等创新技术,引入多模态理解信息,增强对文本指令和输入条件图像视频的感知能力。通过联合图文交织数据训练,它既能生成高质量的图像视频,又能进行多轮对话式高可控精确编辑操作,大大提高了视觉生成的灵活便利性,在图理解和视频理解方面的性能也有显著提升。
其三,模型及核心技术实现开源。中国移动开源了九天数童结构化数据大模型、九天数学大模型、九天代码大模型,以及业界首创的结构化数据模型评测数据及TReB评测体系、CCR - Bench行业场景复杂指令遵循评测数据集等。相关内容已在焕新社区、Github、HuggingFace、魔搭社区、Gitee、Arxiv等平台上线。
相关标签:
Ai滚动快讯重要提示: 以上内容由AI根据公开数据自动生成,仅供参考、交流、学习,不构成投资建议。如不希望您的内容在本站出现,可发邮件至ljcj@leju.com或点击【联系客服】要求撤下。未经允许,任何单位或个人不得在任何平台公开传播使用本文内容。