海光DCU成功适配DeepSeek-Janus-Pro多模态大模型

[导读]近日，海光信息技术团队成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化，并正式上线。这是海光团队近期完成适配优化的第三款DeepSeek大模型，充分展现了DCU强大的生态优势与技术能力。因DCU采用了GPGPU通用加速计算架构，DeepSeek模型可直接在DCU上运行，并不需要大量适配工作，技术团队的主要工作是进行精度验证和持续的性能优化。

近日，海光信息技术团队成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化，并正式上线。这是海光团队近期完成适配优化的第三款DeepSeek大模型，充分展现了DCU强大的生态优势与技术能力。因DCU采用了GPGPU通用加速计算架构，DeepSeek模型可直接在DCU上运行，并不需要大量适配工作，技术团队的主要工作是进行精度验证和持续的性能优化。

用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型，或直接登录[www.sourcefind.cn]搜索“deepseek”，即可基于DCU平台快速部署和使用相关模型，包括高性能的问答基础模型DeepSeek-V3、推理模型DeepSeek-R1和文生图模型DeepSeek-Janus-Pro。

本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力，专注于结合视觉与语言理解能力，旨在处理更复杂的跨模态任务。

(Janus-Pro生成示例)

海光技术团队负责人表示，海光DCU在短时间内快速完成多款大模型适配，充分显示了DCU基于GPGPU架构实现的兼容主流Al生态的重要优势，同时验证了国产算力底座支撑前沿AI模型的技术能力，为金融、制造等行业的智能化转型提供了自主可控的技术选项。随着多模态AI应用场景的持续拓展，国产算力基础设施正成为驱动产业智能化升级的核心引擎。