海光DCU成功适配DeepSeek-Janus-Pro多模态大模型
扫描二维码
随时随地手机看文章
近日,海光信息技术团队成功完成DeepSeek-Janus-Pro多模态大模型与海光DCU的适配优化,并正式上线。这是海光团队近期完成适配优化的第三款DeepSeek大模型,充分展现了DCU强大的生态优势与技术能力。因DCU采用了GPGPU通用加速计算架构,DeepSeek模型可直接在DCU上运行,并不需要大量适配工作,技术团队的主要工作是进行精度验证和持续的性能优化。
用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,或直接登录[www.sourcefind.cn]搜索“deepseek”,即可基于DCU平台快速部署和使用相关模型,包括高性能的问答基础模型DeepSeek-V3、推理模型DeepSeek-R1和文生图模型DeepSeek-Janus-Pro。
本次适配优化的DeepSeek-Janus-Pro模型具备跨模态理解与生成能力,专注于结合视觉与语言理解能力,旨在处理更复杂的跨模态任务。
(Janus-Pro生成示例)
海光技术团队负责人表示,海光DCU在短时间内快速完成多款大模型适配,充分显示了DCU基于GPGPU架构实现的兼容主流Al生态的重要优势,同时验证了国产算力底座支撑前沿AI模型的技术能力,为金融、制造等行业的智能化转型提供了自主可控的技术选项。随着多模态AI应用场景的持续拓展,国产算力基础设施正成为驱动产业智能化升级的核心引擎。