当前位置:首页 > 芯闻号 > 美通社全球TMT
[导读] 新推出的 Granite 3.0 8B 和 2B 模型,在宽松的 Apache 2.0 许可证下发布,在许多学术和企业基准测试中表现出强大的性能,能够超越或匹敌类似规模的模型。 新推出的 Granite Guard...

IBM 推出 Granite 3.0:专为企业打造的高性能AI模型

  • 新推出的 Granite 3.0 8B 和 2B 模型,在宽松的 Apache 2.0 许可证下发布,在许多学术和企业基准测试中表现出强大的性能,能够超越或匹敌类似规模的模型。
  • 新推出的 Granite Guardian 3.0 模型提供了 IBM 最全面的护栏功能,以推进安全且值得信赖的人工智能。
  • 新推出的 Granite 3.0 专家混合模型(Mixture-of-Experts models)可实现极其高效的推理和低延迟,适用于基于 CPU 的部署和边缘计算。
  • 全新的 Granite 时间序列模型在零样本/少样本预测中实现了最先进的性能,超越了大10倍的模型。
  • IBM 推出了下一代基于 Granite 的 watsonx Code Assistant,适用于通用编码;在 watsonx.ai 中首次推出用于构建和部署 AI 应用程序和智能体(Agents)的新工具。
  • 宣布 Granite 将成为 Consulting Advantage 的默认模型,这是一个由 AI 驱动的交付平台,IBM 的 160,000 名顾问使用该平台,可以更快地为客户提供新解决方案。

北京2024年10月22日 /美通社/ -- 在美国时间10月21日举行的IBM(纽约证券交易所代码:IBM)年度TechXchange大会上,IBM宣布推出其迄今为止最先进的AI模型家族——Granite 3.0。IBM的第三代Granite旗舰语言模型在许多学术和行业基准测试中均能超越或匹敌同类领先模型提供商的模型,展示出强大的性能、透明性和安全性。

IBM 推出 Granite 3.0:专为企业打造的高性能AI模型

IBM 推出 Granite 3.0:专为企业打造的高性能AI模型

与公司对开源 AI 的承诺一致,Granite 模型在宽松的 Apache 2.0 许可证下发布,它们凭借在性能、灵活性和自主性方面的独特组合能够为企业客户和整个社区提供服务。

IBM的Granite 3.0家族系列包括:

  • 通用/语言模型:Granite 3.0 8B Instruct, Granite 3.0 2B Instruct, Granite 3.0 8B Base, Granite 3.0 2B Base
  • 护栏与安全模型:Granite Guardian 3.0 8B, Granite Guardian 3.0 2B
  • 专家混合模型:Granite 3.0 3B-A800M Instruct, Granite 3.0 1B-A400M Instruct, Granite 3.0 3B-A800M Base, Granite 3.0 1B-A400M Base

新款 Granite 3.0 8B 和 2B 语言模型被设计为企业级AI的"主力"模型,能够在检索增强生成(RAG)、分类、摘要、实体提取和工具使用等任务中提供强大的性能。这些紧凑的多功能模型旨在根据企业数据进行微调,并在各种业务环境或工作流程中无缝集成。

许多大型语言模型(LLM)是基于公开可用的数据进行训练的,绝大多数企业数据仍然未被利用。通过将小型 Granite 模型与企业数据相结合,特别是使用 IBM 和 RedHat 在五月推出的革命性对齐技术 InstructLab, IBM 相信企业可以实现与大型模型相媲美的特定任务性能,而成本只是其中的一小部分(基于在几个早期概念验证中观察到的成本比大型前沿模型低 3 到 23 倍的范围[i])。

Granite 3.0 版本的发布重申了 IBM 对建立 AI 产品透明度、安全性和信任的承诺。Granite 3.0 技术报告和负责任使用指南提供了用于训练这些模型的数据集描述,详细说明了所应用的过滤、清洗和处理步骤,并全面展示了模型在主要学术和企业基准测试中的性能结果。

至关重要的是,IBM 为 watsonx.ai 上的所有 Granite 模型提供知识产权赔偿,旨在增强企业客户将企业数据融入模型的信心。

提高标准:Granite 3.0 基准测试

Granite 3.0 语言模型在原始性能上也展示出良好的结果。

在 Hugging Face 的 OpenLLM 排行榜定义的标准学术基准测试中,Granite 3.0 8B Instruct 模型的整体性能平均领先于 Meta 和 Mistral 中类似大小的开源模型的最先进性能。在 IBM 的先进 AttaQ 安全基准测试中,Granite 3.0 8B Instruct 模型在所有测量的安全维度上均领先于 Meta 和 Mistral 的模型[ii]。

在检索增强生成(RAG)、工具使用和网络安全领域的核心企业任务中,Granite 3.0 8B Instruct 模型的平均表现优于Mistral 和 Meta 中类似规模的开源模型[iii]。

Granite 3.0 模型是在超过 12 万亿个标记上进行训练的,这些数据来自 12 种不同的自然语言和 116 种不同的编程语言,采用了一种新颖的两阶段训练方法,利用了数千个旨在优化数据质量、数据选择和训练参数的实验结果。到今年年底,预计 3.0 8B 和 2B 语言模型将支持扩展的 128K 上下文窗口和多模态文档理解能力。

IBM 展示了性能和推理成本的完美平衡,提供了其 Granite 专家混合(MoE)机构模型,Granite 3.0 1B-A400M 和 Granite 3.0 3B-A800M,这些较小且轻量级的模型可用于低延迟应用程序以及基于 CPU 的部署。

IBM 还宣布了其预训练 Granite 时间序列模型的更新版本,早期版本于今年早些时候发布。这些新模型在 3 倍的数据上进行训练,在所有三个主要时间序列基准测试中表现出色,超越了来自 Google、Alibaba 等公司 10 倍更大模型的性能。更新后的模型还提供了更大的建模灵活性,支持外部变量和滚动预测[iv]。

Granite Guardian 3.0:开启负责任AI的新时代

作为此次发布的一部分,IBM 还推出了一个新的 Granite Guardian 模型系列,允许应用程序开发人员通过检查用户提示和 LLM 响应来实施安全护栏,以发现各种风险。Granite Guardian 3.0、8B 和 2B 型号提供了当今市场上最全面的风险和危害检测功能。

除了社会偏见、仇恨、毒性、亵渎、暴力、越狱等危害维度外,这些模型还提供了一系列独特的检索增强生成(RAG)特定检查,如基于事实性、上下文相关性和答案相关性。在针对 19 项安全性和 RAG 基准的广泛测试中,Granite Guardian 3.0 8B 模型在危害检测方面的整体准确性平均高于 Meta 的所有三代 Llama Guard 模型。它在幻觉检测方面的整体性能也与专门的幻觉检测模型 WeCheck 和 MiniCheck 相当[v]。

虽然 Granite Guardian 模型派生自相应的 Granite 语言模型,但它们可以与任何开放或专有的 AI 模型一起使用,以实施安全保护措施。

Granite 3.0 模型的可用性

整个 Granite 3.0 模型套件和更新的时间序列模型都可以在 HuggingFace 上根据宽松的 Apache 2.0 许可证下载。新的 Granite 3.0 8B 和 2B 语言模型的指令(instruct)变体以及 Granite Guardian 3.0 8B 和 2B 模型现已在 IBM 的 watsonx 平台上提供商业用途。部分 Granite 3.0 模型也将作为 NVIDIA NIM 微服务提供,并通过 Google Cloud 的 Vertex AI Model Garden与 HuggingFace 的集成提供。

为给开发者提供多种选择和易用性,并支持本地和边缘部署,一套精选的 Granite 3.0 模型也可在 Ollama 和 Replicate 上获得。最新一代 Granite 模型扩展了 IBM 强大的开源 LLM 目录。IBM 与 AWS、Docker、Domo、Qualcomm Technologies, Inc.(通过其 Qualcomm® AI Hub)、Salesforce、SAP 等生态系统合作伙伴合作,将多种 Granite 模型集成到这些合作伙伴的产品中,或在他们的平台上提供 Granite 模型,为全球企业提供更大的选择空间。

从助理(Assistants)到智能体(Agents):实现企业级AI 的未来 

IBM 正在通过一系列技术推进企业级AI的发展,从模型和助理 (Assistants),到为公司独特的数据和用例调优和部署 AI 所需的工具。IBM 还在为未来能够自我导向、反思并在动态商业环境中执行复杂任务的 AI 智能体(AI agents)铺平道路。

IBM 不断发展其 AI 助理(Assitants)技术组合,从帮助公司通过低代码工具和自动化构建自己的助理的watsonx Orchestrate,到用于特定任务和领域(如客户服务、人力资源、销售和营销)的各种预构建助理。全球各地的组织已经使用 watsonx Assistant 帮助他们构建 AI 助理,用于回答客户或员工的日常问题、实现大型机和传统 IT 应用程序现代化、帮助学生探索潜在的职业路径,或为购房者提供数字抵押贷款支持等任务。

IBM 还公布了即将发布的下一代 watsonx Code Assistant,该版本由 Granite 代码模型提供支持,能够为 C、C++、Go、Java 和 Python 等语言提供通用编码辅助,并为企业级 Java 应用程序[vi]提供高级应用程序现代化功能。Granite 的代码功能现在也可以通过 Visual Studio Code 扩展程序 IBM Granite.Code访问。

IBM 还计划发布新工具来帮助开发人员,利用watsonx.ai 更高效地构建、定制和部署 AI,包括代理框架、与现有环境的集成以及用于常见用例(如 RAG 和智能体)的低代码自动化[vii]。

IBM 专注于开发具有更高自主性、复杂推理能力和多步骤问题解决能力的 AI 智能体(AI Agents)技术。Granite 3.0 8B 模型的初始版本支持关键的智能体功能,如高级推理和用于实现工具使用工作流程的高度结构化聊天模板和提示风格。IBM 还计划在 IBM watsonx Orchestrate 中引入新的 AI 智能体聊天功能,利用智能体功能协调 AI 助理、技能和自动化,帮助用户提高整体的团队生产力[viii]。IBM 计划在 2025 年继续在其产品组合中构建智能体功能,包括为特定领域和用例预构建的智能体。

扩展的 AI 驱动的交付平台,以 AI 增强 IBM 顾问的能力

IBM 还宣布大幅扩展其 AI 驱动的交付平台 IBM Consulting Advantage。该多模型平台包含 AI 智能体、应用程序和方法(如可重用的框架),赋能 16 万名 IBM 顾问,以更低的成本、更好更快地为客户提供价值。

作为扩展的一部分,Granite 3.0 语言模型将成为 Consulting Advantage 的默认模型。借助 Granite 的性能和效率, IBM Consulting 将能够帮助最大限度地提高 IBM 客户的生成式 AI 项目的投资回报。

扩展的另一个关键部分是引入 IBM Consulting Advantage for Cloud Transformation and Management 和 IBM Consulting Advantage for Business Operations。每一项都包括特定领域的 AI 智能体、应用程序和融合了 IBM 最佳实践的方法,使 IBM 顾问能够帮助客户加速云和 AI 转型任务(如代码现代化和质量工程),或跨领域(如财务、人力资源和采购)实施转型和运营。


关于IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和 Red Hat OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。



[i] 成本计算基于 IBM watsonx 的开放模型和 openAI 的 GPT4 模型(假设 80% 输入,20% 输出)的每 100 万个代币的 API 成本定价,用于客户概念验证。
[ii] IBM Research technical paper: Granite 3.0 Language Models
[iii] IBM Research technical paper: Granite 3.0 Language Models
[iv] The Tiny Time Mixer: Fast Pre-Trained Models for Enhanced Zero/Few Shot Forecasting on Multivariate Time Series
[v] Evaluation results published in Granite Guardian GitHub Report
[vi] Planned availability for Q4 2024
[vii] Planned availability for Q4 2024
[viii] Planned availability for Q4 2024

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭