当前位置:首页 > 厂商动态 > 亚马逊云科技
[导读]在Hugging Face 开源大语言模型排行榜上排名第一的Falcon 40B现已在Amazon SageMaker JumpStart上可用,让客户更便利地利用这一模型快速构建生成式AI应用程序。

北京——2023年6月7日– 亚马逊云科技今日宣布,位于阿联酋首都阿布扎比的全球领先科研中心TII(Technology Innovation Institute)在亚马逊云科技上训练了其性能卓越的开源模型Falcon 40B。Falcon 40B是拥有400 亿参数的大语言模型(LLM),在Apache 2.0许可下提供,并在Hugging Face的开源大语言模型排行榜上位列榜首。该排行榜在多个基准测试中跟踪、排名和评估大语言模型,最终评选出最佳模型。客户现在可以将Falcon 40B部署在Amazon SageMaker JumpStart上,这是一个机器学习中心,提供预训练模型,使客户无需从头构建自己的模型即可获得Falcon 40B最先进的准确性和行业领先的性能。要开始使用Amazon SageMaker JumpStart,请访问aws.amazon.com/sagemaker/jumpstart。

大语言模型是机器学习(ML)模型的一个分支,专注于语言领域,可以支持各类生成式AI应用,包括文本处理、总结摘要和会话问答。虽然这些大语言模型具有改变行业的潜力,但构建、训练和部署大语言模型可能需要数周甚至数月的时间,并耗资数千万美元,这将许多公司拒之门外。为了在整个开发过程中实现更好的性能和成本效益,包括Stability AI、AI21 Labs、Hugging Face和LG AI在内的众多客户使用亚马逊云科技端到端的机器学习服务Amazon SageMaker来构建、训练和部署他们的大语言模型。

这也正是TII使用Amazon SageMaker构建其Falcon 40B模型的原因。得益于SageMaker是一项完全托管的服务,TII可以专注于开发自定义的训练机制和优化功能,而无需管理其机器学习基础设施。为了最大限度地降低训练成本并缩短上市时间,TII采取了多项优化措施,包括编写自定义矩阵乘法以加快训练速度。在整个训练过程中,亚马逊云科技还与TII密切合作以利用SageMaker增强可用性,确保训练顺利进行,减少对开发人员的干扰。

TII于2023年5月在Apache 2.0许可下发布了其Falcon 40B模型。自发布以来,Falcon 40B 在各种基准测试中的表现都优于当下的同类模型,展示了无需专门微调的卓越性能。为了让客户更轻松地访问该模型,亚马逊云科技让Falcon 40B可以通过Amazon SageMaker Jumpstart部署。现在,各个行业、各种规模的客户都可以快速轻松地部署自己的Falcon 40B模型,并对其进行定制以满足他们的特定需求,如翻译、问答、信息总结、图像识别等应用程序。

“Falcon 40B的开源版本使机构能够利用其卓越性能来推动AI赋能的解决方案的发展。这是我们致力于促进 AI 创新的重要里程碑,也体现阿联酋深远的科学贡献。”TII跨AI研究中心执行总监兼LLM项目负责人表示,“通过将Falcon大语言模型开源,我们希望将这一先进的技术能力普惠化,为全球研究人员和组织赋能。下一步,我们即将推出新模型,为人工智能和先进技术领域的进一步发展做出贡献。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭