当前位置:首页 > 芯闻号 > 极客网
[导读]现在的生成式AI工具还不完美,经常会“撒谎”,这就是所谓的幻觉。为了克制幻觉,开发者开发出一系列工具,最近在硅谷比较流行的工具是检索增强生成(Retrieval-augmented Generation,简称RAG)。

现在的生成式AI工具还不完美,经常会“撒谎”,这就是所谓的幻觉。为了克制幻觉,开发者开发出一系列工具,最近在硅谷比较流行的工具是检索增强生成(Retrieval-augmented Generation,简称RAG)。

RAG是一种结合检索和生成技术的模型,它为大模型提供外部知识源,使得大模型具备从指定的知识库中进行检索,并结合上下文信息,生成相对高质量的回复内容,减少模型幻觉问题。例如,企业可以将所有的HR政策和福利信息上传到RAG数据库,AI聊天机器人聚焦于可以从这些文件中找到的答案。

听起来RAG似乎和ChatGPT技术没有什么太大差异,实际上差异蛮大的。Thomson Reuters用RAG技术开发出一套面向法务工作者的AI工具,其公司高管Pablo Arredondo说:“RAG不会单纯依靠初始训练生成的记忆来回答问题,它会利用搜索引擎收集真实文档,比如判例法、论文等,然后根据这些文档锚定模型的响应。”

例如,我们可以将某本杂志的所有内容上传到数据库,根据数据库内容回答问题。因为AI工具关注的信息面比较窄,信息质量更高,基于RAG开发的聊天机器人在回答问题时会比通用机器人更有深度。

RAG机器人会不会犯错呢?当然会,但它捏造内容的概率会降低。

研究人员认为,RAG方法有很大优势,在训练模型时,它所接受的信息都是事实,而且是可以追溯来源的事实。如果你能教模型对提供的数据进行分类,并在每个输出结果中使用、引用,那么人工智能工具就不太可能犯严重的错误。

用了RAG技术,幻觉能降低多少呢?一些研究者认为,幻觉可以达到很低的程度,但无法完全消除。换言之,RAG不是万能药。总体看,幻觉减少程度取决于两个核心要素:一是整体RAG的部署质量,二是对AI幻觉的定义。

并非所有的RAG都是一样的。在自定义数据库中,内容的精度影响着结果质量,但它并不是唯一影响因素。除了要关注内容的质量,还要关注搜索质量及基于问题的正确内容的检索。掌握过程中的每一步都至关重要,因为一个失误就可能使模型完全偏离。

斯坦福教授Daniel Ho说:“凡是在某个搜索引擎中使用自然语言搜索的律师都会发现,许多时候语义相似度影响巨大,它会导出完全不相关的资料。”

如何定义RAG应用中出现的幻觉也很重要。一些专家认为,判断RAG系统是否出现幻觉主要是看输出结果是否与数据检索时模型找到的答案一致。斯坦福大学则认为,要检查结果,看它是否基于提供的数据,是否符合事实。

在回答法律问题时,RAG系统明显比ChatGPT、Gemini更好,但它仍然有可能忽视细节,随机给出错误答案。几乎所有专家都认为,即使有了RAG系统,也需要人类参与,对引用信息进行双重检查,判定结果的准确率。

在法律领域RAG系统可以找到用武之地,在其它领域也一样。凡是需要专业知识的专业领域,AI系统给出的答案都应该锚定真实文件,所以RAG适合专业领域。

Daniel Ho说:“幻觉一直存在,我们还没有找到好办法真正消除幻觉。”虽然RAG可以降低错误率,但还是需要人类来判断结果如何。(小刀)

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭