当前位置：首页 > 厂商动态 > 厂商动态

达摩院AliceMind上新！首个中文表格预训练模型来了，已向业界开源

时间：2021-12-02 14:45:38

关键字：达摩院数据库表格

手机看文章

扫描二维码
随时随地手机看文章

[导读]12月2日，达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP，该模型在全球权威表格数据集WikiSQL、SQuALL上取得了业界最优效果，且模型和训练代码均已对外开源。

12月2日，达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP，该模型在全球权威表格数据集WikiSQL、SQuALL上取得了业界最优效果，且模型和训练代码均已对外开源。

表格是应用普遍的结构化数据，也是智能对话系统和搜索引擎的重要答案来源。但传统表格查询需技术人员撰写专业查询语句，阻碍了表格查询的大规模应用。新兴的表格问答技术，可将自然语言转换为查询语句，使用户能通过简单问句直接与表格数据库交互，具有广泛应用前景。

不过，由于表格内容复杂多样、涉及各行业专业知识，表格问答任务一直是自然语言处理领域的难题。此前，谷歌、微软、亚马逊等海外公司开展了相关探索，但在中文场景，该方向处于空白。

本次，达摩院对话智能团队提出了首个中文表格预训练模型SDCUP，其基于“模式依存”方法，通过模型直接预测自然语言与表格结构内容的关键词映射，提升了表格问答的准确率。具体而言，即参考语义依存分析方法对Schema Dependency任务建模，使用全连接网络获取每个节点作为父亲节点和作为孩子节点的语义表示，然后使用双仿射网络预测每个边存在的概率和该边关系类型的概率。同时，团队使用了模仿人类的“课程学习”方法减少数据噪声。

（SDCUP生成SQL示例）

在耶鲁大学发布的业界最大规模的英文文本-表格数据集WikiSQL，以及微软构建的英文文本-表格高难度预测任务SQuALL数据集上，SDCUP模型均取得业界最优效果。在达摩院构建的表格问答中文数据集TaBLUE上，SDCUP比同参数规模BERT模型效果提升约3个百分点。

（SDCUP在WikiSQL数据集上取得业界最优效果）

（SDCUP在SQuALL数据集上取得业界最优效果）

达摩院资深算法专家李永彬介绍，SDCUP模型是达摩院表格对话技术系列研发的一部分，后续将持续对外开源。其相关技术先后在四大国际公开数据集WikiSQL、Spider、SParC、CoSQL上取得第一。

据了解，该技术完成了产品化，已通过阿里云智能客服为政务、金融、零售等行业客户提供表格问答和数据库自然交互服务。

本站声明：本文章由作者或相关机构授权发布，目的在于传递更多信息，并不代表本站赞同其观点，本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者，如若文章内容侵犯您的权益，请及时联系本站删除。

换一批

延伸阅读

阿维塔、赛力斯已入股！华为引望可能成“中国博世”

9月2日消息，不造车的华为或将催生出更大的独角兽公司，随着阿维塔和赛力斯的入局，华为引望愈发显得引人瞩目。

关键字：阿维塔塞力斯华为

[美通社全球TMT]

Trianz与AWS达成战略合作协议，彻底改变云采用和管理方式

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布，该公司与Amazon Web Services （AWS）签订了...

关键字： AWS AN BSP 数字化

[美通社全球TMT]

人工智能驱动工具SODA V将颠覆汽车市场，使汽车开发时间和成本降低90%

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V，这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具，可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字：汽车人工智能智能驱动 BSP

[美通社全球TMT]

从容应对未知风险----解密亚马逊云科技的韧性之道

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行，同时企业却面临越来越多业务中断的风险，如企业系统复杂性的增加，频繁的功能更新和发布等。如何确保业务连续性，提升韧性，成...

关键字：亚马逊解密控制平面 BSP

中国游戏市场开始复苏！腾讯、网易等巨头缩减在日本投资

8月30日消息，据媒体报道，腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字：腾讯编码器 CPU

独立自主！华为董事：致力打造不依赖西方的技术

8月28日消息，今天上午，2024中国国际大数据产业博览会开幕式在贵阳举行，华为董事、质量流程IT总裁陶景文发表了演讲。

关键字：华为 12nm EDA 半导体

华为张平安：数字世界话语权最终由生态繁荣决定！

8月28日消息，在2024中国国际大数据产业博览会上，华为常务董事、华为云CEO张平安发表演讲称，数字世界的话语权最终是由生态的繁荣决定的。

关键字：华为 12nm 手机卫星通信

[美通社全球TMT]

中国通信服务公布2024年中期业绩

要点：有效应对环境变化，经营业绩稳中有升落实提质增效举措，毛利润率延续升势战略布局成效显著，战新业务引领增长以科技创新为引领，提升企业核心竞争力坚持高质量发展策略，塑强核心竞争优势...

关键字：通信 BSP 电信运营商数字经济

[美通社全球TMT]

NVI技术创新联盟成立！自主生态将带动产业链高速发展

北京2024年8月27日 /美通社/ -- 8月21日，由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。活动现场 NVI技术创新联...

关键字： VI 传输协议音频 BSP

[美通社全球TMT]

软通动力与长三角投资达成战略合作共谋数字生态新发展

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上，软通动力信息技术（集团）股份有限公司（以下简称"软通动力"）与长三角投资（上海）有限...

关键字： BSP 信息技术

关闭