当前位置:首页 > 芯闻号 > 充电吧
[导读]艺术,作为时间与空间的沉淀,经常被视为一场带领现代人类回到过去一窥究竟的旅行,也是允许人们暂时逃避当下的载具。绘画宝库无穷无尽,因此来自不同时间或空间的艺术品之间的联系常常会被忽略。即使是最有知识的艺

艺术,作为时间与空间的沉淀,经常被视为一场带领现代人类回到过去一窥究竟的旅行,也是允许人们暂时逃避当下的载具。

绘画宝库无穷无尽,因此来自不同时间或空间的艺术品之间的联系常常会被忽略。即使是最有知识的艺术评论家,也无法阅览跨越数千年时间的数百万幅画作,并在主题、基调和视觉风格上找到意想不到的相似之处。

为了简化此过程,麻省理工学院计算机科学与人工智能实验室(CSAIL)和微软的一组研究人员创建了一种算法,以发现大都会艺术博物馆(the Met)与阿姆斯特丹国立博物馆馆藏绘画之间的隐藏联系。

受阿姆斯特丹国立博物馆特别展览 “伦勃朗和贝拉克斯兹”的启发,新的 “MosAIc”系统通过使用深层网络了解两个图像的近似程度,发现了来自不同文化、艺术家和媒介的成对(也即 “类似”的)作品。

在那次展览中,研究人员受到了一种看似并不可能但却确实相似的匹配作品的启发:弗朗西斯科 · 德 · 祖巴兰(Francisco deZurbarán)的和扬 · 阿瑟林(Jan Asselijn)的,这两幅作品都描绘了深刻的利他主义场面,并拥有非常令人惊讶的视觉相似性。

一位来自 CSAIL 的博士生马克 · 汉密尔顿(Mark Hamilton)说:“这两位艺术家一生中没有通信或彼此见面,但他们二者的画作都拥有着丰富而相似的潜层结构” 。汉密尔顿是有关 “MosAIc”的论文的主要作者。 为了找到两幅相似的画作,该团队使用了一种新的图像搜索算法来发现特定艺术家或文化的最接近匹配。例如,对于一项 “哪种乐器最接近于此蓝白色连衣裙绘画”查询,该算法检索了蓝白色瓷小提琴的图像。这些作品不仅在样式和形式上相似,而且源于荷兰人和中国人之间更广泛的瓷器文化交流。

汉密尔顿说:“图像检索系统使用户能够找到语义上与查询图像相似的图像,充当反向图像搜索引擎和许多产品推荐引擎的基础。”

“将图像检索系统限制为特定的图像子集可以帮助对视觉世界中的关系产生新的见解。我们的目标是鼓励更高层次的与创造性艺术品的互动。”

用 AI 探索现有艺术

对于许多人来说,艺术与科学水火不容:科学基于逻辑、推理和经证实的真理,而艺术则基于情感、美学和美感。但是最近,人工智能和艺术出现了新的变化,在过去的十年中,这种变化变得越来越大。

比如说,从前,绝大多数的新研究集中于使用 AI 生成新艺术。有一个由麻省理工学院、NVIDIA 和加州大学伯克利分校的研究人员开发的 GauGAN 项目就是一个例子。还有汉密尔顿曾经参与过的 GenStudio 项目;甚至还有过一件 AI 生成的艺术品,被在苏富比以 51,000 美元的价格售出。

但是,MosAIc 的目的不是创造新艺术,而是帮助探索现有艺术。

谷歌的 “X 分离度”是一种类似的工具,可以找到将两件艺术品联系起来的艺术品路径,但是 MosAIc 的不同之处在于,它仅需要一张图片即可。它没有找到路径,而是发现用户感兴趣的任何文化或媒体中的联系。

汉密尔顿(Hamilton)指出,建立他们的算法是一项艰巨的尝试,因为他们希望找到不仅颜色或样式相似,而且含义和主题相似的图像。换句话说,他们希望狗与其他狗靠近,人们与其他人靠近,等等。为了实现这一目标,他们在大都会博物馆和国家博物馆的开放访问集合中,针对每个图像探究了深层网络的内部 “激活”。他们如何判断图像相似性,就是通常称为 “功能”的这种深层网络 “激活”之间的距离。

为了找到不同文化之间的相似图像,该团队使用了一种新的图像搜索数据结构,称为 “条件 KNN 树”,该结构将相似图像组合成树状结构。为了找到匹配的对象,他们从树的 “树干”开始,然后跟随最有希望的 “分支”,直到他们确定找到最接近的图像为止。通过允许树快速将其自身 “修剪”到特定的文化,艺术家或馆藏,从而快速产生对信息查询的答案,数据结构对其前身进行了改进。

汉密尔顿和他的同事感到惊讶的是,这种方法也可以用于帮助发现现有的深层网络的问题,这些问题与最近涌现的 deepfake 有关。他们应用此数据结构来查找概率模型(例如经常用于创建深造品的生成对抗网络)崩溃的区域。他们将这些有问题的区域称为 “盲点”,并指出它们使我们能够洞悉 GAN 的偏见。这种盲点进一步表明,即使大多数伪造品可以欺骗人类,GAN 仍难以代表数据集的特定区域。

MosAIc 到底有多快?

该团队评估了 MosAIc 的速度,以及它与人类对视觉类比的直觉之间的接近程度。

对于速度测试,他们希望确保其数据结构在通过快速,强力搜索简单地搜索整个集合中提供价值。

为了了解系统与人类直觉的协调程度,他们制作并发布了两个新的数据集,用于评估条件图像检索系统。一个数据集对算法提出了挑战,即使使用神经样式转移方法对其进行 “样式化”后,也要查找具有相同内容的图像。第二个数据集挑战了算法以恢复不同字体的英文字母。不到三分之二的时间,MosAIc 能够一次从 5,000 张图像中猜测出正确的图像。

汉密尔顿说:“展望未来,我们希望这项工作能激励其他人思考信息检索工具如何帮助其他领域,例如艺术,人文科学,社会科学和医学。”

“这些领域充满了从未被这些技术处理过的信息,可以为计算机科学家和领域专家带来巨大的灵感。这项工作可以在新的数据集,新的查询类型和新方式方面得到扩展了解作品之间的联系。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭