我们如何判断人工智能创作的艺术跟人类创作的艺术区别在哪?
扫描二维码
随时随地手机看文章
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。 [1] 2017年12月,人工智能入选“2017年度中国媒体十大流行语”。 [2] 2021年9月25日,为促进人工智能健康发展,《新一代人工智能伦理规范》发布。
要说现在互联网什么玩法最火,那非莫属AI了,从几年前的AI识别、AI人像、AI语音,慢慢到后面的AI视频和AI主播等等,AI这些年的进化速度相当惊人。
毫不夸张的说,AI领域已经逐渐覆盖在我们老百姓的生活上了,甚至网上一搜一大堆相关的内容。
当然,在这项技术用途上,离我们不远;但AI它真正的技术支持,是我们大多数人没法接触的。
AI即是人工智能,通过深度学习,来完成我们特定的某项任务,这背后需要强大的算力算法加持。
在AI技术日益成熟的今天,其中不乏被取代了一些苦力的劳动职位,导致失业的人也增多了。但世界发展需要的前提下,有些迭代过程是必不可少的。
AI再度成为舆论焦点。作为一个年经话题,这一次AI走红不再是因为“产生智慧”,也没有“胜天半子”的传奇对决,但仍旧让人震惊。
AI作画正在成为趋势之一。可能你毫无艺术细胞,但只要在AI绘图软件里输入几个关键词,再选择想要的风格与视角,就能收获一幅与AI共创的高水平画作。凭借着令人惊异的技术水准与创作能力,AI作画已经成为了海内外技术领域的顶流概念之一,短短一个多月里,无数AI画作被生产出来,AI正气势汹汹地向人类引以为傲的艺术创作领域发起冲击。
在一些人看来,这或许是另一种层面的“智械危机”。AI作画到底发展到了何种程度?它真的会成为人类想象力与创造力的强敌吗?带着疑问,我也打开了一款AI绘图软件,在prompt关键词部分输入了“人工智能”“美术”“创作”等词条。几十秒后,一张超现实主义的画作展示在我面前:
一个巨大的机器人静默地矗立着,它的背后连接着复杂的机械装置,空间里绚丽的色彩与冰冷的钢铁交相辉映。
2022年8月31日,一位名为Jason Allen的美国游戏设计师在美国科罗拉多州博览会一项美术竞赛中斩获一等奖,获奖的作品名为《空间歌剧院》。这幅画作是一幅标准的太空歌剧风格的绘画作品,只不过,它出自AI之手。
《空间歌剧院》是Jason Allen使用AI绘图软件MidJourney创作完成的,是在近千次的尝试后生成的。消息一经发出,在全球艺术领域迅速引起热议,利用AI参赛让《空间歌剧院》及其作者陷入了口诛笔伐中。无独有偶,同样是在8月,美国媒体大西洋月刊的一位记者同样因为利用MidJourney制作文章插画而陷入争议,一场全球范围内的AI创作大讨论就这样拉开帷幕。
AI作画的风头正盛,用AI做视频的应用也悄然而至。九月底Meta小扎公布了自家Make-A-Video的AI视频制作工具。这款工具可以生成高质量的短视频。Meta AI做视频的新闻还没有焐热,谷歌也不甘示弱,推出了两款AI生成视频的工具:Imagen Video 和 Phenaki。前者倾向于打造视频质量,后者倾向于视频的逻辑与时长。这几款AI视频制作工具各有特色。
文本生成图像的AI技术大火才不过几个月,就直接跃升至文本生成动态视频。从画图到做视频,AI的发展速度令人讶异,同时令人对未来的数字媒体憧憬。那么,这种跨越到底会给未来带来什么呢?
AI做视频是AI作图的延伸
在讨论AI生成视频会给未来带来哪些改变前,我们先梳理下,AI生成视频的技术原理和应用场景。
冯原:是的,艺术创作不是用算法来做的。这与数学逻辑不一样,基于数学的算法可能并不需要情感。说到这里,就要涉及一个非常严肃的问题:如果我们能创造一种既拥有情感变化、也有内分泌机制的人工智能的话,这样的AI才具有一颗“人类的心灵”,那么它才可能创造艺术。否则,算法处理的图像由于没有人类之心,它只能模仿但不具备自主创造和感知艺术的功能。
收藏周刊:我们似乎很难判断人工智能创作的艺术跟人类创作的艺术区别在哪?
模型是算力、算法和数据三大基础要素与应用场景之间的桥梁,模型既是算力、算法和数据三大基础要素的综合,又是解决应用场景需求的关键。模型是人工智能领域的核心概念,每一个人工智能应用都是针对应用场景的具体需求,建立或选取合适的模型,利用相应数据和算法对模型进行训练拟合,然后再把训练拟合好的模型提供推理服务,从而实现自动解决具体应用场景的任务。
模型具有较强的通用性,同一类模型可以在多个领域应用,解决多个场景的具体问题。往往从事模型开发领域的企业,需要针对具体的应用场景进行模型开发,形成对应的AI应用产品,也有些企业提供模型开发服务项目为主。关于模型的具体行业应用,将会在后续的内容里,结合具体行业应用再分析,在此还是围绕模型本身的机会展开讨论。
一、专业模型开发是AI技术领域的核心环节,大模型、多模态以及小模型等方向值得重点关注。
专业模型一直是AI领域研究和创业的核心领域,主要围绕视觉图像、语音识别和自然语言处理,以及知识图谱等方面,许多的专业模型就是为了解决这些领域的问题而诞生。近年来大模型的出现与发展,也带来了图像、语音和文本等多模态模型的融合发展。边缘计算应用场景日趋丰富,小模型在边缘终端优势明显。
视觉图像领域有企业和研究单位从事该领域的工作,视觉图像领域模型可能是在行业应用中最广泛或者最常见的AI模型,不仅诞生了“AI四小龙”,也产生了更多的细分领域的应用创新企业,应用领域包括OCR、安防、自动驾驶等,也拓展到了医疗、工业、港口、水利、能源等更多的领域。
语音识别与合成,包括声纹等领域也有许多企业和研究单位参与其中,目前在客服和交互等方面应用广泛,声纹作为一种新的身份认证方式也在互联网和金融的相关账户系统中应用,另外关于语音方面的模型也开始迁移应用到工业机器运维等领域。
自然语言处理是为了让计算机能够处理和理解人类的语言,近年来自然语言处理与知识图谱的结合越来越紧密,研究范围也从基础的分词、表示等内容更多的向知识推理等更高难度的方向扩展,目前主流的大模型研究核心也是围绕自然语言处理。自然语言处理在搜索、对话系统以及舆情分析等方面应用广泛。
Transformer模型最早是解决NLP的经典模型,现在也广泛的应用于图像和语音等方面,甚至在药物研发大分子发现方面主要也是基于Transformer模型的应用。许多的大模型和多模态模型,许多也是基于Transformer模型实现。