[导读]整理 |禾木木出品| AI科技大本营(ID:rgznai100)英伟达又一次突破了,这么逼真的照片竟然不是来自摄影师或是设计师!近日,英伟达官方推出GauGAN2的人工智能系统,它是其GauGAN模型的继承者,它不仅能根据字词生成逼真的风景图像,还能实时用文字P图!GauGAN2...
整理 | 禾木木出品 | AI科技大本营(ID:rgznai100)英伟达又一次突破了,这么逼真的照片竟然不是来自摄影师或是设计师!
近日,英伟达官方推出 GauGAN2 的人工智能系统,它是其 GauGAN 模型的继承者,它不仅能根据字词生成逼真的风景图像,还能实时用文字P图!GauGAN2 将分割映射、修复和文本到图像生成等技术结合在一个工具中,通过输入文字和简单的绘图来创建逼真的图像。Isha Salian 表示“与类似的图像生成模型相比,GauGAN2 的神经网络能够产生更多种类和更高质量的图像。”英伟达的企业传播团队在一篇博客文章中写道。“用户无需绘制想象场景的每个元素,只需输入一个简短的短语即可快速生成图像的关键特征和主题,例如雪山山脉。然后可以用草图定制这个起点,使特定的山更高,或在前景中添加几棵树,或在天空中添加云彩。”例如输入海浪打在岩石上,模型会根据生成的内容逐渐进行相应的调整,以生成与描述匹配的逼真图像。
GauGAN2 的生成模式
GauGAN2 有三种绘制模式,可以从不同的输入生成逼真的图像。模式1:用涂鸦生成风景照模式2:输入文本生成图片这种输入文本生成匹配图像的模式也是 GauGAN2 主要的创新,生成的图像会根据逐渐输入的文本不断发生变化,最终生成和文本匹配最佳的图像。例如在下图的示例中,文本首先输入 sunshine(阳光),生成的图像中就只出现了一个太阳;之后继续输入 a tall tree(高树),图像中就出现了树(且为顶部树枝,匹配高树);最后,输入的全部文本是 sunshine in a tall tree forest ,意为透过森林的阳光,GauGAN2 最终生成的图像与之相匹配:模式 3:输入图像并编辑部分内容如果想要抹掉移除的内容,在生成的图像中会保留剩余的部分,并自动补全出多种新的完整图像:这三种模式也可以混合叠加使用,例如在用涂鸦绘画等生成图像后,输入文本进行相应的修改,在下图中就生成了一座浮在空中的城堡就出现了。像像外媒ZDNet就恶搞出来了一种神奇的玩法,在已有的风景上画个人头—,画人头:在生成这一系列逼真的图像背后用了什么原理呢?
如何实现?
从 2019 年开始,英伟达改进 GauGAN 系统,该系统由超过一百万个公共 Flickr 图像的训练而成。与 GauGAN 一样,GauGAN2 可以理解雪、树、水、花、灌木、丘陵和山脉等物体之间的关系,例如降水类型随季节而变化的事实。GauGAN2 是一种称为生成对抗网络 (GAN) 的系统,由生成器和判别器组成。生成器用于获取样本,例如获取与文本配对的图像,并预测哪些数据(单词)对应于其他数据(风景图片的元素)。生成器试图通过欺骗鉴别器来进行训练,鉴别器则用于评估预测结果是否现实。虽然 GAN 的转换最初的质量很差,但随着鉴别器的反馈二不断改善。与 GauGAN 不同的是,GauGAN2 是在 1000 万张图像上训练而成——可以将自然语言描述成风景图像。输入诸如“海滩日落”之类的短语会生成场景,而添加诸如“岩石海滩日落”之类的形容词或将“日落”替换为“下午”或“下雨天”等形容词会立即修改画面。GauGAN2 用户可以生成分割图,显示场景中对象位置的高级轮廓。从那里,他们可以切换到绘图,使用“天空”、“树”、“岩石”和“河流”等标签通过粗略的草图调整场景,并允许工具的画笔将涂鸦融入图像。这是属于更新迭代的过程,用户在文本框中键入的每个词都会为 AI 创建的图像添加更多内容,因而 GauGAN2 才能随着输入文本而不断变换图像。
结语
GauGAN2 与 OpenAI 的 DALL-E 没有什么不同。不过,这两个模型生成的内容其实不太一样。GauGAN2 专注于生成风景照,DALL·E 则更多地生成具体的物体,例如一把椅子或者一个闹钟等。英伟达声称,GauGAN 的第一个版本已经被用于为电影和视频游戏创作概念艺术。与它一样,英伟达 计划在 GitHub 上提供 GauGAN2 的代码,同时在 Playground 上提供交互式演示,Playground 是 英伟达人工智能和深度学习研究的网络中心。像 GauGAN2 这样的生成模型的一个缺点是存在偏差的可能性。例如在 DALL-E 的案例中,OpenAI 使用了一种 CLIP 模型来提高生成图像质量,但在一项研究中发现,CLIP 对黑人照片的错误分类率更高,并且存在种族和性别偏见问题。英伟达暂不会对 GauGAN2 是否存在偏见给出回应。英伟达发言人表示:“该模型有超过 1 亿个参数,训练时间不到一个月(还在 demo 阶段),训练图像来自专有的风景图像数据集。因此 GauGAN2 只专注于风景,研究团队还对图像进行审核以确保图片中没有包含人的场景。”这将有助于减少 GauGAN2 的偏见。目前,GauGAN2 已经可以试完,有使用过或是想要去体验的可以在留言区谈论体验感受呦~
本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
据悉,英伟达GeForce RTX 4090系列显卡于10月15日正式线下开售,近日业内相关的媒体对其进行了性能测试对比,结果发现无论是压力测试、跑分还是帧数相比以往的旗舰系列均得到极大提升。
关键字:
英伟达
GeForce RTX 4090
自从上个月RTX 4080 12GB版发布之后,这个型号的显卡就受到了很多网友的质疑,认为英伟达将其归为“80系”就是为了卖高价。在收到大量玩家的批评与不满后,英伟达突然宣布取消发售RTX 4080 12GB版显卡。
关键字:
英伟达
显卡
10 月 2 日消息,亚洲科技出版社表示,芯片大厂英伟达打算与苹果公司做同样的事情,他们拒绝了台积电 2023 年的涨价计划。
关键字:
苹果
英伟达
台积电
于是众多的媒体和机构就表示,整个晶圆市场,接下来可能会面临产能过剩的风险,分析机构Future Horizons甚至认为明年芯片产业至少下行25%。
关键字:
苹果
英伟达
台积电
科技公司们认为,收购将使英伟达控制一个重要的供应商,该供应商向苹果、英特尔、三星电子、亚马逊和华为等公司授权基本的芯片技术,同时也向不计其数的中小技术企业提供授权。总部位于英国的ARM公司将芯片设计和相关软件代码授权给所...
关键字:
英伟达
ARM
半导体公司
在去年九月,英伟达宣布以400亿美金收购ARM时,就注定这场收购不会太顺利。因为一旦ARM成功被英伟达收购,这将使ARM改变在全球半导体市场中的中立立场,因为ARM的很多客户,都是英伟达的直接或者间接的对手。除此之外,还...
关键字:
英伟达
ARM
半导体
当地时间9月20日晚间,英伟在2022秋季GTC大会上发布车载芯片Thor,单颗算力达到2000TFLOPS。此前,英伟达曾发布自动驾驶芯片Altan,单颗算力为1000TFLOPS,原本预定2024年上市。在推出Tho...
关键字:
英伟达
Thor芯片
特斯拉
英伟达放弃收购软银集团(SoftBank Group)旗下ARM之后,各方势力再次粉墨登场,开启新一轮的争夺。9月21日,据韩国媒体EDAILY报道,三星掌门人李在镕获得特赦之后,开启欧洲行程并出现在英国。而ARM恰好是...
关键字:
三星
ARM
英伟达
9 月 21 日消息,据媒体报道,英伟达 2020 年 9 月 13 日宣布的 400 亿美元收购 Arm 的交易,由于在监管方面面临重大挑战,最终以失败告终,英伟达和 Arm 的拥有者软银集团,在今年 2 月 14 日...
关键字:
ARM
英伟达
软银集团
美国对中国芯片技术的一系列围追堵截政策,正在反噬美本土芯片企业。据彭博社报道,拜登政府计划对中国实施更广泛的芯片技术限制,可能会对向中国出口人工智能芯片与芯片制造设备的企业设置更多条件,这使得美国的芯片企业备受压力。
关键字:
华盛顿
英伟达
芯片限制
据业内消息,昨天英伟达CEO黄仁勋在GTC 2022发表演讲,老黄表示Ada Lovelace正在为未来虚拟世界铺路,随即宣布了英伟达正式推出基于Ada Lovelace架构的GPU GeForce RTX 4090和1...
关键字:
英伟达
Ada
黄仁勋
RTX 4090
据业内消息,英伟达近日发布了全新一代整车级车载芯片方案Drive Thor(计算平台),英伟达表示Drive Thor可以统一包括自动/辅助驾驶以及车载娱乐功能等在内的所有汽车数字功能的实现,驾驶员甚至可以用人工智能为后...
关键字:
英伟达
车载芯片
Drive Thor
极氪
NVIDIA GeForce RTX 3060 显卡是NVIDIA公司生产的显卡。GeForce RTX™ 30 系列 GPU 强劲的性能满足玩家和设计者。产品采用第 2 代 NVIDIA RTX 架构 - NVIDIA...
关键字:
英伟达
RTX 3060
8GB
除了收购 Linutronix 这个以实时 (RT) 内核补丁和其他贡献而闻名的公司,以及在 6 月收购 Codeplay Software 之外,英特尔今天还收购了另一支开发团队 ——ArrayFire,进一步推进他们...
关键字:
英特尔
英伟达
GPU
半导体行业的纳米技术目前竞争十分激烈,虽然行业处于绝对的垄断,但是几家目标公司竞争也十分残酷。其中老大哥台积电目前占据行业内绝对优势。
关键字:
台积电
英伟达
AMD
芯片
根据目前车载芯片市场情况来看,无论在技术先进性、性能指标,还是量产交付能力方面,英伟达Orin芯片是近乎垄断的,而随着大国之间的竞争和对半导体行业的限制,未来有可能将会对中国新能源汽车市场带来冲击。
关键字:
英伟达
车载芯片
据报道,美国当地州府官员透露,台积电美国工厂的主要建设工作已经完成。实际上,早先上梁典礼的举办就意味着工厂的基础设施差不多完工,后面就是要安装设备、调试了。
关键字:
台积电
英伟达
AMD
芯片
据报道,近日美国政府要求两家美国芯片设计公司停止向中国出售顶级计算机芯片。
关键字:
英伟达
AMD
英特尔
据悉,台积电2nm技术和3nm技术相比,功效大幅往前推进,在相同功耗下,速度增快10~15%,而在相同速度下,功耗则能够降低25~30%。
关键字:
台积电
英伟达
AMD
芯片