当下,AI 绘画技术发展迅猛,普通用户只需输入文本就能生成具有独特风格和想象力的图像近期的一项研究更是让 AI 在图像处理方面有了新突破,即直接生成单个或多个透明图层,实现图像分图层功能,超越了传统的抠图技术,引发广泛关注。
这项技术名为“LayerDiffusion”,由“ControlNet”的作者 LvminZhang 发布的新工具在介绍该技术之前,有必要了解一下其作者,他的前一个作品为 AI 绘画提供了关键技术突破StableDiffusion 诞生之初,虽然普通人可以通过简单输入文本输出高质量图片,但随着大量样本的加入,问题也逐渐暴露。
模型虽然强大,但生成的图像往往不受用户控制,要生成高质量可用的图片往往需要大量眼花缭乱的关键词,而普通用户的首要问题是无法找到合适的关键词“ControlNet”的出现很好地解决了这一问题,它可以直接输入画面的构图、姿势等深度信息,无需频繁使用关键词碰运气,手指等其他关键点的问题也迎刃而解。
这里就不详细讲述其深度发展过程了,后续有机会再向大家科普这位在 AI 绘画领域贡献颇多的大神作者回到“LayerDiffusion”,它与“ControlNet”一样,解决了文生图中的实际问题,生成了透明的 4 通道 RGBA 图像,效果不逊于商业抠图成果。
不仅可以生成单个透明图像,还能生成多层图像,分离图像元素和背景,是作图和抠图人士的理想工具“LayerDiffusion”利用大型预训练的潜在扩散模型创造透明图像,不仅可以生成透明图像,还能生成多层透明图层。
该项目已在 forge 的扩展上可用,经过测试,其功能强大,不仅支持直接生成透明图片元素,还可以在已有图片上生成与环境融合的透明图片网上调查显示,多数情况下,人们更喜欢直接生成的透明内容,而非之前的临时解决方案(如先生成图像再进行抠图处理)。
传统抠图技术通常基于颜色、纹理等特征进行分割,易产生边缘不清晰、细节丢失等问题,尤其在处理半透明效果或复杂边缘时困难较大而该技术则通过深度学习模型对图像进行更精细分析,识别出不同层次的物体和背景,分别绘制在不同图层上。
这种分图层技术不仅提高了图像处理效率,还保留了更多细节和信息,使处理后的图像更逼真自然尽管目前该技术的模型和部分代码已开源,但仍处于研究和商业化阶段即使在不成熟的情况下,也引发了大量关注和讨论人们对 AI 在图像处理领域的潜力充满好奇和期待,希望看到更多类似创新技术问世,进一步提升图像处理水平和效率。
除了图像处理领域,该技术的应用还可能延伸到其他领域,如动画制作、游戏开发、虚拟现实等例如,在动画制作中,通过 AI 绘画技术可更快更精确地绘制角色和背景,提高制作效率和质量;在游戏开发中,可利用该技术实现更逼真细致的场景和角色设计,提升游戏体验。
感兴趣的朋友可前往作者官网了解更多内容,别忘了下载 StableDiffusion 亲自体验当然,这对配置要求不低,没有一张性能强大的显卡可不行!全新影驰 GeForce RTX 40 SUPER 系列 GPU 是在 PC 上体验 AI 的最佳显卡系列,专用 AITensor Core 可提供高达 836AI TOPS,在游戏、创作和日常工作等方面提供革命性的 AI 性能。
今天就分享到这里吧,德斯软件资讯是一个软件分享基地,其中包括红包软件有微信,钉钉,支付宝,陌陌,QQ,万盛超市,载你耳边,和启优选,易品铺,哈聊精选,ULTRA,良优品,果海臻选,西梅甄选,nsgo,美彩优选,旺惠优品,优品盲盒,优合极速,U仔,旭禾优品,淘讯盲盒,奈斯特惠,淘利购,潮动力,萤火通讯,好选悦品,智云互享,知信,致美臻选,微信多开,微信分身等社交软件下载,软件自带功能有红包软件,红包辅助,透视,埋雷辅助,单透,埋雷软件,牛牛辅助,牛牛外挂,尾数控制,机器人等一些红包强项外挂辅助软件功能免费下载使用。