AI绘画的“小秘密”都在这一篇文章里******
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
上传一张图片,或者输入一些简单的关键词,系统就能自动生成一张卡通图像……最近一段时间,AI绘画开始在互联网社交平台走红。
AI绘画,顾名思义就是利用人工智能进行绘画,是人工智能生成内容的典型应用场景之一。其主要原理是收集大量已有作品,通过算法对其内容和风格特征进行解析,最后再生成新的作品,所以算法是AI绘画的核心。
当前,“凭空”生成图像的AI绘画,其实也会动辄“翻车”:也许上一秒AI通过你的照片绘出的是一张充满艺术感的二次元画像,下一秒你的宠物猫、狗则可能被画成可爱少女或肌肉猛男。
事实上,AI绘画早已火爆全球。第一张公开展出的、由人工智能创作的绘画作品《埃德蒙·贝拉米的肖像》曾于2018年在佳士得拍卖行以43.25万美元成交,那是一张由机器学习了从14世纪到20世纪的1.5万张肖像画之后自动生成的一张肖像画作品。
AI绘画是如何实现“凭空”生图的?除了娱乐外,AI绘画还有哪些潜在的应用前景?
从“以图生图”到“语音生图”
2022年,由人工智能创作的《太空歌剧院》一度火出圈。在美国科罗拉多州举办的新兴数字艺术家竞赛中,《太空歌剧院》获得“数字艺术/数字修饰照片”类别一等奖。它的构图、配色以及画面的细节堪称精致。然而,这个作品的创作者不是艺术家,而是来自美国科罗拉多州的游戏设计师。
这位游戏设计师在一个名为“Midjourney”的AI创作工具里,先输入几个关键词,如光源、构图、氛围等,得到了100幅作品,再进行约80小时的修图修饰,最终选出3幅作品,最后把图像打印到画布上。
通过简单交互式对话在短时间内生成的“艺术”作品,让人类艺术家展开了一场关于“AI绘画作品参赛是否属于作弊”的争论。这场声势浩大的争论也令大众直观地意识到如今的AI绘画水平已经发展到了何种程度。
“人工智能在艺术方面的创作最早可以追溯到上个世纪末,当时的人工智能绘画技术叫作‘图像的风格化滤镜’。”中国科学院自动化研究所多模态人工智能系统全国重点实验室研究员董未名说,最初的AI绘画方法比较简单,比如一张普通的照片,通过一些图像处理的算法,把照片像素进行几何或者色彩上的变换,然后再调节不同参数,就可以模拟出类似油画或者水彩画的风格。
经过20年左右的发展,目前基于不同类型或者模态元素的AI绘画发展情况不尽相同,发展最久的是“以图生图”,再到近期火爆的“文+图”生图。当然,也有团队已经研发出由语音生成图像的技术。
AI绘画主要依靠三种技术模式实现
董未名介绍,目前AI绘画主要借助图像风格迁移技术、图文预训练模型和扩散模型实现。
“图像风格迁移技术指的是图像处理算法通过对输入的真实图像内容特征和对参考的艺术图像风格特征的提取,实现真实图像内容特征和艺术图像风格特征的融合,从而生成新的艺术图像。”董未名举例,如果将美国旧金山艺术宫的外景照片和印象派创始人莫奈绘制的作品,通过图像风格迁移技术进行融合,就能得到一张看起来像是由莫奈绘制的美国旧金山艺术宫的绘画作品。最初的AI绘画采用的正是这种技术。
不过,在董未名看来,图像风格迁移技术大多依赖的是生成式对抗网络(GAN)算法,它最大的问题是生成的绘画作品艺术性不强,笔触和构图让人觉得与真实的绘画有差距,所以长久以来,AI绘画一直“籍籍无名”。
当图像风格迁移技术还在挣扎于输出作品的审美问题时,图文预训练模型的出现,加速了AI绘画的崛起。
“依托图文预训练模型,只要输入一句话或者上传一幅风格明显的图片,算法就能将图像特征和文字特征‘对齐’。生成的绘画作品的内容特征和上传图片的内容相似,艺术性也比图像风格迁移技术生成的图片强很多。”董未名举例,比如支撑图文预训练模型的可对比语言—图像预训练(CLIP)算法,就是利用图文特征“对齐”的能力,再结合已有的生成模型,实现“以图生图”或者“图+文”生图。
不过,董未名坦言,图文预训练模型的推广也存在一些争议,有部分人认为,该模型在训练前期,需要用大量的图形处理器(GPU)进行数据训练,耗电量大、成本很高,而该模型的应用场景却不够清晰。但也有人认为,也许该模型未来可以打造为通用的人工智能模型,用它完成更多的算法作业,只是这还需要时间的验证。
诚然没有一项技术是完美的,这也为人类探究更先进的技术提供了无限动力。当下最流行的扩散模型便是其中之一。
“目前最新的AI绘画技术采用的就是扩散模型,这种模型可以把一个随机采样的噪声输入模型,然后尝试通过去噪来生成图像。”董未名表示,扩散模型也存在弱点,由于模型对图片内容识别的能力不足,或者难以完全理解识别文字的意义,以及训练数据的偏差,有时便会生成“四不像”的作品。此外,扩散模型生成图片的速度比较慢,目前还达不到实时生成图片。
互联网治理、元宇宙或潜藏应用前景
AI绘画目前的应用场景,更多聚焦于社交软件。近期在国内社交网络“火出天际”的AI绘画软件主要集中在小程序及App。随着AI绘画小程序的火爆,短视频平台抖音也迅速上线了AI绘画特效。同时,此前腾讯上线了“QQ小世界AI画匠”活动,百度也推出了首款AI艺术和创意辅助平台“文心一格”。
有了AI,人人都可以是艺术家。AI绘画的出现,恰如瑞士艺术家保罗·克利所言:“艺术不是再现可见,而是使不可见成为可见。”“AI现在已经完美实现了这一目标,人们可以通过机器计算来绘制出很多现实中见不到的场景。”董未名畅想,不远的将来,AI绘画或许还将展现更丰富的应用场景。
“现在网络上充斥着很多不良内容,这些内容为了逃避监管经常以绘画的形式出现,而当前很多内容识别模型对真实图片识别得很准确,但缺乏不良内容艺术作品的相关训练数据,所以对不良内容识别不准确。也许可以用AI绘画技术,积累不良内容艺术作品的数据,并用以训练识别模型,以提升互联网内容的安全监管能力和识别的准确率。”董未名建议。
在董未名看来,作为一种艺术呈现形式,AI绘画也将在元宇宙、设计、文旅等行业催生新的商业模式。例如AI绘画目前在AI辅助创作、短视频、影视制作和元宇宙等方面都有布局,因为这些赛道都离不开创意,AI绘画可以帮助创作者通过简单的特征输入,实现对其创意的预览,甚至可以直接进行创作。
不过,董未名并不讳言,当下AI绘画仍然存在版权争议问题。AI绘画的核心是模型,而训练模型需要使用大量图像、文本数据。对于未经授权的图片,经过运算之后所生成的图像版权归属尚难界定。“有的画家风格特别明显,如果用画家的画去训练算法模型生成作品,那最后的版权属于谁呢?”董未名提出的问题,正是多数AI绘画作品所面临的现实问题。
AI绘画掀起了一场资本的群体狂欢,希望有一天它能走出“照猫画虎”的尴尬,真正服务艺术创作、创造更多价值。(科技日报记者 金凤)
智慧城市建设 让城市治理变“智”理******
河北省廊坊市开发区智慧城市运营中心展厅电子沙盘。赵永辉摄(人民图片)
日前,在山东省东营市东营区政务服务大厅政务“晓屋”内,工作人员演示使用流程。刘智峰 摄(人民图片)
日前,在江西省赣州市蓉江新区赣南数据湖示范中心,工作人员检测记录数据运行机柜和处理器运行情况。朱海鹏摄(人民图片)
位于海南省澄迈县的中海石油码头有限公司智能化仓库。新华社记者郭程 摄
红绿灯实时感知车流量、自动优化配时,提高车辆通行效率;门禁系统自动识别身份,供水系统实时监测水质,提升社区居住品质;政务服务平台集合预约挂号、公司注册等功能,“数据跑”替代“群众跑”……从贯穿“数字河流”推动城市治理现代化,到“一城一策”助力城市产业智能化,再到激发“乘数效应”服务百姓数字生活,借助5G、大数据、云计算、人工智能等新技术,加速推进的智慧城市建设正不断为城市治理赋能,让城市治理变“智”理。
党的二十大报告提出,“加强城市基础设施建设,打造宜居、韧性、智慧城市。”建设新型智慧城市,是群众对更美好城市生活的向往,也是城市高质量发展的必然追求。为此,人民日报记者采访了一些正在建设中的智慧城市,记录新技术给我们的生活带来的改变。
智慧“晓屋”:
政务服务24小时“不打烊”
坐落于珠江入海口的番禺区,地处广东省广州市中南部,是粤港澳大湾区的中心位置。漫步在番禺区的街道,随处可见5G基站、智慧灯杆等高科技设施。数字化正与这座城市深度融合。其中,一座座政务“晓屋”,成为番禺独特的政务名片,真正做到政务服务24小时“不打烊”。
“您好,欢迎使用‘晓屋’,我是‘云坐席’,请问您要办理什么业务?”戴女士是番禺区某独资企业办税员,不久前,她来到区政务服务中心办理企业注销业务。来之前,戴女士提前做好了预约,手机扫描便打开了政务“晓屋”的玻璃门,眼前的大屏幕上,工作人员面带微笑地询问起来。
政务“晓屋”是一座类似于电话亭的玻璃房,通过屋内的“云坐席”,使用者可以办理咨询、辅导等以前在大厅才能办理的业务。此外,政务“晓屋”还为企业和群众提供远程“面对面”政务服务以及“手把手”全程指导。
在了解戴女士需要进行企业注销,但还未办理税务注销时,“云坐席”首先为她邀请了税务部门“云坐席”。
之后,在办理清税过程中,戴女士将申请材料通过高拍仪展示完成初步审阅,并根据指引,登录“粤税通”小程序进行信息填写与材料上传。几分钟内,她就完成了全部申请流程。清税申请提交后,因外地户籍想要咨询注销后社保待遇领取的问题,税务“云坐席”又为她邀请了社保部门的“云坐席”进行多方实时沟通,答疑解惑。
很快,当戴女士还在咨询社保问题时,她就在手机上收到了清税证明。办事、咨询同步进行,税务、社保多方互动,政务服务智能化刷新了办事体验。税务注销业务完成后,税务“云坐席”又为她邀请了市场监管局“云坐席”,进行营业执照注销业务的办理。
最后,在“云坐席”的指引下,戴女士打开桌子下方快递柜,将申请表、营业执照原件等资料放入邮政信封中,填好邮寄信息。不一会儿,手机上就收到了营业执照注销证明。
戴女士对人民日报记者表示,以往,办理企业注销需要来回跑税务、市场监管等服务窗口,折腾一两天都是很常见的,没想到通过政务“晓屋”竟然可以一次办成,称得上是“进屋办事,少交快办,办事不用跑”,为民众带来的便利是实实在在的。
对这种便民服务深有感触的还有家住市桥街的黄先生,今年准备结婚的他刚购买了一套婚房,需要办理公积金提取,从住所到区政务服务中心,坐公交往返需要2小时,此外,还要算上等待、办理的时间,费时费力。
因此,黄先生决定试试附近新设的政务“晓屋”。
利用午休时间,黄先生走进街道内安放的政务“晓屋”,接待黄先生的是一位“数字业务员”。当他咨询如何办理公积金时,“数字业务员”马上询问他的具体需求,如想要办理哪类公积金,是租房使用还是购房等。之后,黄先生又说了自己想要提取的金额,并询问了所需材料细节,“数字业务员”都一一作答。材料准备好后,黄先生在政务“晓屋”上传资料,完成了公积金的提取,整个过程用了不到半个小时。
黄先生对人民日报记者表示,政务“晓屋”服务帮他节省了不少时间:“‘数字业务员’的问答交流与真人很像,就像有一个24小时待命的办事员一样,非常方便。”
让戴女士和黄先生感到方便的服务背后,是番禺区政务服务数据管理局与百度智能云在智慧城市建设上做出的努力。小小的政务“晓屋”玻璃房内有“大乾坤”,在不到2.5平方米的政务“晓屋”内,应用了百度OCR(文字识别)技术、智能语音技术以及数字人技术。
目前,番禺区已在全区布设80台政务“晓屋”,可办业务数量2305项,业务涵盖32个部门和镇街,“云坐席”账号增加至179个。以政务“晓屋”为跨域通办载体,实现北京、浙江等9省市20个地区互联互通。番禺区政务数据管理局也凭此荣获“2021年度政务服务与优化营商环境示范单位”。正如番禺区政务服务中心负责人所说,政务“晓屋”在“政务下沉”的同时实现了“数据上云”,做到“一屋通晓、一屋通办”。
“一网统管”:
落实“人靠谱,事办妥”
今年,在关于智慧城市建设的话题中,“一网统管”备受关注。
“一网统管”是指在开展城市综合管理服务平台建设和联网工作的基础上,全面加快建设的城市运行管理服务平台。
城市治理“一网统管”是城市综合实力的体现和运行效率的保障。京东云依托智能城市操作系统,输出数智供应链能力,打造城市运行支撑平台和城市运行能力中心的“双中台”体系,服务上海市普陀区推进“一网统管”实践创新,实现“一屏观天下,一网管全域”,深化场景建设和基层治理。
近日,在普陀区城市运行管理中心指挥大厅里,“数智普陀·苏河秀带数字治理”的大屏上出现了“违规停放非机动车”的警示信息。信息显示,一位行人将非机动车随意停放在苏河沿岸。这一幕第一时间被“苏河之眼”捕捉,根据内置的模型算法进行提示,并将预警事件推送到普陀区城市中心综合受理派单管理系统。根据前期设定的处置流程,系统自动派单到相关工作人员的手机端,方便工作人员进行核查和处置。同时系统也将预警实时上传到“数智普陀·苏河秀带数字治理”的大屏上。
“之前发现违规停车问题主要靠人工巡查和现场劝阻,治理成效很低。现在有了大数据治理手段,进行事件的智能发现和自动派单,我们开展工作有的放矢,不仅减少了人员投入,还大大提高了工作效率。”谈到如今的工作,城运中心的一线工作人员竖起了大拇指。
运用数字孪生技术和AI(人工智能)算法,识别沿岸乱扔垃圾、违规停车等行为,同时智能监控水质环境和水位变化,对事件进行“一口派单”,精准推送到各级处置人员终端……苏河治理的数字化转变,是京东云助力普陀区政府打造“数智普陀”的一个缩影。京东云以数智技术助推普陀区治理数字化转型、“一网统管”建设,目标是建设“数字孪生无处不在、生命体征无所不知、精准服务无处不享”的城市运管服平台。
2021年,《上海市“一江一河”发展“十四五”规划》提出将苏州河沿岸打造成为宜居、宜业、宜游、宜乐的现代生活示范水岸,实现从“工业锈带”向“生活秀带”“发展绣带”的转变。京东云助力普陀区打造“普陀区苏河秀带数字治理”应用场景,通过苏河状态一网感知、苏河运行一网治理、数字孪生三屏联动的信息化手段,按下了“半马(半程马拉松)苏河”数字化转型的“加速键”。
科学治理,数据先行。有别于“人工巡查”的被动处置模式,京东云以物联、数联、智联为基础,利用AI算法实现了“智能巡查”的主动发现,可以“一屏识别”乱扔垃圾、沿岸垂钓、占道经营等情况,利用视频数据和传感器数据,快速预判,并将相应事件汇总到普陀区城市中心综合受理派单管理系统“一口派单”,精准对接到区—街镇—片区进行三级处置,并对处置效果进行考核问效,形成事件智能发现—预警—派单—治理—问效的全流程闭环,实现苏河两岸的高效治理和集约化服务。
海量的数据汇聚,不仅在信息维度上,将“物理河流”映射为“数字河流”,还丰富了分析研判模型,增强了风险预警能力和管理处置水平,为管理者“靶向施策”提供依据,大大提高了城市管理预警能力。
近年来,“一网统管”已经成为国家推进智慧城市建设的重要举措。
普陀区应急管理局党委书记、局长,普陀区城市运行管理中心主任张军表示,目前,普陀区正在落实“人靠谱(普)、事办妥(陀)”思想共识和行动自觉,在京东云的技术输出和集成能力的协助下,普陀区城运中心重构管理流程,打造一屏发现、“一口派单”、一站处置、一网评效、一键搜索的“一网统管”全流程闭环工作体系。高效处置每件事,做到早发现、早预警、早研判和早处置,实现城市治理由被动处置向主动发现转变,由人力密集型向人机交互型转变,由经验判断型向数据分析型转变。
“城市大脑”:
让城市治理更高效
如何更好推动城市治理、提高城市治理现代化水平?
“城市大脑”技术为回答好这个问题提供了一个新的选择。“城市大脑”是为城市生活打造的一个数字化界面。市民凭借它触摸城市脉搏、感受城市温度、享受城市服务,城市管理者通过它配置公共资源、作出科学决策、提高治理效能。
北京市海淀区就是“城市大脑”技术的受益者。
近年来,海淀区发展迅速、人口密度大。传统以人工为主的城市管理方式难以满足城市的快速发展和新形势下社会治理的新要求。加之,海淀区聚集了大量的科技工作者,对科技赋能城市精细化治理提出了更高的期盼和需求。
基于海淀区“城市智慧大脑”的建设需求,2018年,海淀区政府与百度签署《建设海淀区“城市大脑”合作备忘录》,双方将利用云计算、大数据、人工智能等新技术,在城市管理、交通治理、环境保护、公共安全等领域率先应用“城市大脑”,加快解决城市运行中的痛点、难点问题,在科技城市建设、提升城市管理水平等方面作出有益探索。
在海淀“城市大脑”的建设过程中,对渣土车的治理是一个具有代表性的治理需求。海淀区是一个建设大区,高峰时期约有300个工地在施工,渣土车运输带来了许多难题。渣土运输方多点分散,违法成本低,经常出现乱倾倒、闯红灯、未苫盖等现象;同时渣土车治理涉及的管理部门多,数据没有共享,难以形成治理合力,传统治理手段成效不明显。
通过与海淀区的合作,百度将自己的技术能力充分与实际场景结合,提升技术实用性的同时,为智慧城市建设打造了“样板间”。
“百度AI算法在渣土车车型的识别模型建设方面表现最为突出,渣土车捕获率在各家算法中最高。”海淀区城市管理指挥中心党组成员、副主任巩振文说。数据显示,“智慧大脑”支持下的渣土车治理,可以实现渣土车抓拍数量提升近30%,系统对渣土车号牌遮挡等违法特征识别的准确率达到95%以上,渣土车行驶轨迹预测分析准确率超过60%。在“城市大脑”的帮助下,渣土车违规率从26%下降到了4%。通过数字技术手段有效降低管理成本,提升治理效能。
百度智慧城市资深解决方案架构师张英博说道,“智慧城市的未来发展,一定是围绕城市治理需求,真正实现智能化升级。”在张英博看来,这需要产品与解决方案提供商具有强大的“技术+实战”能力。
“城市治理当中具有丰富的应用场景,为人工智能与云技术的发展提供了广阔的空间,技术的发展又为各类城市低门槛使用人工智能提供了可行性。”百度集团执行副总裁、百度智能云事业群总裁沈抖对人民日报记者说,“目前,百度智能云已经形成了70余个城市智慧化场景应用解决方案,能够有效提升城市治理的精细化、智能化能力。面向未来,云计算必须与实体经济深度融合,百度智能云将把算力应用到城市服务管理环节的关键场景当中,解决城市治理方面遇到的实际问题,紧抓自研技术,牢牢掌握智能化发展的主动权。”(人民日报海外版记者 杨俊峰)
(文图:赵筱尘 巫邓炎)