自(zì)聊天机器人(rén)ChatGPT火爆以来,微(wēi)软公(gōng)司创始人比尔·盖茨已多次公(gōng)开谈论人工智(zhì)能话(huà)题。在最近的一次采访中(zhōng),他再(zài)次表示:“AI可能会(huì)让科技(jì)行业(yè)迎来一次剧烈(liè)的洗牌”。
这个(gè)结论是他在当(dāng)地(dì)时间2月20日接受《In Good Company》节目专访时(shí)提出(chū)的。
他(tā)预期,AI的发展可能会(huì)威(wēi)胁到谷歌的(de)市占率,因为(wèi)微软在AI方面的行动相当迅速。而最(zuì)终科技巨(jù)头(tóu)将把(bǎ)AI整合(hé)成用户的“全能助(zhù)手(shǒu)”,包揽一切应用,与人(rén)们进行沟(gōu)通(tōng)并(bìng)提供建议,可(kě)以取代亚马逊、Siri或Outlook等应(yīng)用。
大佬(lǎo)口中全(quán)能(néng)助手(shǒu)的到来(lái)可能尚需时日,但由(yóu)ControlNet引发(fā)的又一(yī)次AI绘画浪潮,让AIGC在ChatGPT的话题(tí)热点包围(wéi)中杀出(chū)重围(wéi)。
01
ControlNet颠覆AI绘画新(xīn)玩法
AIGC向(xiàng)可控(kòng)靠近
以AI绘画(huà)为代(dài)表的AIGC上一次爆火的时(shí)候,还是2022年8月,在(zài)美国(guó)科罗(luó)拉多州(zhōu)举办的新兴数(shù)字艺术家竞赛中,一幅名为(wèi)《太(tài)空歌剧(jù)院》的作品获(huò)奖。
随后(hòu)各大(dà)厂商的(de)AI绘(huì)画(huà)软件被广大网友熟知并体验,Stable Diffusion便是其中代表(biǎo)。
用(yòng)户们可(kě)以在应用中输入一(yī)组关键词或者一(yī)张(zhāng)照片,就能获(huò)得一幅AI创作(zuò)的画作。
作画的关键就是所输入的文本。同一组(zǔ)关键词也(yě)可以创作出很多张风格不一样(yàng)的画作(zuò),这让创作的过(guò)程就像开盲盒。
很多(duō)用户很喜欢这种不确定的惊喜,他们会将生(shēng)成(chéng)的美图当做头(tóu)像(xiàng)。而另一部分(fēn)喜欢(huān)翻看AI绘画的“翻车(chē)”作(zuò)品。在社交媒体(tǐ)上(shàng),许(xǔ)多用户分(fēn)享AI“翻车(chē)现场”,例如,一位网(wǎng)友的小狗照片被AI画成了“肌肉(ròu)男”,还有网友的个人照片(piàn)被AI识别成了建筑。
而如(rú)今随(suí)着ControlNet的出(chū)现与加持(chí),以往AI绘(huì)画的填写关键(jiàn)词(cí)游戏可能要被颠覆了(le)。
ControlNet是一位正在(zài)斯(sī)坦福(fú)读博的(de)中国人张吕敏创作(zuò)的一(yī)种(zhǒng)基于控制点的图像变(biàn)形(xíng)算法,主要(yào)用于数字图(tú)像处理、计算机视(shì)觉和计(jì)算机图(tú)形学等领域。
其(qí)SD插件一经发布,在短(duǎn)短的(de)两天内(nèi)便成为了(le)AI绘画领域最新的热点。
在此之前(qián),大(dà)家用了很(hěn)多方法想让AI生成的结(jié)果(guǒ)尽可能的符合(hé)要求,但是都(dōu)不尽(jǐn)如人意,它的出现代(dài)表着(zhe)AI生成开始进入真正的可控时(shí)期。
因为ControlNet可以直接提取画面的构图,人物的姿(zī)势和画面的深度信息等(děng)。有(yǒu)了它的帮(bāng)助,就不用(yòng)频繁的用(yòng)提示词(cí)来碰(pèng)运气,抽盲盒(hé)式的创作了。
通俗的说ControlNet相当于给AI绘画加了“魔法”,不少(shǎo)博(bó)主(zhǔ)的作品已经获得了大量(liàng)的浏览(lǎn)量,“viggo”就是(shì)其中(zhōng)之一,他用朋友的照片(piàn)直接带她们走进动漫世界。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插件拓展找到对应的(de)关键词;最(zuì)后用(yòng)ControlNet插件绑定(dìng)骨骼(gé)开始(shǐ)换关键词试效(xiào)果。
通过图(tú)片就可以(yǐ)看出来,效果十分惊艳。
更厉害(hài)的是,除(chú)了真实的(de)照片,草(cǎo)图(tú)也可以加上“魔(mó)法”,知(zhī)乎大牛(niú)“DevPoint”和“逗(dòu)砂(shā)”介(jiè)绍到ControlNet还能实现(xiàn)线(xiàn)稿转(zhuǎn)全彩(cǎi)图。大神张吕敏其本(běn)尊也亲自回应(yīng)。
不得(dé)不说当下AIGC已经变得越来越强大,甚至输出的作品都已经能以(yǐ)假(jiǎ)乱真了。
02
难辨虚实,AIGC技术力爆发
警惕安全问题
近日,“苏州金鸡湖有游艇party”的消息火遍网(wǎng)络,而经过警方(fāng)辟谣这所谓(wèi)的“party”可(kě)能是全国(guó)第一起AI绘图诈骗。
由(yóu)于(yú)这个活动里面给(gěi)出的美女照片都是AI制作的真人照(zhào)片绘图,因为太逼真,被大家当成(chéng)真事(shì)传播了。
不(bù)过仔细(xì)观察可(kě)以发现(xiàn),活动发起者提供的照片中有个很(hěn)大的漏洞可(kě)以发现并非真人,而是(shì)AI绘(huì)图,那便是图片(piàn)中(zhōng)女性的手指部(bù)分有的存在异常。
有行业人事表示:“现在(zài)因为手指部分的绘画(huà)算(suàn)法比(bǐ)较复杂,AI还不太(tài)会画人的手,但最(zuì)新看到的图(tú)片已(yǐ)经有(yǒu)越来越完美的(de)AI模型出现,以后可能就完全没有漏洞(dòng)了。”
类似的AI作图(tú)诈(zhà)骗在国外也已有(yǒu)发(fā)生。据英国广播(bō)公司报道,土耳其地震(zhèn)期(qī)间,有Tiktok用户使用(yòng)AI合(hé)成(chéng)了儿童受灾的假照片(piàn)发布到网络(lu一升等于多少毫升应该是1000,一升等于多少毫升mlò),以此诱(yòu)骗善(shàn)良的人打赏“捐(juān)助”从而实施诈骗。
目前随(suí)着技术发展(zhǎn),AIGC已经能(néng)做出真人(rén)照片(piàn)般(bān)的绘(huì)图效果(guǒ),如果这样的图片被用来诈(zhà)骗,将(jiāng)非常可怕。
此(cǐ)外AIGC还(hái)引(yǐn)发了很多担(dān)忧,一方面,批(pī)判者认(rèn)为AI在(zài)“学习”了大量(liàng)前人的作(zuò)品之后,其(qí)创作没(méi)有任(rèn)何(hé)情绪(xù)和(hé)灵(líng)魂,难以和人类的艺术创作相提并论。
另一方(fāng)面,AIGC背后的版权、目(mù)前都并没有得到有效的解决,还(hái)有AIGC会(huì)不会(huì)代替人类(lèi)“至(zhì)高无上”的创(chuàng)意(yì)。
马斯(sī)克也强调(diào),人工智能(néng)的安(ān)全(quán)问题需要(yào)得到重视,太(tài)晚就来不及(jí)了(le)。
03
AIGC下一站(zhàn)除了视频,还(hái)有(yǒu)远(yuǎn)方
技术都(dōu)是(shì)有两面性的,潜(qián)在的危害并不能掩盖其光(guāng)辉(huī)的贡献(xiàn)。现在(zài)看来,人工(gōng)智能技术(shù)将是第四次工业革命的核心驱(qū)动力量,将创造(zào)新的增长奇迹。
过(guò)去一年,人工智能在(zài)技术和商业层面都有(yǒu)了巨大(dà)进展,AI绘画就是人工智能技术发生方向性(xìng)改(gǎi)变的一个代表。其下一(yī)站(zhàn)或许(xǔ)就是视频。
此前,Meta和谷歌(gē)先后发布(bù)了(le)几条引爆(bào)科技圈(quān)的短视频(pín)。这些(xiē)视频引发关注并非内容做得多优(yōu)秀,反而都非常简单(dān),比如一匹正在(zài)喝水(shuǐ)的马(mǎ),一只(zhǐ)画(huà)画的(de)玩具熊,或者一段骑摩托(tuō)车的第一视角(jiǎo)录像,随便一一升等于多少毫升应该是1000,一升等于多少毫升ml个有手机(jī)的(de)人都可以随手(shǒu)录下一(yī)段。
但这些短视(shì)频的创(chuàng)作方式非常简单,创作(zuò)者仅仅需要向AI输入一段话,甚至(zhì)只是(shì)说一(yī)下(xià)要求(qiú),AI就可以(yǐ)根据(jù)需要生成一段视频。
谷歌发布(bù)的(de)两(liǎng)个AI生成视(shì)频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高(gāo)清(qīng),与(yǔ)Meta的(de)Make-A-Video没(méi)有太多的差别(bié)。
在(zài)Make-A-Video公(gōng)布了AI生成的(de)视频后,AI圈(quān)就已经玩(wán)了一波梗,一个(gè)能够(gòu)做出(chū)更(gèng)高清视频(pín)的AI还不(bù)足以(yǐ)在短时间内戳(chuō)中兴奋点。
Phenaki更加令人震(zhèn)惊(jīng)的地方在于,它(tā)可以制作出超过2分钟的(de)连贯(guàn)的也有确切(qiè)内容的(de)视频,这才是(shì)真(zhēn)正让人们(men)感到惊(jīng)喜的地方。因为无论AI生成(chéng)的(de)视频多(duō)么高清,也只能是(shì)为(wèi)内容生产者提供一个灵感,一个素(sù)材,一个过场动画(huà)。
不过能(néng)够制(zhì)作出有(yǒu)具(jù)体剧情内容的视频就意味(wèi)着,一些视频创作由AI代替人(rén)工完成(chéng)已经初步有了可能(néng)。
当下AI的(de)发展速度已(yǐ)经超(chāo)过(guò)大部分(fēn)人的想象。内容(róng)产业的本质是供(gōng)给创造需求,AIGC作为全(quán)新(xīn)的内容(róng)生产(chǎn)方式(shì),可(kě)以为内(nèi)容产业带来更新的(de)内容风格(gé)、更快(kuài)的生(shēng)产(chǎn)速度,更低的生(shēng)产成本,这无疑会驱(qū)动内容产业的(de)大爆(bào)发。
除了AI绘图、视(shì)频,AIGC技术还能应用于音乐、代(dài)码、机器(qì)人动作等(děng)多种内容形式的生成。不难发现(xiàn)该项技术不仅在游戏等行(xíng)业(yè)能得(dé)到有效应用,对于(yú)下一代互联网各种元(yuán)素的构建亦有关键意(yì)义。
从商(shāng)业化(huà)的(de)角度来看,文化娱乐、教(jiào)育、传媒等诸多领域(yù),本(běn)身就对(duì)基于AI的可视化(huà)内(nèi)容(róng)有强(qiáng)烈需(xū)求。
因(yīn)此,AI绘画(huà)及(jí)视(shì)频或(huò)不是结果(guǒ一升等于多少毫升应该是1000,一升等于多少毫升ml),而只是(shì)AI进程(chéng)中(zhōng)的一块重(zhòng)要(yào)拼图,有望在(zài)技(jì)术更新(xīn)的加持下实现(xiàn)更大的应用价值。
AI从理解内容,走向了可以生成内容(róng),甚至能够创(chuàng)造出独立(lì)价值和独立视(shì)角的(de)内容。AIGC的再次出圈(quān),更代表着未来的先进生(shēng)产力即将到(dào)来(lái)。
04
紧抓大(dà)模型与算力,牢固AIGC底(dǐ)座
从技术的(de)发展也(yě)可以(yǐ)看出,在语(yǔ)言大模型、图像大模型之后(hòu),多模态大模型已经成为了新的趋势。
大模型(xíng)被(bèi)誉为当前人工智能发展的智(zhì)能底座,是(shì)全球竞争最激烈的研(yán)究方向之(zhī)一,包括谷歌、亚马逊、百度、阿里、腾讯(xùn)等众多头部企业都在(zài)竞相(xiāng)发(fā)力。
不(bù)过训练大(dà)模型的确价格不菲,以国盛(shèng)证券发布的《ChatGPT需要(yào)多(duō)少算力》报(bào)告估算,GPT-3训练一次(cì)的成本约为(wèi)140万美元。而(ér)对于一些更大(dà)的LLM(大型(xíng)语(yǔ)言模型),训练成(chéng)本则介于200万(wàn)美元至1200万美元高价之间。
以ChatGPT在2023年1月的独立访(fǎng)客(kè)平均数(shù)1300万计算(suàn),其对应芯片需求为3万(wàn)多(duō)片英伟达A100 GPU,初始投入成本约(yuē)为8亿(yì)美元,每日仅电费就在5万美(měi)元左右。
此外不论是ChatGPT还是AIGC,都离(lí)不开庞大算力支(zhī)持(chí)。在关注各类大(dà)模型的发展(zhǎn)同时(shí),更应该(gāi)关注算(suàn)力网络的建设。
算力(lì)网络正驱动(dòng)AI产业发展进入史诗(shī)级(jí)加(jiā)速进(jìn)程,让AIGC及通用AI这(zhè)一人工智能发展的终极目标离得更近。
因为算力可(kě)以对突破性技术创新(xīn)提(tí)供(gōng)大力的支(zhī)持。这方(fāng)面,多模态大(dà)模型(xíng)是典型。作(zuò)为面向(xiàng)未来强人工(gōng)智能、通(tōng)用人工智(zhì)能的(de)重要技术创新,多模(mó)态大模型已经(jīng)在人工智能领域提(tí)出了很多年,业界也(yě)有不(bù)少技术突破,但是(shì),多模态大(dà)模(mó)型进一(yī)步(bù)往下走,算力需求呈几何式上升(shēng),一般的算(suàn)力(lì)基础设施很快将难以胜(shèng)任(rèn)。
从图像(xiàng)、文字、语音(yīn)单独一项的(de)训(xùn)练(liàn),到双(shuāng)模态、三模态的跃(yuè)迁,让人工(gōng)智(zhì)能可以灵活(huó)应对不(bù)同模态的转化、像(xiàng)人与世界交互一样自然,这方面,由算力网络(luò)来驱动将有明显优(yōu)势。
此(cǐ)外,还有很多(duō)需(xū)要爆(bào)发式增长的算力来支(zhī)撑的技术创新,将在人工(gōng)智(zhì)能算力网络(luò)支撑下快(kuài)速推(tuī)进(jìn)。
AIGC已经露出(chū)曙(shǔ)光(guāng),期待在大模型和大算(suàn)力(lì)的支持(chí)下AIGC能持(chí)续(xù)颠覆内容生产的方式(shì),将创造的边(biān)际成本降低,让万(wàn)众受益(yì)。
未经允许不得转载:绿茶通用站群 一升等于多少毫升应该是1000,一升等于多少毫升ml
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了