绿茶通用站群绿茶通用站群

作伴还是做伴哪个对,作伴还是做伴正确

作伴还是做伴哪个对,作伴还是做伴正确 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器(qì)人(rén)ChatGPT火爆以来,微(wēi)软公司创(chuàng)始人比(bǐ)尔·盖茨已多次公开谈论(lùn)人工(gōng)智(zhì)能话题。在最近的一次采访中,他(tā)再次表示:“AI可能会让科技行(xíng)业迎来一(yī)次剧烈的洗牌”。

这(zhè)个结论(lùn)是他在(zài)当地时(shí)间2月20日(rì)接受《In Good Company》节目专访(fǎng)时(shí)提(tí)出的。

他预期,AI的(de)发(fā)展可能会威(wēi)胁到谷歌的(de)市占率,因为微软在AI方面的行动相当迅速。而最终科技巨头将把AI整合(hé)成用户(hù)的“全能(néng)助手”,包揽(lǎn)一切应用,与人(rén)们进行沟通并(bìng)提供(gōng)建议,可以取代亚(yà)马逊、Siri或Outlook等应用。

大佬口中(zhōng)全能助手的到来可能尚需(xū)时日,但由(yóu)ControlNet引发(fā)的(de)又(yòu)一次AI绘画(huà)浪潮,让AIGC在ChatGPT的话题热点包围中杀出重围(wéi)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入(rù)可控(kòng)期,将洗牌科技行业?_黑料(liào)正能量

01

ControlNet颠覆AI绘画新(xīn)玩(wán)法

AIGC向可控靠近

以AI绘画为代表的AIGC上(shàng)一次爆火(huǒ)的时(shí)候,还是2022年(nián)8月,在美国科罗拉多州举办(bàn)的新兴数字艺术家(jiā)竞赛中,一幅名(míng)为(wèi)《太空歌(gē)剧(jù)院》的作品获奖。

随后各大厂商(shāng)的(de)AI绘(huì)画软件被广大网友熟知并体验,Stable Diffusion便是其(qí)中代表(biǎo)。

ChatGPT之后又一应用杀疯了(le),AIGC或进入(rù)可控(kòng)期,将洗(xǐ)牌科技行业?_黑料正能量

用户们可(kě)以在应用中输(shū)入(rù)一组关键(jiàn)词(cí)或者一张(zhāng)照片,就能获得一幅AI创作的画作。

作(zuò)画的(de)关键就是所输入的文本。同一组关(guān)键词也可以创(chuàng)作出很多张(zhāng)风格不一样的画作(zuò),这让创作的过程就像开盲盒。

很多用户很喜欢(huān)这(zhè)种不确定的惊喜,他们会将生成的美图当做(zuò)头像。而(ér)另一部分喜欢翻看AI绘画的“翻车”作品(pǐn)。在社交媒体上,许多用户分享AI“翻(fān)车现场”,例如,一位(wèi)网友的小狗照片(piàn)被AI画(huà)成(chéng)了“肌肉男”,还(hái)有网友(yǒu)的个人照片被AI识(shí)别成(chéng)了建筑。

而(ér)如今随着ControlNet的出现与加持(chí),以往AI绘画的填写关键(jiàn)词游戏(xì)可能要(yào)被(bèi)颠覆了。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

ControlNet是(shì)一(yī)位正在(zài)斯坦福读博的中国人张吕(lǚ)敏创作的一种基于控制点的图(tú)像变形算法(fǎ),主要(yào)用于数字(zì)图像(xiàng)处(chù)理、计算机(jī)视觉和计算机图形学(xué)等(děng)领域。

其SD插件(jiàn)一经发布,在短短的(de)两天(tiān)内(nèi)便成为了AI绘画领域最新的热点(diǎn)。

在此之前(qián),大家用(yòng)了很多方法想让AI生成的结果尽可(kě)能(néng)的符合要求(qiú),但是都(dōu)不尽如人(rén)意,它(tā)的出现(xiàn)代表着AI生成开始进入真(zhēn)正的可(kě)控(kòng)时期(qī)。

因为ControlNet可(kě)以直接(jiē)提取画面的构(gòu)图,人物(wù)的姿(zī)势和画面的(de)深(shēn)度信息等(děng)。有了它的帮(bāng)助,就不用频繁的用提示词(cí)来碰运气,抽盲盒式的创作了。

通(tōng)俗的说(shuō)ControlNet相当于给AI绘(huì)画加了“魔法”,不(bù)少博主(zhǔ)的(de)作品(pǐn)已经获(huò)得(dé)了大量的浏览量(liàng),“viggo”就是其中之一,他用(yòng)朋友的照片(piàn)直接(jiē)带她们(men)走进动漫世(shì)界。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将(jiāng)洗(xǐ)牌科技行(xíng)业?_黑(hēi)料正(zhèng)能(néng)量

viggo先用(yòng)StableDiffusion图(tú)片(piàn)转文字。

再用Text2Prompt插(chā)件拓展找到对(duì)应的关键(jiàn)词;最后用ControlNet插件绑定骨骼开(kāi)始换关键词试效果。

ChatGPT之后(hòu)又一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控(kòng)期,将(jiāng)洗牌科技行业?_黑料(liào)正能(néng)量

通过图片就可以看出来,效(xiào)果(guǒ)十分惊艳。

ChatGPT之后又一(yī)应用杀(shā)疯了,AIGC或(huò)进入可(kě)控期,将洗牌科技行业?_黑料正能量

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

更(gèng)厉害(hài)的(de)是,除(chú)了真实的(de)照片,草图(tú)也可以加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍(shào)到ControlNet还能(néng)实现线稿转(zhuǎn)全(quán)彩图。大神(shén)张吕敏(mǐn)其(qí)本尊也亲自回应。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

不(bù)得不说当下AIGC已(yǐ)经变得(dé)越来越强大,甚至输出的作品(pǐn)都已(yǐ)经(jīng)能以假乱(luàn)真了。

02

难辨虚(xū)实,AIGC技术(shù)力爆发(fā)

警惕安全问题(tí)

近日,“苏州金鸡湖有游艇party”的消(xiāo)息火(huǒ)遍网络,而经过警方辟谣这所谓的“party”可(kě)能是全国第一起AI绘(huì)图诈骗。

由于这个活(huó)动里面给出的美(měi)女(nǚ)照片(piàn)都是AI制作的真人照(zhào)片绘图,因(yīn)为(wèi)太(tài)逼(bī)真(zhēn),被大家当成(chéng)真事传播了

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科(kē)技行业?_黑料正能量

不过仔细观察可以发(fā)现,活动(dòng)发起者提供(gōng)的照(zhào)片中有个很(hěn)大的漏洞可以发现并非真人,而是AI绘图,那便(biàn)是图片中(zhōng)女性的手指(zhǐ)部分有的存(cún)在异常(cháng)。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑料正能量

有行业人事表(biǎo)示(shì):“现在因为手指(zhǐ)部分的绘(huì)画(huà)算法比(bǐ)较复杂(zá),AI还不(bù)太会画人的手,但最新看到(dào)的(de)图片已经(jīng)有越来越完美(měi)的AI模型出现(xiàn),以(yǐ)后(hòu)可能就完(wán)全(quán)没有(yǒu)漏洞了。

类似的AI作图诈骗在国外也已有发生。据英(yīng)国广播公司报道,土耳其(qí)地震(zhèn)期间(jiān),有Tiktok用户使用(yòng)AI合成了儿童(tóng)受(shòu)灾的假照片发布到网(wǎng)络,以此诱骗(piàn)善良的人打赏“捐助”从(cóng)而(ér)实施诈骗。

目(mù)前随着技术(shù)发(fā)展,AIGC已经能做出真人(rén)照片(piàn)般的绘(huì)图效果(guǒ),如果这样的图片被(bèi)用来诈骗,将(jiāng)非常可怕。

此(cǐ)外AIGC还引发(fā)了很多担忧,一方面,批判者认(rèn)为AI在“学(xué)习”了(le)大量前人的作(zuò)品之后,其创作没有任何情绪和灵魂,难以和人类的艺(yì)术创作相提并(bìng)论(lùn)。

另(lìng)一方面(miàn),AIGC背后的版权、目前都(dōu)并(bìng)没有得到有效的解决(jué),还有AIGC会不会代替人类“至高无上”的创(chuàng)意。

马斯(sī)克也(yě)强(qiáng)调(diào),人工智能的安全问题需要得到重视,太晚就来不及了。

03

AIGC下一(yī)站除了视频,还有(yǒu)远方

技(jì)术都是有两面(miàn)性的(de),潜在的危害并不能掩盖其(qí)光辉(huī)的贡(gòng)献。现在(zài)看来,人工智(zhì)能技术(shù)将是第四次工业革命的核心驱动力(lì)量(liàng),将创造新的增长奇迹。

过(guò)去一年,人工智能在技(jì)术(shù)和商业层面(miàn)都有了巨大(dà)进展,AI绘画就是人(rén)工(gōng)智能技术发(fā)生方向(xiàng)性改变的一个代表。其下一(yī)站或许(xǔ)就是视频(pín)。

此(cǐ)前,Meta和谷歌先(xiān)后发布了几条引爆科技圈的(de)短视频。这(zhè)些视频引发关注并非内(nèi)容(róng)做得多优秀,反而(ér)都(dōu)非常简单,比如一匹正在喝(hē)水(shuǐ)的(de)马,一只画画(huà)的玩具(jù)熊,或(huò)者一段骑摩托车的第一(yī)视(shì)角录像,随便一个(gè)有(yǒu)手机(jī)的人都可(kě)以随手录下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期(qī),将(jiāng)洗牌科技行业?_黑料正(zhèng)能(néng)量

但这些短视频的(de)创作方式非常简(jiǎn)单,创作者仅仅(jǐn)需要向AI输入一段话,甚至只是说一下要(yào)作伴还是做伴哪个对,作伴还是做伴正确求(qiú),AI就可(kě)以根据需要生(shēng)成一(yī)段视频。

谷歌发布的(de)两个AI生(shēng)成视频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高(gāo)清,与Meta的(de)Make-A-Video没(méi)有太多的(de)差别。

在(zài)Make-A-Video公布了(le)AI生成(chéng)的视频(pín)后,AI圈就已经玩了(le)一(yī)波(bō)梗,一个能够做(zuò)出作伴还是做伴哪个对,作伴还是做伴正确更高清(qīng)视(shì)频的AI还不(bù)足以(yǐ)在短时(shí)间内戳中兴奋点。

Phenaki更加令人震惊(jīng)的地方在于,它可以制作出超(chāo)过2分钟的连(lián)贯(guàn)的也有(yǒu)确(què)切内容的视(shì)频,这(zhè)才(cái)是真正让人们(men)感到惊喜的(de)地(dì)方。因为无论(lùn)AI生(shēng)成(chéng)的视频多么高清,也只能是(shì)为内容(róng)生产(chǎn)者提供一个灵感,一个素材(cái),一个过场动画。

不(bù)过能够制作出有具体剧情内容(róng)的视频就意(yì)味着,一些(xiē)视频创作由AI代(dài)替人(rén)工完成(chéng)已经初步(bù)有了可(kě)能(néng)。

当下AI的发展速度(dù)已经超过(guò)大部分人的(de)想象(xiàng)。内容产(chǎn)业的本质是供给(gěi)创造(zào)需求,AIGC作(zuò)为(wèi)全新的(de)内容生产方式,可以为内(nèi)容产(chǎn)业(yè)带来更(gèng)新的(de)内(nèi)容风格、更快的生产速度,更低(dī)的(de)生(shēng)产成本(běn),这无疑(yí)会驱(qū)动内容产业的大爆发。

除了AI绘图(tú)、视频(pín),AIGC技(jì)术还能应用(yòng)于音乐、代码、机器人动作(zuò)等多种内(nèi)容(róng)形式的生(shēng)成。不难发现(xiàn)该项技术(shù)不仅在游(yóu)戏等行业(yè)能得(dé)到有(yǒu)效应(yīng)用,对于下一(yī)代互(hù)联网各种元素的构建亦有关(guān)键意(yì)义。

从商业化的角度(dù)来看,文化娱乐、教育、传媒(méi)等诸多领(lǐng)域,本身就(jiù)对基于AI的可视(shì)化内容(róng)有强(qiáng)烈需求。

因此,AI绘画及视频或(huò)不是(shì)结果,而(ér)只是(shì)AI进程中(zhōng)的一(yī)块重要拼图,有(yǒu)望在技(jì)术(shù)更新的加持下(xià)实(shí)现更大的应用价(jià)值。

AI从理解内容,走(zǒu)向(xiàng)了(le)可以(yǐ)生成内容,甚至(zhì)能够创造(zào)出(chū)独立价值和独立(lì)视角的内容(róng)。AIGC的再(zài)次出圈,更(gèng)代表着(zhe)未来的先进生(shēng)产力即将到来。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科技(jì)行业?_黑料正能量

04

紧(jǐn)抓(zhuā)大(dà)模型(xíng)与算力,牢固AIGC底座

从技术(shù)的发展也可(kě)以看出,在语言大模型、图(tú)像大(dà)模(mó)型之后,多模态大模型已(yǐ)经(jīng)成为了新的趋势(shì)。

大模型(xíng)被誉(yù)为(wèi)当前人工(gōng)智能发展(zhǎn)的智能底座(zuò),是全球竞争最激烈的(de)研(yán)究方向之一(yī),包括谷(gǔ)歌、亚马逊、百度、阿里、腾(téng)讯等众多头部企业都在竞相发力。

不过训练大模型的确(què)价格不(bù)菲,以国盛证券发(fā)布(bù)的(de)《ChatGPT需要(yào)多少算力》报告估算,GPT-3训练一次(cì)的(de)成(chéng)本约为140万(wàn)美(měi)元(yuán)。而对(duì)于一些更大的(de)LLM(大型语言(yán)模型),训练成(chéng)本则介于(yú)200万(wàn)美(měi)元至1200万美(měi)元高(gāo)价之间。

以ChatGPT在2023年1月的独立访客平(píng)均(jūn)数1300万计算,其对应芯片需求为3万多片(piàn)英伟达A100 GPU,初始投入成本约为8亿美元,每(měi)日仅电费就在5万美元左(zuǒ)右。

ChatGPT之(zhī)后又一应用杀(shā)疯了(le),AIGC或进入可控期(qī),将洗牌科技行(xíng)业?_黑料(liào)正(zhèng)能量

此外(wài)不论是ChatGPT还(hái)是(shì)AIGC,都离(lí)不开庞大算力支持。在关注各(gè)类大模(mó)型(xíng)的(de)发(fā)展(zhǎn)同时,更(gèng)应该关注算力(lì)网络的建设。

算力网络正驱(qū)动AI产业发展进入史诗(shī)级加速进程,让AIGC及通用AI这一(yī)人(rén)工(gōng)智能发展的终极(jí)目标离得(dé)更近。

因为算力可以对突破性技术创新提(tí)供大力的支持。这方(fāng)面(miàn),多模态大模型是典型(xíng)。作为(wèi)面(miàn)向未来强人工(gōng)智能、通用(yòng)人工(gōng)智能的重要技术创新,多模(mó)态大模型已经在人工智(zhì)能领(lǐng)域(yù)提出了很多年(nián),业界(jiè)也有不(bù)少(shǎo)技术(shù)突破,但是,多模态大模型进(jìn)一(yī)步往下走,算力需求呈几何式上升,一般的(de)算力基(jī)础(chǔ)设施很快将难以胜任。

从图像、文字、语音单独一项(xiàng)的训练,到双模态、三模态的跃迁,让人(rén)工智能可以灵活(huó)应对不同模态(tài)的转化、像人与世界交互(hù)一样自然(rán),这方面,由算(suàn)力网(wǎng)络来驱动将有(yǒu)明显优势。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正能(néng)量(liàng)

此外,还有(yǒu)很多需(xū)要爆发式增长的算力(lì)来支(zhī)撑的技术创新,将在人工智能(néng)算力(lì)网(wǎng)络支撑下快速推(tuī)进。

AIGC已经露出曙光,期待(dài)在大(dà)模型和大算力的支(zhī)持(chí)下AIGC能持续颠覆(fù)内(nèi)容(róng)生产的方(fāng)式,将创造的边际成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 作伴还是做伴哪个对,作伴还是做伴正确

评论

5+2=