作伴还是做伴哪个对，作伴还是做伴正确-绿茶通用站群

作伴还是做伴哪个对，作伴还是做伴正确 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天机器(qì)人(rén)ChatGPT火爆以来，微(wēi)软公司创(chuàng)始人比(bǐ)尔·盖茨已多次公开谈论(lùn)人工(gōng)智(zhì)能话题。在最近的一次采访中，他(tā)再次表示：“AI可能会让科技行(xíng)业迎来一(yī)次剧烈的洗牌”。

这(zhè)个结论(lùn)是他在(zài)当地时(shí)间2月20日(rì)接受《In Good Company》节目专访(fǎng)时(shí)提(tí)出的。

他预期，AI的(de)发(fā)展可能会威(wēi)胁到谷歌的(de)市占率，因为微软在AI方面的行动相当迅速。而最终科技巨头将把AI整合(hé)成用户(hù)的“全能(néng)助手”，包揽(lǎn)一切应用，与人(rén)们进行沟通并(bìng)提供(gōng)建议，可以取代亚(yà)马逊、Siri或Outlook等应用。

大佬口中(zhōng)全能助手的到来可能尚需(xū)时日，但由(yóu)ControlNet引发(fā)的(de)又(yòu)一次AI绘画(huà)浪潮，让AIGC在ChatGPT的话题热点包围中杀出重围(wéi)。

ChatGPT之后又一应(yīng)用杀疯了，AIGC或(huò)进入(rù)可控(kòng)期，将洗牌科技行业？_黑料(liào)正能量

ControlNet颠覆AI绘画新(xīn)玩(wán)法

AIGC向可控靠近

以AI绘画为代表的AIGC上(shàng)一次爆火(huǒ)的时(shí)候，还是2022年(nián)8月，在美国科罗拉多州举办(bàn)的新兴数字艺术家(jiā)竞赛中，一幅名(míng)为(wèi)《太空歌(gē)剧(jù)院》的作品获奖。

随后各大厂商(shāng)的(de)AI绘(huì)画软件被广大网友熟知并体验，Stable Diffusion便是其(qí)中代表(biǎo)。

用户们可(kě)以在应用中输(shū)入(rù)一组关键(jiàn)词(cí)或者一张(zhāng)照片，就能获得一幅AI创作的画作。

作(zuò)画的(de)关键就是所输入的文本。同一组关(guān)键词也可以创(chuàng)作出很多张(zhāng)风格不一样的画作(zuò)，这让创作的过程就像开盲盒。

很多用户很喜欢(huān)这(zhè)种不确定的惊喜，他们会将生成的美图当做(zuò)头像。而(ér)另一部分喜欢翻看AI绘画的“翻车”作品(pǐn)。在社交媒体上，许多用户分享AI“翻(fān)车现场”，例如，一位(wèi)网友的小狗照片(piàn)被AI画(huà)成(chéng)了“肌肉男”，还(hái)有网友(yǒu)的个人照片被AI识(shí)别成(chéng)了建筑。

而(ér)如今随着ControlNet的出现与加持(chí)，以往AI绘画的填写关键(jiàn)词游戏(xì)可能要(yào)被(bèi)颠覆了。

ControlNet是(shì)一(yī)位正在(zài)斯坦福读博的中国人张吕(lǚ)敏创作的一种基于控制点的图(tú)像变形算法(fǎ)，主要(yào)用于数字(zì)图像(xiàng)处(chù)理、计算机(jī)视觉和计算机图形学(xué)等(děng)领域。

其SD插件(jiàn)一经发布，在短短的(de)两天(tiān)内(nèi)便成为了AI绘画领域最新的热点(diǎn)。

在此之前(qián)，大家用(yòng)了很多方法想让AI生成的结果尽可(kě)能(néng)的符合要求(qiú)，但是都(dōu)不尽如人(rén)意，它(tā)的出现(xiàn)代表着AI生成开始进入真(zhēn)正的可(kě)控(kòng)时期(qī)。

因为ControlNet可(kě)以直接(jiē)提取画面的构(gòu)图，人物(wù)的姿(zī)势和画面的(de)深(shēn)度信息等(děng)。有了它的帮(bāng)助，就不用频繁的用提示词(cí)来碰运气，抽盲盒式的创作了。

通(tōng)俗的说(shuō)ControlNet相当于给AI绘(huì)画加了“魔法”，不(bù)少博主(zhǔ)的(de)作品(pǐn)已经获(huò)得(dé)了大量的浏览量(liàng)，“viggo”就是其中之一，他用(yòng)朋友的照片(piàn)直接(jiē)带她们(men)走进动漫世(shì)界。

viggo先用(yòng)StableDiffusion图(tú)片(piàn)转文字。

再用Text2Prompt插(chā)件拓展找到对(duì)应的关键(jiàn)词；最后用ControlNet插件绑定骨骼开(kāi)始换关键词试效果。

通过图片就可以看出来，效(xiào)果(guǒ)十分惊艳。

更(gèng)厉害(hài)的(de)是，除(chú)了真实的(de)照片，草图(tú)也可以加(jiā)上“魔法”，知乎大牛“DevPoint”和“逗(dòu)砂”介绍(shào)到ControlNet还能(néng)实现线稿转(zhuǎn)全(quán)彩图。大神(shén)张吕敏(mǐn)其(qí)本尊也亲自回应。

不(bù)得不说当下AIGC已(yǐ)经变得(dé)越来越强大，甚至输出的作品(pǐn)都已(yǐ)经(jīng)能以假乱(luàn)真了。

难辨虚(xū)实，AIGC技术(shù)力爆发(fā)

警惕安全问题(tí)

近日，“苏州金鸡湖有游艇party”的消(xiāo)息火(huǒ)遍网络，而经过警方辟谣这所谓的“party”可(kě)能是全国第一起AI绘(huì)图诈骗。

由于这个活(huó)动里面给出的美(měi)女(nǚ)照片(piàn)都是AI制作的真人照(zhào)片绘图，因(yīn)为(wèi)太(tài)逼(bī)真(zhēn)，被大家当成(chéng)真事传播了。

不过仔细观察可以发(fā)现，活动(dòng)发起者提供(gōng)的照(zhào)片中有个很(hěn)大的漏洞可以发现并非真人，而是AI绘图，那便(biàn)是图片中(zhōng)女性的手指(zhǐ)部分有的存(cún)在异常(cháng)。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯了，AIGC或进入可(kě)控期，将洗(xǐ)牌科技行业？_黑料正能量

有行业人事表(biǎo)示(shì)：“现在因为手指(zhǐ)部分的绘(huì)画(huà)算法比(bǐ)较复杂(zá)，AI还不(bù)太会画人的手，但最新看到(dào)的(de)图片已经(jīng)有越来越完美(měi)的AI模型出现(xiàn)，以(yǐ)后(hòu)可能就完(wán)全(quán)没有(yǒu)漏洞了。”

类似的AI作图诈骗在国外也已有发生。据英(yīng)国广播公司报道，土耳其(qí)地震(zhèn)期间(jiān)，有Tiktok用户使用(yòng)AI合成了儿童(tóng)受(shòu)灾的假照片发布到网(wǎng)络，以此诱骗(piàn)善良的人打赏“捐助”从(cóng)而(ér)实施诈骗。

目(mù)前随着技术(shù)发(fā)展，AIGC已经能做出真人(rén)照片(piàn)般的绘(huì)图效果(guǒ)，如果这样的图片被(bèi)用来诈骗，将(jiāng)非常可怕。

此(cǐ)外AIGC还引发(fā)了很多担忧，一方面，批判者认(rèn)为AI在“学(xué)习”了(le)大量前人的作(zuò)品之后，其创作没有任何情绪和灵魂，难以和人类的艺(yì)术创作相提并(bìng)论(lùn)。

另(lìng)一方面(miàn)，AIGC背后的版权、目前都(dōu)并(bìng)没有得到有效的解决(jué)，还有AIGC会不会代替人类“至高无上”的创(chuàng)意。

马斯(sī)克也(yě)强(qiáng)调(diào)，人工智能的安全问题需要得到重视，太晚就来不及了。

AIGC下一(yī)站除了视频，还有(yǒu)远方

技(jì)术都是有两面(miàn)性的(de)，潜在的危害并不能掩盖其(qí)光辉(huī)的贡(gòng)献。现在(zài)看来，人工智(zhì)能技术(shù)将是第四次工业革命的核心驱动力(lì)量(liàng)，将创造新的增长奇迹。

过(guò)去一年，人工智能在技(jì)术(shù)和商业层面(miàn)都有了巨大(dà)进展，AI绘画就是人(rén)工(gōng)智能技术发(fā)生方向(xiàng)性改变的一个代表。其下一(yī)站或许(xǔ)就是视频(pín)。

此(cǐ)前，Meta和谷歌先(xiān)后发布了几条引爆科技圈的(de)短视频。这(zhè)些视频引发关注并非内(nèi)容(róng)做得多优秀，反而(ér)都(dōu)非常简单，比如一匹正在喝(hē)水(shuǐ)的(de)马，一只画画(huà)的玩具(jù)熊，或(huò)者一段骑摩托车的第一(yī)视(shì)角录像，随便一个(gè)有(yǒu)手机(jī)的人都可(kě)以随手录下一段。

但这些短视频的(de)创作方式非常简(jiǎn)单，创作者仅仅(jǐn)需要向AI输入一段话，甚至只是说一下要(yào)作伴还是做伴哪个对，作伴还是做伴正确求(qiú)，AI就可(kě)以根据需要生(shēng)成一(yī)段视频。

谷歌发布的(de)两个AI生(shēng)成视频分别来自于Imagen Video和Phenaki，前者主要(yào)突出的是高(gāo)清，与Meta的(de)Make-A-Video没(méi)有太多的(de)差别。

在(zài)Make-A-Video公布了(le)AI生成(chéng)的视频(pín)后，AI圈就已经玩了(le)一(yī)波(bō)梗，一个能够做(zuò)出作伴还是做伴哪个对，作伴还是做伴正确更高清(qīng)视(shì)频的AI还不(bù)足以(yǐ)在短时(shí)间内戳中兴奋点。

Phenaki更加令人震惊(jīng)的地方在于，它可以制作出超(chāo)过2分钟的连(lián)贯(guàn)的也有(yǒu)确(què)切内容的视(shì)频，这(zhè)才(cái)是真正让人们(men)感到惊喜的(de)地(dì)方。因为无论(lùn)AI生(shēng)成(chéng)的视频多么高清，也只能是(shì)为内容(róng)生产(chǎn)者提供一个灵感，一个素材(cái)，一个过场动画。

不(bù)过能够制作出有具体剧情内容(róng)的视频就意(yì)味着，一些(xiē)视频创作由AI代(dài)替人(rén)工完成(chéng)已经初步(bù)有了可(kě)能(néng)。

当下AI的发展速度(dù)已经超过(guò)大部分人的(de)想象(xiàng)。内容产(chǎn)业的本质是供给(gěi)创造(zào)需求，AIGC作(zuò)为(wèi)全新的(de)内容生产方式，可以为内(nèi)容产(chǎn)业(yè)带来更(gèng)新的(de)内(nèi)容风格、更快的生产速度，更低(dī)的(de)生(shēng)产成本(běn)，这无疑(yí)会驱(qū)动内容产业的大爆发。

除了AI绘图(tú)、视频(pín)，AIGC技(jì)术还能应用(yòng)于音乐、代码、机器人动作(zuò)等多种内(nèi)容(róng)形式的生(shēng)成。不难发现(xiàn)该项技术(shù)不仅在游(yóu)戏等行业(yè)能得(dé)到有(yǒu)效应(yīng)用，对于下一(yī)代互(hù)联网各种元素的构建亦有关(guān)键意(yì)义。

从商业化的角度(dù)来看，文化娱乐、教育、传媒(méi)等诸多领(lǐng)域，本身就(jiù)对基于AI的可视(shì)化内容(róng)有强(qiáng)烈需求。

因此，AI绘画及视频或(huò)不是(shì)结果，而(ér)只是(shì)AI进程中(zhōng)的一(yī)块重要拼图，有(yǒu)望在技(jì)术(shù)更新的加持下(xià)实(shí)现更大的应用价(jià)值。

AI从理解内容，走(zǒu)向(xiàng)了(le)可以(yǐ)生成内容，甚至(zhì)能够创造(zào)出(chū)独立价值和独立(lì)视角的内容(róng)。AIGC的再(zài)次出圈，更(gèng)代表着(zhe)未来的先进生(shēng)产力即将到来。

紧(jǐn)抓(zhuā)大(dà)模型(xíng)与算力，牢固AIGC底座

从技术(shù)的发展也可(kě)以看出，在语言大模型、图(tú)像大(dà)模(mó)型之后，多模态大模型已(yǐ)经(jīng)成为了新的趋势(shì)。

大模型(xíng)被誉(yù)为(wèi)当前人工(gōng)智能发展(zhǎn)的智能底座(zuò)，是全球竞争最激烈的(de)研(yán)究方向之一(yī)，包括谷(gǔ)歌、亚马逊、百度、阿里、腾(téng)讯等众多头部企业都在竞相发力。

不过训练大模型的确(què)价格不(bù)菲，以国盛证券发(fā)布(bù)的(de)《ChatGPT需要(yào)多少算力》报告估算，GPT-3训练一次(cì)的(de)成(chéng)本约为140万(wàn)美(měi)元(yuán)。而对(duì)于一些更大的(de)LLM(大型语言(yán)模型)，训练成(chéng)本则介于(yú)200万(wàn)美(měi)元至1200万美(měi)元高(gāo)价之间。

以ChatGPT在2023年1月的独立访客平(píng)均(jūn)数1300万计算，其对应芯片需求为3万多片(piàn)英伟达A100 GPU，初始投入成本约为8亿美元，每(měi)日仅电费就在5万美元左(zuǒ)右。

此外(wài)不论是ChatGPT还(hái)是(shì)AIGC，都离(lí)不开庞大算力支持。在关注各(gè)类大模(mó)型(xíng)的(de)发(fā)展(zhǎn)同时，更(gèng)应该关注算力(lì)网络的建设。

算力网络正驱(qū)动AI产业发展进入史诗(shī)级加速进程，让AIGC及通用AI这一(yī)人(rén)工(gōng)智能发展的终极(jí)目标离得(dé)更近。

因为算力可以对突破性技术创新提(tí)供大力的支持。这方(fāng)面(miàn)，多模态大模型是典型(xíng)。作为(wèi)面(miàn)向未来强人工(gōng)智能、通用(yòng)人工(gōng)智能的重要技术创新，多模(mó)态大模型已经在人工智(zhì)能领(lǐng)域(yù)提出了很多年(nián)，业界(jiè)也有不(bù)少(shǎo)技术(shù)突破，但是，多模态大模型进(jìn)一(yī)步往下走，算力需求呈几何式上升，一般的(de)算力基(jī)础(chǔ)设施很快将难以胜任。

从图像、文字、语音单独一项(xiàng)的训练，到双模态、三模态的跃迁，让人(rén)工智能可以灵活(huó)应对不同模态(tài)的转化、像人与世界交互(hù)一样自然(rán)，这方面，由算(suàn)力网(wǎng)络来驱动将有(yǒu)明显优势。