莫问前程上一句是啥莫问前程的意思-橘子百科-橘子都知道

莫问前程上一句是啥莫问前程的意思 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天机器人(rén)ChatGPT火爆以来，微软公(gōng)司创始(shǐ)人比尔(ěr)·盖茨(cí)已多次公开谈论人工(gōng)智能话(huà)题。在最近(jìn)的一次采访中，他再次表示：“AI可能(néng)会让(ràng)科技(jì)行业迎来一次剧烈的洗牌”。

这个结论是(shì)他在当地(dì)时间(jiān)2月20日接受《In Good Company》节目专(zhuān)访时(shí)提出(chū)的。

他预期，AI的发展可(kě)能会威(wēi)胁到谷歌的市占率，因为微软(ruǎn)在AI方面的行动相当迅(xùn)速。而最(zuì)终科技巨头将(jiāng)把AI整合(hé)成用(yòng)户的“全能助手”，包揽一切应用(yòng)，与(yǔ)人们进行沟通并提供(gōng)建(jiàn)议，可以取代(dài)亚马逊(xùn)、Siri或(huò)Outlook等应用。

大(dà)佬口中全能助手的到来(lái)可能(néng)尚需时日(rì)，但由ControlNet引发的又(yòu)一次AI绘画浪(làng)潮，让AIGC在ChatGPT的话题热点包围中杀出(chū)重围(wéi)。

ChatGPT之后(hòu)又一应用杀疯了，AIGC或(huò)进入可控期，将洗牌科技行业？_黑料正能量

ControlNet颠覆AI绘(huì)画(huà)新玩法

AIGC向可控靠(kào)近

以AI绘画(huà)为代表的AIGC上一次爆火的时候(hòu)，还是2022年8月，在美国科罗拉多州举(jǔ)办的新兴数字(zì)艺术家竞(jìng)赛(sài)中，一幅名为《太空(kōng)歌(gē)剧(jù)院(yuàn)》的作(zuò)品获奖。

随后(hòu)各(gè)大厂商(shāng)的AI绘画(huà)软件被广大网友熟知并体验，Stable Diffusion便是(shì)其中(zhōng)代表。

用户们可以在应用(yòng)中输入一(yī)组关(guān)键(jiàn)词或者一(yī)张照片，就能获得(dé)一幅AI创作的画(huà)作。

作画的(de)关键就是所(suǒ)输入的文本。同一(yī)组关键词也可以(yǐ)创作出很多(duō)张风格不(bù)一样(yàng)的画作，这让创作的过程就像开盲盒。

很多用户(hù)很喜(xǐ)欢这种(zhǒng)不确(què)定的惊喜，他们会将生成的美图当(dāng)做头像(xiàng)。而另一部分喜(xǐ)欢翻(fān)看(kàn)AI绘画的“翻车”作品。在社交媒体(tǐ)上(shàng)，许(xǔ)多用户分(fēn)享AI“翻车现场”，例(lì)如，一位(wèi)网(wǎng)友的小狗照片被AI画成了“肌肉男”，还有网友的个(gè)人照(zhào)片被AI识别成了建筑。

而(ér)如今随(suí)着ControlNet的出现与加(jiā)持(chí)，以往AI绘画(huà)的(de)填写关键词游戏(xì)可能要被(bèi)颠覆了。

ControlNet是一(yī)位正(zhèng)在斯坦(tǎn)福(fú)读(dú)博(bó)的(de)中(zhōng)国人(rén)张吕敏创(chuàng)作的一(yī)种基于控(kòng)制(zhì)点(diǎn)的图像(xiàng)变形算法，主要(yào)用于(yú)数字(zì)图像处理、计算机视觉和计算(suàn)机(jī)图形学等领(lǐng)域。

其SD插件一(yī)经发布，在短(duǎn)短的两天内(nèi)便成(chéng)为(wèi)了AI绘(huì)画(huà)领域最新的热点。

在此之前，大(dà)家用了很多方(fāng)法想让(ràng)AI生成的结果尽(jǐn)可(kě)能的符合要求，但是都不尽(jǐn)如人意(yì)，它的出(chū)现代表(biǎo)着AI生成开始进入真正的可控时期。

因(yīn)为ControlNet可以(yǐ)直接(jiē)提取画面(miàn)的构图，人物的姿势和画面(miàn)的深度信(xìn)息等。有(yǒu)了它的(de)帮助，就不用频繁的用提示词(cí)来碰运气(qì)，抽(chōu)盲盒式的创作了。

通俗(sú)的说(shuō)ControlNet相当(dāng)于给(gěi)AI绘(huì)画(huà)加了“魔(mó)法”，不少(shǎo)博主的作品已经获得了大(dà)量(liàng)的(de)浏览(lǎn)量，“viggo”就是其中之一，他(tā)用朋友的照片直接带她(tā)们走(zǒu)进动(dòng)漫世界。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关键词(cí)；最后(hòu)用ControlNet插(chā)件(jiàn)绑定骨骼开始换关(guān)键词试效(xiào)果。

通(tōng)过图(tú)片就可以看出来，效果十分(fēn)惊艳。

更厉(lì)害的是，除了真实的(de)照片，草图也可以加上“魔法”，知乎大牛(niú)“DevPoint”和“逗(dòu)砂(shā)”介绍(shào)到ControlNet还(hái)能实现(xiàn)线稿(gǎo)转全彩图。大神张吕敏其本尊也(yě)亲自回(huí)应。

不得不(bù)说当下AIGC已(yǐ)经变得越来越强大，甚(shèn)至输出的作(zuò)品都已经能(néng)以假乱真了。

难辨虚(xū)实(shí)，AIGC技术力(lì)爆发

警惕安全问题(tí)

近日，“苏州金(jīn)鸡湖有游(yóu)艇party”的消息火(huǒ)遍(biàn)网络，而(ér)经过警方辟谣这(zhè)所谓(wèi)的(de)“party”可能是(shì)全国第一起AI绘图诈骗。

由于这个活(huó)动里面给出的美女照(zhào)片都是AI制作的真人照片绘图(tú)，因为太逼真，被(bèi)大家当(dāng)成(chéng)真事传播了(le)。

不过仔细观察(chá)可以(yǐ)发现(xiàn)，活(huó)动发起者提供的照片中有个(gè)很大(dà)的漏洞可以(yǐ)发现并非(fēi)真人，而(ér)是AI绘(huì)图，那便是(shì)图片中女性的手指部分有的存在异常。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le)，AIGC或进入可控期，将(jiāng)洗牌科(kē)技行(xíng)业？_黑(hēi)料(liào)正能量

有行业人(rén)事表示：“现在(zài)因(yīn)为手指部分的绘画算法比较复杂(zá)，AI还不太会画(huà)人(rén)的手，但(dàn)最(zuì)新(xīn)看到的图片已经有越来越完美的AI模型出现，以后(hòu)可能(néng)就(jiù)完(wán)全没有漏洞(dòng)了。”

类(lèi)似的AI作图诈(zhà)骗在国外也(yě)已有发生。据英国广播(bō)公司报道，土耳其地震期间，有(yǒu)Tiktok用户使用(yòng)AI合成了儿童受灾的(de)假照片发布(bù)到网络(luò)，以此诱骗善(shàn)良的(de)人打赏(shǎng)“捐助”从而实施(shī)诈骗。

目(mù)前(qián)随着技术(shù)发展，AIGC已经能(néng)做出真人照片般的(de)绘图效(xiào)果，如果这样的图片被用来诈骗，将非常可怕。

此外(wài)AIGC还引发了很多担(dān)忧，一(yī)方面(miàn)，批判者认为(wèi)AI在(zài)“学习”了大(dà)量(liàng)前人的作品之后，其(qí)创(chuàng)作没(méi)有任何情绪和灵魂，难(nán)以和人(rén)类的艺术创作相提并论(lùn)。

另一(yī)方面(miàn)，AIGC背(bèi)后的版权(quán)、目前都并(bìng)没有得到有(yǒu)效的解(jiě)决(jué)，还有AIGC会不会代替(tì)人类“至高无上”的创(chuàng)意。

马(mǎ)斯克也(yě)强调(diào)，人工(gōng)智能的安全问题需要(yào)得到重视，太晚就来不及了。

AIGC下一站(zhàn)除了视(shì)频，还(hái)有远方(fāng)

技(jì)术都是有两面性(xìng)的，潜在的危(wēi)害并不能掩(yǎn)盖(gài)其(qí)光辉(huī)的贡献(xiàn)。现在看(kàn)来，人工智(zhì)能技术将是(shì)第(dì)四次(cì)工业革命的核心(xīn)驱动(dòng)力(lì)量，将(jiāng)创造新的增(zēng)长奇迹。

过去一年，人工智能在技术和(hé)商业(yè)层面(miàn)都有(yǒu)了巨大进展，AI绘画就是人工智能技术发生方向(xiàng)性改变的(de)一个代表。其下一站(zhàn)或许就是视频。

此前，Meta和谷歌先后发布了几条(tiáo)引爆(bào)科技圈的(de)短视频。这些(xiē)视频引发关注并非(fēi)内(nèi)容做得多(duō)优秀，反(fǎn)而(ér)都非常(cháng)简单(dān)，比如一匹正在(zài)喝水的马，一只(zhǐ)画画的玩具熊，或者一段骑摩托车的第(dì)一视角录像，随(suí)便一个(gè)有手机的人都(dōu)可以随(suí)手录(lù)下一段。

但这些短视频的(de)创作(zuò)方式非常简单(dān)，创作者仅仅(jǐn)需(xū)要向(xiàng)AI输入一(yī)段话，甚至(zhì)只(zhǐ)是说一下要求，AI就可以(yǐ)根据(jù)需要生成一段视频(pín)。

谷歌发布的(de)两个AI生成视频分别来(lái)自(zì)于Imagen Video和(hé)Phenaki，前者主(zhǔ)要莫问前程上一句是啥莫问前程的意思突出的是高清，与Meta的Make-A-Video没有太多的差别(bié)。

在Make-A-Video公布了AI生(shēng)成(chéng)的视频后(hòu)，AI圈就已经玩了一(yī)波梗，一个能够(gòu)做出更高清视频的AI还不(bù)足以在短时间内(nèi)戳中兴奋点。

Phenaki更加(jiā)令人震惊(jīng)的(de)地方(fāng)在于(yú)，它可以制作出(chū)超过2分钟的(de)连(lián)贯的也有确(què)切内容的(de)视频，这才是(shì)真正让人们(men)感(gǎn)到惊喜的地方。因(yīn)为无(wú)论AI生成的视频多么高清，也只能是为内(nèi)容生产(chǎn)者提供一个灵感，一个(gè)素材，一个过(guò)场动画。

不过(guò)能够制(zhì)作出有具体(tǐ)剧情内(nèi)容的视频就意味着，一些视(shì)频创作由AI代替人工完成已经初步有了可能。

当(dāng)下AI的发展速度已经(jīng)超过大部分人的想象。内容产业的本(běn)质(zhì)是供给创造(zào)需求，AIGC作为全(quán)新(xīn)的(de)内容生产方式，可以为内容产业带来(lái)更新的内容风格(gé)、更快的生产(chǎn)速度，更低的生产成(chéng)本，这无疑(yí)会(huì)驱动(dòng)内容(róng)产业(yè)的大爆发。

除(chú)了AI绘图、视频，AIGC技术还能应用于音乐、代(dài)码、机器(qì)人动作(zuò)等多种内容形式的生成。不难发现该项(xiàng)技(jì)术不仅在(zài)游(yóu)戏等行业能得到(dào)有效应用，对于下一代互(hù)联网各种元素(sù)的构建亦有关键意义。

从(cóng)商业化(huà)的角度(dù)来看，文化娱乐(lè)、教育(yù)、传(chuán)媒等诸多(duō)领域，本(běn)身就(jiù)对基于AI的(de)可视化内(nèi)容有强烈需求。

因此，AI绘画及视频或不(bù)是结果，而(ér)只(zhǐ)是(shì)AI进程中(zhōng)的一块重要拼图，有望在(zài)技术更(gèng)新(xīn)的(de)加(jiā)持(chí)下实现更大的应用价值。

AI从理解内容，走向了可以生成内容，甚(shèn)至(zhì)能够创造出独立价值和独(dú)立视角(jiǎo)的(de)内容。AIGC的再次(cì)出圈，更代(dài)表着(zhe)未(wèi)来的先进生产力即将到来。

紧抓大模型与算(suàn)力，牢固AIGC底座(zuò)

从(cóng)技术的发展也(yě)可以看出，在语言大模(mó)型、图(tú)像大模型(xíng)之后，多(duō)模态(tài)大模型(xíng)已经(jīng)成为了新(xīn)的趋势。

大(dà)模型被誉为当前人工智能发展的智能底座，是(shì)全球(qiú)竞争最激(jī)烈的研(yán)究(jiū)方向(xiàng)之一(yī)，包括谷歌、亚马(mǎ)逊、百度(dù)、阿里、腾讯等众多头部企业都(dōu)在竞(jìng)相发力。

不(bù)过训练(liàn)大模(mó)型的确(què)价格(gé)不菲，以国盛(shèng)证券(quàn)发(fā)布的《ChatGPT需要(yào)多少算力》报告估算，GPT-3训练一次的(de)成本约为140万美元。而对于一些更大(dà)的LLM(大(dà)型语言模型)，训(xùn)练成本(běn)则(zé)介于200万(wàn)美元至1200万美元高价之间。

以ChatGPT在2023年1月的独立访客平均数1300万计算，其对应芯片(piàn)需求为3万多片英(yīng)伟达A100 GPU，初始投(tóu)入成本约为8亿(yì)美元，每日(rì)仅电费(fèi)就在(zài)5万美元左右(yòu)。

此外不论(lùn)是ChatGPT还是AIGC，都离不开(kāi)庞(páng)大算力支(zhī)持。在关注各(gè)类大(dà)模(mó)型(xíng)的发(fā)展同时，更应该(gāi)关注算力网络的建设。

算力网络正驱(qū)动AI产业发展进(jìn)入史诗级加速(sù)进程，让AIGC及通用(yòng)AI这(zhè)一人工(gōng)智能发展的终极目标离得更近(jìn)。

因为算力可以(yǐ)对突破性技术创(chuàng)新提供(gōng)大力的(de)支持。这方面，多模态大模型是(shì)典型。作(zuò)为面向(xiàng)未来强(qiáng)人工智能、通用人工智能的重(zhòng)要技术(shù)创新，多(duō)模态大模型已(yǐ)经在人(rén)工(gōng)智(zhì)能领域提(tí)出了很多年，业界(jiè)也(yě)有不少(shǎo)技术突(tū)破(pò)，但是(shì)，多模(mó)态大(dà)模型进一步往下走，算力需(xū)求呈几何(hé)式上升，一般的算力(lì)基础设施很(hěn)快将(jiāng)难(nán)以胜任。

从图像、文字、语音单(dān)独一(yī)项的训练，到双模态(tài)、三模态(tài)的跃迁，让人工(gōng)智能可以灵活应对不同(tóng)模态的转化、像人与世界交互一样(yàng)自然(rán)，这方面(miàn)，由算(suàn)力网络(luò)来驱动将有明(míng)显优势。