橘子百科-橘子都知道橘子百科-橘子都知道

莫问前程上一句是啥 莫问前程的意思

莫问前程上一句是啥 莫问前程的意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人(rén)ChatGPT火爆以来,微软公(gōng)司创始(shǐ)人比尔(ěr)·盖茨(cí)已多次公开谈论人工(gōng)智能话(huà)题。在最近(jìn)的一次采访中,他再次表示:“AI可能(néng)会让(ràng)科技(jì)行业迎来一次剧烈的洗牌”。

这个结论是(shì)他在当地(dì)时间(jiān)2月20日接受《In Good Company》节目专(zhuān)访时(shí)提出(chū)的。

他预期,AI的发展可(kě)能会威(wēi)胁到谷歌的市占率,因为微软(ruǎn)在AI方面的行动相当迅(xùn)速。而最(zuì)终科技巨头将(jiāng)把AI整合(hé)成用(yòng)户的“全能助手”,包揽一切应用(yòng),与(yǔ)人们进行沟通并提供(gōng)建(jiàn)议,可以取代(dài)亚马逊(xùn)、Siri或(huò)Outlook等应用。

大(dà)佬口中全能助手的到来(lái)可能(néng)尚需时日(rì),但由ControlNet引发的又(yòu)一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题热点包围中杀出(chū)重围(wéi)。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆AI绘(huì)画(huà)新玩法

AIGC向可控靠(kào)近

以AI绘画(huà)为代表的AIGC上一次爆火的时候(hòu),还是2022年8月,在美国科罗拉多州举(jǔ)办的新兴数字(zì)艺术家竞(jìng)赛(sài)中,一幅名为《太空(kōng)歌(gē)剧(jù)院(yuàn)》的作(zuò)品获奖。

随后(hòu)各(gè)大厂商(shāng)的AI绘画(huà)软件被广大网友熟知并体验,Stable Diffusion便是(shì)其中(zhōng)代表。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或(huò)进入可控期(qī),将洗(xǐ)牌科技行业?_黑料(liào)正能量

用户们可以在应用(yòng)中输入一(yī)组关(guān)键(jiàn)词或者一(yī)张照片,就能获得(dé)一幅AI创作的画(huà)作。

作画的(de)关键就是所(suǒ)输入的文本。同一(yī)组关键词也可以(yǐ)创作出很多(duō)张风格不(bù)一样(yàng)的画作,这让创作的过程就像开盲盒。

很多用户(hù)很喜(xǐ)欢这种(zhǒng)不确(què)定的惊喜,他们会将生成的美图当(dāng)做头像(xiàng)。而另一部分喜(xǐ)欢翻(fān)看(kàn)AI绘画的“翻车”作品。在社交媒体(tǐ)上(shàng),许(xǔ)多用户分(fēn)享AI“翻车现场”,例(lì)如,一位(wèi)网(wǎng)友的小狗照片被AI画成了“肌肉男”,还有网友的个(gè)人照(zhào)片被AI识别成了建筑。

而(ér)如今随(suí)着ControlNet的出现与加(jiā)持(chí),以往AI绘画(huà)的(de)填写关键词游戏(xì)可能要被(bèi)颠覆了。

ChatGPT之后(hòu)又(yòu)一应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科技行业?_黑料(liào)正能量

ControlNet是一(yī)位正(zhèng)在斯坦(tǎn)福(fú)读(dú)博(bó)的(de)中(zhōng)国人(rén)张吕敏创(chuàng)作的一(yī)种基于控(kòng)制(zhì)点(diǎn)的图像(xiàng)变形算法,主要(yào)用于(yú)数字(zì)图像处理、计算机视觉和计算(suàn)机(jī)图形学等领(lǐng)域。

其SD插件一(yī)经发布,在短(duǎn)短的两天内(nèi)便成(chéng)为(wèi)了AI绘(huì)画(huà)领域最新的热点。

在此之前,大(dà)家用了很多方(fāng)法想让(ràng)AI生成的结果尽(jǐn)可(kě)能的符合要求,但是都不尽(jǐn)如人意(yì),它的出(chū)现代表(biǎo)着AI生成开始进入真正的可控时期。

因(yīn)为ControlNet可以(yǐ)直接(jiē)提取画面(miàn)的构图,人物的姿势和画面(miàn)的深度信(xìn)息等。有(yǒu)了它的(de)帮助,就不用频繁的用提示词(cí)来碰运气(qì),抽(chōu)盲盒式的创作了。

通俗(sú)的说(shuō)ControlNet相当(dāng)于给(gěi)AI绘(huì)画(huà)加了“魔(mó)法”,不少(shǎo)博主的作品已经获得了大(dà)量(liàng)的(de)浏览(lǎn)量,“viggo”就是其中之一,他(tā)用朋友的照片直接带她(tā)们走(zǒu)进动(dòng)漫世界。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌(pái)科技行业?_黑(hēi)料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关键词(cí);最后(hòu)用ControlNet插(chā)件(jiàn)绑定骨骼开始换关(guān)键词试效(xiào)果。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或(huò)进入(rù)可(kě)控期,将(jiāng)洗牌(pái)科技行(xíng)业(yè)?_黑(hēi)料正能(néng)量(liàng)

通(tōng)过图(tú)片就可以看出来,效果十分(fēn)惊艳。

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将洗牌科(kē)技(jì)行业?_黑料(liào)正(zhèng)能量

ChatGPT之(zhī)后又一应用杀疯(fēng)了(le),AIGC或进入可控期,将洗牌科技行(xíng)业(yè)?_黑料正能(néng)量

更厉(lì)害的是,除了真实的(de)照片,草图也可以加上“魔法”,知乎大牛(niú)“DevPoint”和“逗(dòu)砂(shā)”介绍(shào)到ControlNet还(hái)能实现(xiàn)线稿(gǎo)转全彩图。大神张吕敏其本尊也(yě)亲自回(huí)应。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌(pái)科技(jì)行业?_黑料正能(néng)量

不得不(bù)说当下AIGC已(yǐ)经变得越来越强大,甚(shèn)至输出的作(zuò)品都已经能(néng)以假乱真了。

02

难辨虚(xū)实(shí),AIGC技术力(lì)爆发

警惕安全问题(tí)

近日,“苏州金(jīn)鸡湖有游(yóu)艇party”的消息火(huǒ)遍(biàn)网络,而(ér)经过警方辟谣这(zhè)所谓(wèi)的(de)“party”可能是(shì)全国第一起AI绘图诈骗。

由于这个活(huó)动里面给出的美女照(zhào)片都是AI制作的真人照片绘图(tú),因为太逼真,被(bèi)大家当(dāng)成(chéng)真事传播了(le)

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控(kòng)期,将洗牌科技行(xíng)业?_黑料正能量

不过仔细观察(chá)可以(yǐ)发现(xiàn),活(huó)动发起者提供的照片中有个(gè)很大(dà)的漏洞可以(yǐ)发现并非(fēi)真人,而(ér)是AI绘(huì)图,那便是(shì)图片中女性的手指部分有的存在异常。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进入可控期,将(jiāng)洗牌科(kē)技行(xíng)业?_黑(hēi)料(liào)正能量

有行业人(rén)事表示:“现在(zài)因(yīn)为手指部分的绘画算法比较复杂(zá),AI还不太会画(huà)人(rén)的手,但(dàn)最(zuì)新(xīn)看到的图片已经有越来越完美的AI模型出现,以后(hòu)可能(néng)就(jiù)完(wán)全没有漏洞(dòng)了。

类(lèi)似的AI作图诈(zhà)骗在国外也(yě)已有发生。据英国广播(bō)公司报道,土耳其地震期间,有(yǒu)Tiktok用户使用(yòng)AI合成了儿童受灾的(de)假照片发布(bù)到网络(luò),以此诱骗善(shàn)良的(de)人打赏(shǎng)“捐助”从而实施(shī)诈骗。

目(mù)前(qián)随着技术(shù)发展,AIGC已经能(néng)做出真人照片般的(de)绘图效(xiào)果,如果这样的图片被用来诈骗,将非常可怕。

此外(wài)AIGC还引发了很多担(dān)忧,一(yī)方面(miàn),批判者认为(wèi)AI在(zài)“学习”了大(dà)量(liàng)前人的作品之后,其(qí)创(chuàng)作没(méi)有任何情绪和灵魂,难(nán)以和人(rén)类的艺术创作相提并论(lùn)。

另一(yī)方面(miàn),AIGC背(bèi)后的版权(quán)、目前都并(bìng)没有得到有(yǒu)效的解(jiě)决(jué),还有AIGC会不会代替(tì)人类“至高无上”的创(chuàng)意。

马(mǎ)斯克也(yě)强调(diào),人工(gōng)智能的安全问题需要(yào)得到重视,太晚就来不及了。

03

AIGC下一站(zhàn)除了视(shì)频,还(hái)有远方(fāng)

技(jì)术都是有两面性(xìng)的,潜在的危(wēi)害并不能掩(yǎn)盖(gài)其(qí)光辉(huī)的贡献(xiàn)。现在看(kàn)来,人工智(zhì)能技术将是(shì)第(dì)四次(cì)工业革命的核心(xīn)驱动(dòng)力(lì)量,将(jiāng)创造新的增(zēng)长奇迹。

过去一年,人工智能在技术和(hé)商业(yè)层面(miàn)都有(yǒu)了巨大进展,AI绘画就是人工智能技术发生方向(xiàng)性改变的(de)一个代表。其下一站(zhàn)或许就是视频。

此前,Meta和谷歌先后发布了几条(tiáo)引爆(bào)科技圈的(de)短视频。这些(xiē)视频引发关注并非(fēi)内(nèi)容做得多(duō)优秀,反(fǎn)而(ér)都非常(cháng)简单(dān),比如一匹正在(zài)喝水的马,一只(zhǐ)画画的玩具熊,或者一段骑摩托车的第(dì)一视角录像,随(suí)便一个(gè)有手机的人都(dōu)可以随(suí)手录(lù)下一段。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正能量

但这些短视频的(de)创作(zuò)方式非常简单(dān),创作者仅仅(jǐn)需(xū)要向(xiàng)AI输入一(yī)段话,甚至(zhì)只(zhǐ)是说一下要求,AI就可以(yǐ)根据(jù)需要生成一段视频(pín)。

谷歌发布的(de)两个AI生成视频分别来(lái)自(zì)于Imagen Video和(hé)Phenaki,前者主(zhǔ)要莫问前程上一句是啥 莫问前程的意思突出的是高清,与Meta的Make-A-Video没有太多的差别(bié)。

在Make-A-Video公布了AI生(shēng)成(chéng)的视频后(hòu),AI圈就已经玩了一(yī)波梗,一个能够(gòu)做出更高清视频的AI还不(bù)足以在短时间内(nèi)戳中兴奋点。

Phenaki更加(jiā)令人震惊(jīng)的(de)地方(fāng)在于(yú),它可以制作出(chū)超过2分钟的(de)连(lián)贯的也有确(què)切内容的(de)视频,这才是(shì)真正让人们(men)感(gǎn)到惊喜的地方。因(yīn)为无(wú)论AI生成的视频多么高清,也只能是为内(nèi)容生产(chǎn)者提供一个灵感,一个(gè)素材,一个过(guò)场动画。

不过(guò)能够制(zhì)作出有具体(tǐ)剧情内(nèi)容的视频就意味着,一些视(shì)频创作由AI代替人工完成已经初步有了可能。

当(dāng)下AI的发展速度已经(jīng)超过大部分人的想象。内容产业的本(běn)质(zhì)是供给创造(zào)需求,AIGC作为全(quán)新(xīn)的(de)内容生产方式,可以为内容产业带来(lái)更新的内容风格(gé)、更快的生产(chǎn)速度,更低的生产成(chéng)本,这无疑(yí)会(huì)驱动(dòng)内容(róng)产业(yè)的大爆发。

除(chú)了AI绘图、视频,AIGC技术还能应用于音乐、代(dài)码、机器(qì)人动作(zuò)等多种内容形式的生成。不难发现该项(xiàng)技(jì)术不仅在(zài)游(yóu)戏等行业能得到(dào)有效应用,对于下一代互(hù)联网各种元素(sù)的构建亦有关键意义。

从(cóng)商业化(huà)的角度(dù)来看,文化娱乐(lè)、教育(yù)、传(chuán)媒等诸多(duō)领域,本(běn)身就(jiù)对基于AI的(de)可视化内(nèi)容有强烈需求。

因此,AI绘画及视频或不(bù)是结果,而(ér)只(zhǐ)是(shì)AI进程中(zhōng)的一块重要拼图,有望在(zài)技术更(gèng)新(xīn)的(de)加(jiā)持(chí)下实现更大的应用价值。

AI从理解内容,走向了可以生成内容,甚(shèn)至(zhì)能够创造出独立价值和独(dú)立视角(jiǎo)的(de)内容。AIGC的再次(cì)出圈,更代(dài)表着(zhe)未(wèi)来的先进生产力即将到来。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进(jìn)入可控期(qī),将洗(xǐ)牌(pái)科技行业?_黑料正(zhèng)能量

04

紧抓大模型与算(suàn)力,牢固AIGC底座(zuò)

从(cóng)技术的发展也(yě)可以看出,在语言大模(mó)型、图(tú)像大模型(xíng)之后,多(duō)模态(tài)大模型(xíng)已经(jīng)成为了新(xīn)的趋势。

大(dà)模型被誉为当前人工智能发展的智能底座,是(shì)全球(qiú)竞争最激(jī)烈的研(yán)究(jiū)方向(xiàng)之一(yī),包括谷歌、亚马(mǎ)逊、百度(dù)、阿里、腾讯等众多头部企业都(dōu)在竞(jìng)相发力。

不(bù)过训练(liàn)大模(mó)型的确(què)价格(gé)不菲,以国盛(shèng)证券(quàn)发(fā)布的《ChatGPT需要(yào)多少算力》报告估算,GPT-3训练一次的(de)成本约为140万美元。而对于一些更大(dà)的LLM(大(dà)型语言模型),训(xùn)练成本(běn)则(zé)介于200万(wàn)美元至1200万美元高价之间。

以ChatGPT在2023年1月的独立访客平均数1300万计算,其对应芯片(piàn)需求为3万多片英(yīng)伟达A100 GPU,初始投(tóu)入成本约为8亿(yì)美元,每日(rì)仅电费(fèi)就在(zài)5万美元左右(yòu)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗(xǐ)牌科(kē)技行业?_黑料正(zhèng)能(néng)量

此外不论(lùn)是ChatGPT还是AIGC,都离不开(kāi)庞(páng)大算力支(zhī)持。在关注各(gè)类大(dà)模(mó)型(xíng)的发(fā)展同时,更应该(gāi)关注算力网络的建设。

算力网络正驱(qū)动AI产业发展进(jìn)入史诗级加速(sù)进程,让AIGC及通用(yòng)AI这(zhè)一人工(gōng)智能发展的终极目标离得更近(jìn)。

因为算力可以(yǐ)对突破性技术创(chuàng)新提供(gōng)大力的(de)支持。这方面,多模态大模型是(shì)典型。作(zuò)为面向(xiàng)未来强(qiáng)人工智能、通用人工智能的重(zhòng)要技术(shù)创新,多(duō)模态大模型已(yǐ)经在人(rén)工(gōng)智(zhì)能领域提(tí)出了很多年,业界(jiè)也(yě)有不少(shǎo)技术突(tū)破(pò),但是(shì),多模(mó)态大(dà)模型进一步往下走,算力需(xū)求呈几何(hé)式上升,一般的算力(lì)基础设施很(hěn)快将(jiāng)难(nán)以胜任。

从图像、文字、语音单(dān)独一(yī)项的训练,到双模态(tài)、三模态(tài)的跃迁,让人工(gōng)智能可以灵活应对不同(tóng)模态的转化、像人与世界交互一样(yàng)自然(rán),这方面(miàn),由算(suàn)力网络(luò)来驱动将有明(míng)显优势。

ChatGPT之(zhī)后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期(qī),将(jiāng)洗牌科技行业(yè)?_黑料正(zhèng)能量

此(cǐ)外(wài),还(hái)有很多需要爆发式增长的算力来支撑的技术创新,将在人工智能算力(lì)网络支撑下快速推进。

AIGC已经露出曙(shǔ)光,期待(dài)在大模型和大算力(lì)的支持(chí)下AIGC能持续颠(diān)覆(fù)内容(róng)生(shēng)产的(de)方式,将创造的边际成本降(jiàng)低(dī),让万(wàn)众受益。

未经允许不得转载:橘子百科-橘子都知道 莫问前程上一句是啥 莫问前程的意思

评论

5+2=