橘子百科-橘子都知道橘子百科-橘子都知道

马美如简介

马美如简介 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微软公(gōng)司创始人比尔·盖茨(cí)已多次(cì)公开谈论人工智能话(huà)题。在最(zuì)近的一次采访中(zhōng),他再次表(biǎo)示:“AI可能会让科技行业(yè)迎来一次剧烈的洗牌(pái)”。

这个结论是他在当地时间2月20日接(jiē)受《In Good Company》节(jié)目专访时提出的。

他预期,AI的(de)发展可能会威胁到谷歌(gē)的市(shì)占率,因(yīn)为微软(ruǎn)在AI方面的(de)行动相当迅(xùn)速(sù)。而(ér)最终科技巨头将把AI整合成用户的(de)“全能助手”,包揽一切应用,与人(rén)们进行(xíng)沟通并提供建(jiàn)议,可以取代亚马逊、Siri或(huò)Outlook等应用。

大佬口中全能助手的到来可能尚需(xū)时日,但由ControlNet引发(fā)的又一次AI绘画浪潮(cháo),让AIGC在ChatGPT的话题热点包围(wéi)中杀出(chū)重围(wéi)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能(néng)量

01

ControlNet颠覆(fù)AI绘(huì)画新玩(wán)法

AIGC向可(kě)控靠近

以(yǐ)AI绘画(huà)为代表的(de)AIGC上一次爆火的时候,还是2022年8月,在美国科罗拉多州举(jǔ)办的新兴数(shù)字艺(yì)术家竞赛中,一幅名(míng)为(wèi)《太空歌剧院》的作(zuò)品获奖。

随后各大厂商的AI绘画软件被广大网友熟(shú)知并体验,Stable Diffusion便是(shì)其中代表。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗牌科技行业?_黑(hēi)料(liào)正(zhèng)能量(liàng)

用户们可(kě)以在应用中输(shū)入一组(zǔ)关键词(cí)或者一(yī)张照片,就能获得一幅AI创作的画(huà)作。

作画的(de)关键就是所输(shū)入的文本(běn)。同(tóng)一(yī)组关键词也可以创作出很多张(zhāng)风格不一(yī)样的(de)画作,这让创(chuàng)作的(de)过程就像开盲盒(hé)。

很(hěn)多用(yòng)户很喜欢这(zhè)种不(bù)确定的(de)惊喜,他(tā)们会将生成的美图当做(zuò)头像。而另一部分喜欢翻(fān)看AI绘画的(de)“翻车”作品。在(zài)社交媒体上(shàng),许多用户分享AI“翻车现场”,例如,一位(wèi)网(wǎng)友(yǒu)的小狗(gǒu)照片被AI画成了“肌肉男”,还有(yǒu)网友的个人照片被AI识别成(chéng)了建筑。

而如今随(suí)着ControlNet的出现与加持(chí),以往AI绘画的填写(xiě)关(guān)键词游戏可能要被(bèi)颠覆了。

ChatGPT之后又(yòu)一应用(yòng)杀疯(fēng)了,AIGC或(huò)进入可(kě)控期,将洗牌科技(jì)行业(yè)?_黑料正能量

ControlNet是一位正在斯坦福读博的中国(guó)人张吕敏创作的一种(zhǒng)基于控制点(diǎn)的图像(xiàng)变(biàn)形算法,主要(yào)用于数字图像处理、计算(suàn)机视(shì)觉和计算机(jī)图形学等领域。

其SD插件一经发布,在短(duǎn)短的(de)两(liǎng)天内(nèi)便成为了AI绘画领(lǐng)域最新的热点(diǎn)。

在(zài)此之前,大(dà)家用(yòng)了很多(duō)方法想让AI生(shēng)成的结(jié)果(guǒ)尽可能的符合(hé)要求,但是(shì)都不(bù)尽如人意(yì),它的出(chū)现代表着AI生成(chéng)开始(shǐ)进(jìn)入(rù)真正的可控时期。

因为ControlNet可(kě)以直接提取画面的构图(tú),人(rén)物(wù)的(de)姿(zī)势和(hé)画面(miàn)的深(shēn)度信息等。有了它的帮助,就不(bù)用(yòng)频繁的用提示词来碰运气,抽盲盒(hé)式(shì)的(de)创作了。

通俗(sú)的(de)说ControlNet相(xiāng)当(dāng)于(yú)给AI绘画加(jiā)了(le)“魔法”,不少博主的作品已经获(huò)得了大量(liàng)的浏(liú)览量(liàng),“viggo”就是(shì)其中之一,他用朋(péng)友的照片直接带她们走进动漫世界。

ChatGPT之后(hòu)又一应用(yòng)杀(shā)疯了,AIGC或进入(rù)可(kě)控期(qī),将洗牌科技行业(yè)?_黑料正能量

viggo先用(yòng)StableDiffusion图片(piàn)转(zhuǎn)文字。

再用Text2Prompt插件拓展找到(dào)对(duì)应的关(guān)键词;最后用ControlNet插件绑(bǎng)定骨(gǔ)骼开始换关键词试效(xiào)果(guǒ)。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科技行(xíng)业?_黑料(liào)正能量

通过(guò)图片就可以(yǐ)看出(chū)来(lái),效果十分(fēn)惊艳。

ChatGPT之后又一(yī)应用杀疯(fēng)了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

ChatGPT之后又一应用杀疯了(le),AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

更厉害的是,除了真(zhēn)实(shí)的照片,草(cǎo)图也可以加上“魔法”,知乎大牛“DevPoint”和(hé)“逗(dòu)砂”介绍到ControlNet还能实现线稿转全彩图。大神张吕(lǚ)敏其本尊也亲自回应。

ChatGPT之后又一(yī)应(yīng)用杀疯(fēng)了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌科技行(xíng)业?_黑料(liào)正能量

不得不说当下AIGC已经变得越(yuè)来越强大,甚至输出的作(zuò)品都已经能以假乱真了。

02

难辨虚实(shí),AIGC技(jì)术力爆发

警惕安全问(wèn)题

近日(rì),“苏州金鸡(jī)湖有(yǒu)游艇party”的消息火遍网络(luò),而(ér)经过警(jǐng)方辟(pì)谣这所谓的“party”可能(néng)是全(quán)国第一起AI绘图诈(zhà)骗(piàn)。

由于这个(gè)活动里面给出的(de)美女照(zhào)片(piàn)都是AI制作(zuò)的真人(rén)照片绘图,因为太逼真,被大家当成真事传播(bō)了

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科技行业?_黑料正能量(liàng)

不过仔细观察可以发现,活动发起者提供的(de)照片(piàn)中(zhōng)有个很大(dà)的(de)漏洞可以发现并非真(zhēn)人,而是(shì)AI绘图,那便是图片(piàn)中女(nǚ)性(xìng)的手指部分有的存在异常。

ChatGPT之后又一应用杀(shā)疯(fēng)了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能(néng)量(liàng)

有行(xíng)业人事表示:“现在因为手指部分的(de)绘(huì)画算法比较复(fù)杂,AI还不太会画人的手(shǒu),但最新看到(dào)的图片已经有越来越完美的(de)AI模型出现,以后可(kě)能就完全没有漏(lòu)洞了。

类(lèi)似的AI作(zuò)图诈骗在国外也已有发生。据英国广(guǎng)播公(gōng)司报道,土耳(ěr)其(qí)地震期间,有(yǒu)Tiktok用户使(shǐ)用AI合成了儿童受(shòu)灾的(de)假(jiǎ)照片发布到网(wǎng)络,以此诱骗(piàn)善良的人打赏“捐助”从(cóng)而实施诈骗。

目前(qián)随着技术发展,AIGC已经能做(zuò)出真人照片般(bān)的(de)绘(huì)图(tú)效果,如果(guǒ)这样的图片被用(yòng)来诈骗(piàn),将非常可怕。

此外AIGC还引发了很多担忧(yōu),一(yī)方面(miàn),批判者认(rèn)为AI在(zài)“学习(xí)”了大(dà)量前人的作品之后(hòu),其创作没有任(rèn)何情绪(xù)和(hé)灵魂,难以和人类的艺术创作相提并论。

另(lìng)一方(fāng)面(miàn),AIGC背后的版权、目前都(dōu)并没有得到有效的解(jiě)决,还有AIGC会不(bù)会代替人类“至高无上”的创意。

马斯(sī)克也强(qiáng)调(diào),人工智(zhì)能的安全问题需要得到重视,太(tài)晚就(jiù)来不(bù)及了。

03

AIGC下(xià)一站除了视(shì)频,还有远方(fāng)

技术都是有两面性的,潜在(zài)的危害并(bìng)不(bù)能掩(yǎn)盖(gài)其光辉的贡献。现(xiàn)在看来,人(rén)工智能技术将是第(dì)四次工业革命的核心驱动力量,将创造新的(de)增长奇迹。

过去一年,人工智能在技术和商业(yè)层面都有了巨(jù)大进展,AI绘画(huà)就是人(rén)工(gōng)智(zhì)能技(jì)术发生方(fāng)向性改(gǎi)变的一个(gè)代(dài)表。其下一站或许就是视频。

此前,Meta和谷歌先后发布了几条引爆科技圈(quān)的短视频。这些视频(pín)引发关注(zhù)并非内(nèi)容(róng)做得多优秀(xiù),反而都(dōu)非常简单(dān),比如一匹正在喝水(shuǐ)的马,一只画画的玩(wán)具熊,或(huò)者一段骑摩托车的第(dì)一视角录(lù)像,随便(biàn)一个(gè)有手机的人(rén)都可以随手录下一段。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量

但这些短视频的(de)创(chuàng)作方式(shì)非常简单,创作者仅(jǐn)仅需要向AI输入一段话,甚(shèn)至只是说一下要(yào)求,AI就(jiù)可以根据需(xū)要生成一段视(shì)频。

谷歌发布的两个AI生成视频分别来(lái)自于Imagen Video和Phenaki,前者主要突(tū)出(chū)的是高(gāo)清,与Meta的Make-A-Video没(méi)有太多的差别。

在Make-A-Video公(gōng)布了AI生成的视(shì)频后(hòu),AI圈就已经玩(wán)了(le)一(yī)波梗,一个能(néng)够(gòu)做出更高清视频的AI还不足以(yǐ)在短时间内(nèi)戳中兴(xīng)奋点。

Phenaki更(gèng)加(jiā)令(lìng)人震惊(jīng)的地方在于,它可以制作(zuò)出超(chāo)过2分钟的连贯的也有(yǒu)确切内容(róng)的视频,这才(cái)是真(zhēn)正让(ràng)人(rén)们感到惊喜的地方。因为无(wú)论AI生成的视频多么(me)高清,也只能是为(wèi)内容生(shēng)产者提供一个灵感,一(yī)个素材,一个过场动画(huà)。

不过能够(gòu)制作出有具体剧情内容(róng)的视频就(jiù)意味着,一些视频创作(zuò)由AI代替人(rén)工完成已经初步有了可能。

当(dāng)下(xià)AI的(de)发展速度已经(jīng)超过大部分人的想(xiǎng)象。内容(róng)产业的本质(zhì)是供给创造需(xū)求,AIGC作为全新的内容(róng)生产方式(shì),可以(yǐ)为内容产业带来更新(xīn)的内(nèi)容(róng)风格(gé)、更快(kuài)的生产速度,更低的生产(chǎn)成(chéng)本,这(zhè)无疑会驱动内容(róng)产业的大爆(bào)发。

除了AI绘图、视频,AIGC技(jì)术(shù)还能应用于音乐(lè)、代码、机器人动作(zuò)等多(duō)种(zhǒng)内容形式的(de)生成。不难发(fā)现该项技术不仅在游戏(xì)等行业能(néng)得(dé)到有(yǒu)效应(yīng)用(yòng),对(duì)于(yú)下一代互(hù)联网各(gè)种元素的构(gòu)建亦有关键意义(yì)。

从商业化(huà)的角度来看,文化娱乐、教育(yù)、传媒等诸多领域,本身就对基于AI的可视化内(nèi)容有强烈需求(qiú)。

因此,AI绘画及视频或不是结(jié)果(guǒ),而只是AI进程中的一块重要拼图(tú),有望在(zài)技(jì)术更新(xīn)的加持下实现更大的应(yīng)用价值。

AI从理(lǐ)解内容(róng),走(zǒu)向了可以生成(chéng)内容,甚至能够创造出独立价值和独立视角的(de)内(nèi)容(róng)。AIGC的再次(cì)出圈,更代表着未来(lái)的(de)先进生产力即将到来。

ChatGPT之(zhī)后又(yòu)一应用杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑(hēi)料正能量

04

紧抓(zhuā)大模型与(yǔ)算力,牢固(gù)AIGC底(dǐ)座

从技术的发展也可以看出,在语言大模(mó)型、图像(xiàng)大模型之后,多模态大模型已(yǐ)经成为了新的趋势。

大(dà)模型被誉为当前人工智(zhì)能(néng)发(fā)展的智能底(dǐ)座,是全(quán)球竞(jìng)争最激烈的研究方向(xiàng)之一(yī),包括谷歌、亚马逊(xùn)、百度(dù)、阿里、腾讯等众多头部企业都在竞相发力。

不过训(xùn)练大(dà)模型的(de)确价格(gé)不菲,以国盛证券发布的《ChatGPT需要多少算(suàn)力》报告估算(suàn),GPT-3训练一次的成(chéng)本约为140万(wàn)美元。而对(duì)于一些更大的LLM(大型语(yǔ)言模型),训练成本则介于200万美元至1200万美(měi)元高价之间。

以ChatGPT在2023年1月的独立访客平均数(shù)1300万计算,其对应芯片需求为(wèi)3万多(duō)片英伟达A100 GPU,初始投入成本(běn)约为8亿美元,每日(rì)仅电(diàn)费就在5万美元左右。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料(liào)正能量

此外不论(lùn)是ChatGPT还是AIGC,都离不开庞大算(suàn)力支持。在关注各类大模型的发展同时(shí),更(gèng)应该关注算力网络的建设。

算力网(wǎng)络(luò)正驱动AI产业发展(zhǎn)进入史诗(shī)级加速进程,让AIGC及通用AI这一人工智能发展的(de)终极目标离(lí)得更近。

因为(wèi)算(suàn)力可以对突破性技术创新提供大力的(de)支持(chí)。这方面,多模态(tài)大模型(xíng)是典型。作(zuò)为(wèi)面向(xiàng)未来(lái)强人工智能(néng)、通用人工智能的重要技术创新,多模态大模型(xíng)已经在人(rén)工智能(néng)领域提(tí)出了很(hěn)多年,业(yè)界也(yě)有不少(shǎo)技术突破,但是,多(duō)模态大模(mó)型(xíng)进一步往下(xià)走,算(suàn)力需求呈几何式(shì)上升,一般的算力基(jī)础(chǔ)设(shè)马美如简介施很快将难以胜任。

从图像、文(wén)字、语音(yīn)单独一(yī)项(xiàng)的训练,到双(shuāng)模态、三模态的(de)跃迁,让人工智能(néng)可(kě)以灵活应对不(bù)同(tóng)模态的转化、像(xiàng)人与世界交互一样自然,这方面,由算力网(wǎng)络来驱(qū)动将有(yǒu)明显优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期(qī),将(jiāng)洗牌科技行(xíng)业?_黑料(liào)正能量

此外,还(hái)有很多需(xū)要爆发(fā)式增长(zhǎng)的算力来支撑(chēng)的技术创新(xīn),将在人(rén)工智能算力网络支撑下快速推进。

AIGC已经露出曙光,期(qī)待在大模型和(hé)大算力的支持下AIGC能持续颠覆内(nèi)容(róng)生(shēng)产的方(fāng)式,将创造的(de)边际成本降低(dī),让(ràng)万众受益。

未经允许不得转载:橘子百科-橘子都知道 马美如简介

评论

5+2=