自聊天机器人(rén)ChatGPT火爆以(yǐ)来,微软公司创始人比尔·盖茨已多次(cì)公开(kāi)谈论人工智能话题。在最(zuì)近的一次采访中,他再次(cì)表示:“AI可能会让科(kē)技行(xíng)业迎来一次剧(jù)烈的洗牌”。
这个结(jié)论(lùn)是他在当(dāng)地时间2月20日接受《In Good Company》节目(mù)专访时提出的(de)。
他预期,AI的发展可能会(huì)威(wēi)胁(xié)到谷歌(gē)的市占率,因(yīn)为(wèi)微(wēi)软在AI方面的行(xíng)动相当(dāng)迅速(sù)。而最(zuì)终科(kē)技巨(jù)头将把(bǎ)AI整合成用户的“全(quán)能助手”,包揽一切应(yīng)用(yòng),与人们进行沟(gōu)通(tōng)并提(tí)供(gōng)建(jiàn)议,可以取代亚马(mǎ)逊(xùn)、Siri或Outlook等应(yīng)用。
大佬口中全能助手的到(dào)来可能尚(shàng)需时日,但由ControlNet引发的(de)又一(yī)次(cì)AI绘(huì)画浪潮,让AIGC在ChatGPT的话题热点包围中杀(shā)出重围。
01
ControlNet颠覆(fù)AI绘画新玩(wán)法
AIGC向可控靠近
以AI绘画为代表的AIGC上一次爆火的时候(hòu),还是2022年8月,在美国科罗拉多州(zhōu)举(jǔ)办的新兴数(shù)字艺(yì)术家竞(jìng)赛中,一幅名(míng)为《太(tài)空歌(gē)剧院(yu轻轨是什么,轻轨是地铁还是高铁àn)》的作品获(huò)奖。
随后各大厂商的AI绘画软件被广大(dà)网友熟知并体验,Stable Diffusion便是(shì)其中代表(biǎo)。
用户(hù)们可以(yǐ)在(zài)应用中(zhōng)输(shū)入(rù)一组关键词或者一张(zhāng)照(zhào)片,就能获得一幅AI创作的画作。
作画(huà)的关键(jiàn)就是所输入的文本。同一组关键词也可以创作出很多张(zhāng)风(fēng)格不一样(yàng)的(de)画作,这让(ràng)创(chuàng)作的过(guò)程(chéng)就像(xiàng)开盲盒。
很多用户很喜欢这种不确定(dìng)的惊喜(xǐ),他们会将生成的美图当做头像。而另一部分喜欢(huān)翻(fān)看AI绘画的(de)“翻车(chē)”作品。在社交媒体上(shàng),许多用户分(fēn)享AI“翻(fān)车现场”,例如(rú),一位网友的小狗照片被AI画成了“肌肉男”,还有网友的(de)个人照片(piàn)被AI识别(bié)成了建筑。
而如今随着(zhe)ControlNet的出现(xiàn)与(yǔ)加持,以往AI绘画的填(tián)写关键词游戏可能要被颠覆了(le)。
ControlNet是一位正(zhèng)在斯坦(tǎn)福读博的中国人张吕敏(mǐn)创作的(de)一种基于控(kòng)制点的图像变形算法,主要用于数字(zì)图像处理、计算机视觉和计算机(jī)图形学(xué)等领(lǐng)域。
其SD插件(jiàn)一经发布,在短短的两(liǎng)天内(nèi)便成为了AI绘画领域最新的热点(diǎn)。
在此之(zhī)前(qián),大(dà)家(jiā)用了很多方(fāng)法(fǎ)想让AI生(shēng)成的结果(guǒ)尽可能的符合要求,但是都(dōu)不(bù)尽(jǐn)如(rú)人意,它的(de)出现(xiàn)代(dài)表(biǎo)着AI生成开始进入真(zhēn)正(zhèng)的(de)可(kě)控时期。
因(yīn)为ControlNet可以直接提取画面(miàn)的构图(tú),人物的姿势和画面的深度信息等。有了它的帮(bāng)助,就(jiù)不(bù)用(yòng)频繁的(de)用提(tí)示词来碰运气,抽(chōu)盲盒式(shì)的创作了。
通(tōng)俗的(de)说(shuō)ControlNet相当于(yú)给(gěi)AI绘(huì)画加了(le)“魔法”,不(bù)少博主(zhǔ)的作品已经获(huò)得了大(dà)量的浏(liú)览量,“viggo”就(jiù)是其中之(zhī)一,他(tā)用朋友的照片直接带她们走(zǒu)进(jìn)动漫(màn)世界。
viggo先用StableDiffusion图片(piàn)转文字。
再用(yòng)Text2Prompt插件拓展找到对应的(de)关键词;最(zuì)后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始换关键词试效(xiào)果。
通过图片(piàn)就可(kě)以看出来,效果十(shí)分(fēn)惊艳。
更厉害的是,除了真(zhēn)实的照(zhào)片(piàn),草图也可以加上(shàng)“魔(mó)法”,知乎(hū)大(dà)牛“DevPoint”和“逗砂”介(jiè)绍到(dào)ControlNet还能实(shí)现线稿转(zhuǎn)全彩图。大神张吕敏其本尊也(yě)亲(qīn)自回(huí)应。
不得不说(shuō)当下AIGC已(yǐ)经(jīng)变(biàn)得越来越(yuè)强大,甚至输出的作品都已经能以假乱(luàn)真了。
02
难(nán)辨虚实,AIGC技(jì)术力爆发(fā)
警惕安全问题
近日(rì),“苏州金(jīn)鸡湖有游艇party”的(de)消息火遍网络(luò),而经过警方(fāng)辟谣这所谓的“party”可能(néng)是全国第一起AI绘图诈骗。
由(yóu)于这个活动里面给出的美女照(zhào)片都是(shì)AI制(zhì)作(zuò)的真人照(zhào)片绘(huì)图,因为(wèi)太逼真,被大家当成(chéng)真事传播了。
不过仔细(xì)观察可(kě)以发现,活动发(fā)起者(zhě)提供(gōng)的(de)照片中有个很大的漏洞可以发(fā)现并非真人,而是AI绘图,那便(biàn)是图片中女性的手指部分有的(de)存在异(yì)常(cháng)。
有(yǒu)行业人事(shì)表示:“现(xiàn)在因为手(shǒu)指部分的(de)绘画(huà)算法(fǎ)比较复杂(zá),AI还不太会(huì)画人的手(shǒu),但最(zuì)新看(kàn)到(dào)的(de)图片已经有越来越(yuè)完美的AI模(mó)型出现,以(yǐ)后(hòu)可能就完全没有漏洞了(le)。”
类似的AI作图诈骗(piàn)在国外也已有发生。据英国广播公司报道,土耳其(qí)地(dì)震(zhèn)期间(jiān),有Tiktok用户(hù)使(shǐ)用AI合成了儿(ér)童受灾的假照片发布到网络(luò),以(yǐ)此诱骗善良的人(rén)打赏“捐助”从而(ér)实施诈骗。
目前随着技(jì)术发(fā)展(zhǎn),AIGC已经能做出真(zhēn)人照片(piàn)般的(de)绘图效(xiào)果,如果这样的图片被用来诈骗,将(jiāng)非常可怕。
此外AIGC还引发了很(hěn)多(duō)担忧,一方面,批判者认(rèn)为AI在“学习(xí)”了大量前(qián)人(rén)的作品之后,其创作没有任何情绪和灵(líng)魂,难以和人类的艺术创作相提并(bìng)论(lùn)。
另一方(fāng)面(miàn),AIGC背后(hòu)的版权、目(mù)前都并没有得(dé)到有效的解决,还(hái)有(yǒu)AIGC会不会(huì)代(dài)替人类(lèi)“至高无上(shàng)”的创意。
马斯克也强调,人(rén)工智(zhì)能(néng)的安全(quán)问(wèn)题需要得到重视,太晚就(jiù)来不及了(le)。
03
AIGC下一站(zhàn)除了视频,还有远方
技术都(dōu)是有两(liǎng)面性的(de),潜在(zài)的(de)危害并不能掩盖其光辉的贡献(xiàn)。现在看来(lái),人(rén)工智能技(jì)术将(jiāng)是第四次工业革命的(de)核心驱动力量,将创造新的(de)增长奇迹。
过去一(yī)年,人工智能在技术和(hé)商业(yè)层(céng)面都(dōu)有了巨大进展(zhǎn),AI绘(huì)画就是(shì)人工智能技术发生方向性(xìng)改变的一个代表(biǎo)。其下(xià)一站或许(xǔ)就是视(shì)频(pín)。
此前(qián),Meta和谷歌先后(hòu)发(fā)布了几条引爆科技圈的短视频(pín)。这些(xiē)视频引发(fā)关注(zhù)并非(fēi)内容做得多优秀,反而(ér)都非常简单,比(bǐ)如一匹正在喝水(shuǐ)的马(mǎ),一只画画的玩具熊(xióng),或者一段(duàn)骑摩托车(chē)的第一(yī)视角录(lù)像,随便(biàn)一个有手(shǒu)机(jī)的人都可以随(suí)手(shǒu)录下一(yī)段。
但这些短视频的创作方式非常简单(dān),创作者仅仅需要向AI输(shū)入一(yī)段(duàn)话,甚(shèn)至只(zhǐ)是说一下要求(qiú),AI就可以(yǐ)根据需要生成一段(duàn)视频(pín)。
谷歌(gē)发布的两个AI生(shēng)成(chéng)视(shì)频分别来自于(yú)Imagen Video和Phenaki,前者主要突出的(de)是高清,与Meta的Make-A-Video没有太多的差别(bié)。
在Make-A-Video公布(bù)了AI生成(chéng)的视频后,AI圈就已经玩了一波(bō)梗,一个能够做出更(gèng)高清视频的AI还不足以在短(duǎn)时(shí)间内(nèi)戳中兴奋点。
Phenaki更(gèng)加令人震惊(jīng)的地方在于(yú),它可(kě)以制作(zuò)出超过2分钟的连(lián)贯(guàn)的(de)也有(yǒu)确切内容的视(shì)频,这才是真正让人(rén)们感到惊喜的地方(fāng)。因为无论(lùn)AI生成的视(shì)频多么高清(qīng),也只能是为内容生产者提(tí)供(gōng)一个灵(líng)感,一个(gè)素(sù)材,一个(gè)过场动画。
不过能(néng)够制作出有具体剧情内容的视频就意(yì)味着,一(yī)些视频创作由AI代替人(rén)工(gōng)完成已经初步有了可能。
当下AI的发展速(sù)度已经超过大部分人(rén)的想象。内容产业的本质是供给创造(zào)需求(qiú),AIGC作为全新的内容生(shēng)产(chǎn)方式,可(kě)以(yǐ)为内容产(chǎn)业带来更(gèng)新的(de)内容(róng)风格、更快的生产速(sù)度,更低的生(shēng)产(chǎn)成本(běn),这无疑会驱动内(nèi)容产业的大爆发。
除了AI绘图(tú)、视频,AIGC技术还能应用于音乐、代码(mǎ)、机(jī)器人动作(zuò)等(děng)多种内容形式(shì)的(de)生(shēng)成(chéng)。不难发现(xiàn)该项(xiàng)技术(shù)不(bù)仅(jǐn)在游戏等行业(yè)能得到(dào)有效(xiào)应(yīng)用,对于(yú)下一代互联网各种元素的构建亦有关键意义。
从商业化的角(jiǎo)度来看,文化娱乐、教育、传媒等诸多领域,本身就对(duì)基于AI的可视(shì)化内(nèi)容有强烈(liè)需(xū)求。
因(yīn)此,AI绘画(huà)及视频或不是(shì)结果(guǒ),而只是AI进(jìn)程中的一(yī)块重要(yào)拼图,有望在技术(shù)更新的加持(chí)下实现更(gèng)大的应(yīng)用价值(zhí)。
AI从理解内容,走向了可以(yǐ)生成内容,甚至能(néng)够创造出(chū)独立价值(zhí)和独(dú)立视角(jiǎo)的内容(róng)。AIGC的再(zài)次(cì)出圈,更代表着未来(lái)的先进生产(chǎn)力即(jí)将到来。
04
紧抓大模型与算力(lì),牢固AIGC底座
从(cóng)技术的发展也可以看出,在语言(yán)大模型、图像大模型之后,多模态大模型已(yǐ)经成为(wèi)了(le)新的趋势。
大模型(xíng)被(bèi)誉为当前人工智能发展的智能底座,是全(quán)球竞争最激烈的研(yán)究方向之一,包括谷歌、亚马逊、百度、阿里、腾(téng)讯等(děng)众多头部企业都在竞(jìng)相发(fā)力。
不过训练(liàn)大模型的确价(jià)格不(bù)菲,以国盛证券发布的《ChatGPT需要多少算力》报告(gào)估(gū)算,GPT-3训练一(yī)次的成本(běn)约为140万美元。而(ér)对于(yú)一些更大的(de)LLM(大型语言模(mó)型(xíng)),训练成(chéng)本则介于200万美元至(zhì)1200万美元高价之间(jiān)。
以ChatGPT在2023年1月的(de)独立(lì)访客平均数1300万(wàn)计算,其对应芯片(piàn)需求为3万多(duō)片英伟达A100 GPU,初始投入成本(běn)约为8亿美元(yuán),每日仅电费就在(zài)5万美元(yuán)左(zuǒ)右。
此外不论是ChatGPT还是AIGC,都离不开庞(páng)大算力(lì)支(zhī)持。在关注各(gè)类大(dà)模型(xíng)的发展同时,更(gèng)应该关注(zhù)算力网络(luò)的建设。
算(suàn)力网络正驱动AI产业发展进入(rù)史诗级加(jiā)速(sù)进程,让AIGC及通用AI这一人工智能发(fā)展的终极目(mù)标离得更近。
因为算力可以对突破性(xìng)技术创新提供大力(lì)的支持。这(zhè)方面,多模态大(dà)模型是典型。作为面向未(wèi)来强人工智能(néng)、通用人工智能(néng)的重(zhòng)要技(jì)术创(chuàng)新,多模态大模型已(yǐ)经在人工智(zhì)能领域提出了很多年(nián),业界也有不少技(jì)术突破,但(dàn)是,多(duō)模态大(dà)模型进一步往(wǎng)下走,算力(lì)需(xū)求(qiú)呈(chéng)几何式上升,一般的算力基(jī)础设施很快将难以(yǐ)胜任。
从图像、文字、语音单独一项的训练,到双模态、三(sān)模(mó)态的跃迁,让(ràng)人工智能可以灵活应对不同(tóng)模态的(de)转(zhuǎn)化、像人与世界交互一样自然,这方面,由算力(lì)网络来(lái)驱动将有明显优势(shì)。
此外,还(hái)有很多需要爆发式增长(zhǎng)的算力来支撑(chēng)的技术创新,将在人(rén)工智(zhì)能算(suàn)力网络支撑下(xià)快速推进(jìn)。
AIGC已经露出曙光,期待(dài)在(zài)大(dà)模(mó)型和大算力的支(zhī)持下AIGC能持续颠覆(fù)内容生产(chǎn)的方式,将创造(zào)的边际成本降低,让万(wàn)众受益。
未经允许不得转载:橘子百科-橘子都知道 轻轨是什么,轻轨是地铁还是高铁
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了