橘子百科-橘子都知道橘子百科-橘子都知道

半夜被C醒是一种什么样的感受

半夜被C醒是一种什么样的感受 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器人ChatGPT火爆(bào)以(yǐ)来,微软(ruǎn)公司创始人比(bǐ)尔·盖茨已(yǐ)多次(cì)公(gōng)开谈论人(rén)工智能话题(tí)。在最近的(de)一次采访中,他再(zài)次(cì)表(biǎo)示:“AI可能会让科技(jì)行业迎来一次剧(jù)烈的洗牌”。

这个结论是他在(zài)当地时间2月20日接受《In Good Company》节目专访时提出的(de)。

他预(yù)期,AI的发展可(kě)能会(huì)威胁到谷歌的市占率(lǜ),因为(wèi)微软在AI方面的行动相(xiāng)当迅速。而最终科(kē)技巨(jù)头将把(bǎ)AI整合(hé)成(chéng)用户的“全能助手”,包(bāo)揽一切应用,与人(rén)们进行沟(gōu)通并提供建议,可以(yǐ)取代亚马逊、Siri或Outlook等应用。

大(dà)佬口中全能助手的到来可能尚需时(shí)日,但由ControlNet引发的又(yòu)一(yī)次AI绘画(huà)浪潮,让AIGC在ChatGPT的话题热点包围(wéi)中杀出重围。

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技行业?_黑料(liào)正能(néng)量

01

ControlNet颠(diān)覆(fù)AI绘画新玩法

AIGC向可控(kòng)靠近

以AI绘画为(wèi)代表(biǎo)的(de)AIG半夜被C醒是一种什么样的感受C上一次爆火的时候,还是2022年8月(yuè),在美国科罗(luó)拉多州(zhōu)举办的新兴数字(zì)艺(yì)术(shù)家竞赛中(zhōng),一幅(fú)名(míng)为《太空歌剧院(yuàn)》的作品获(huò)奖。

随后各大厂商的AI绘画(huà)软件被广大网友熟知(zhī)并体验(yàn),Stable Diffusion便是其中代表。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技(jì)行业?_黑料正(zhèng)能(néng)量

用户(hù)们(men)可以在(zài)应用中输(shū)入一组(zǔ)关键词或者一张照片(piàn),就(jiù)能获得一幅(fú)AI创作的(de)画作。

作画的关键就(jiù)是所输入的文本。同一组关键词也(yě)可以(yǐ)创作(zuò)出很多张(zhāng)风格不一样的画作,这让创作的过程就像开盲盒(hé)。

很多用户很(hěn)喜(xǐ)欢这种不确定(dìng)的(de)惊喜,他们会将(jiāng)生成(chéng)的美图当做头像。而另一部分喜欢翻看AI绘(huì)画的“翻车”作品(pǐn)。在社(shè)交媒体上,许多用(yòng)户分享AI“翻车现场”,例如,一位网友(yǒu)的(de)小狗照片被AI画成了(le)“肌肉男”,还(hái)有(yǒu)网友(yǒu)的个人照片被(bèi)AI识别(bié)成了建筑。

而(ér)如今(jīn)随(suí)着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可能要被颠覆了(le)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入可控(kòng)期,将洗牌科技(jì)行业?_黑料正能量

ControlNet是(shì)一位(wèi)正在斯坦(tǎn)福读博的中国人张吕敏创作的一种基于控制点(diǎn)的图(tú)像变形(xíng)算法,主要用(yòng)于数字图像(xiàng)处理、计算机视觉(jué)和(hé)计算机图形学(xué)等领域。

其SD插件一经发布,在短短(duǎn)的两天内便成为了AI绘(huì)画(huà)领域最新的热(rè)点(diǎn)。

在此之前,大家用了很多方法(fǎ)想让AI生成的结(jié)果(guǒ)尽可能的符合要(yào)求(qiú),但是都不(bù)尽如人意,它的(de)出现代表着AI生成开(kāi)始进入真正的可控时期。

因为(wèi)ControlNet可以直接提(tí)取(qǔ)画面的构图,人物的姿势(shì)和(hé)画面的深度信息等。有了它的帮(bāng)助,就(jiù)不用频繁的用提(tí)示词来(lái)碰(pèng)运气,抽盲盒式的创作了。

通俗的(de)说ControlNet相当于给AI绘画加了“魔法”,不少博主的作(zuò)品已(yǐ)经获(huò)得了大量的浏(liú)览量,“viggo”就是(shì)其中之一,他用朋友(yǒu)的照片(piàn)直接带(dài)她们走进动漫世界。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀(shā)疯了(le),AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

viggo先用StableDiffusion图片转文字(zì)。

再(zài)用Text2Prompt插件拓展找到对(duì)应的(de)关(guān)键词;最后用ControlNet插件绑定骨骼开(kāi)始(shǐ)换关键(jiàn)词试效果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控(kòng)期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

通过(guò)图片就可(kě)以看出来,效果十分惊艳。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进(jìn)入可控(kòng)期(qī),将洗牌科技行业?_黑料(liào)正能量(liàng)

ChatGPT之后又一应(yīng)用(yòng)杀疯了,AIGC或进(jìn)入可控期,将洗牌科(kē)技行业?_黑料正能量

更厉害的是(shì),除了真(zhēn)实的(de)照片(piàn),草图也可以加上“魔(mó)法”,知乎大牛“DevPoint”和“逗砂”介(jiè)绍到(dào)ControlNet还(hái)能(néng)实现(xiàn)线稿转全彩图。大神(shén)张吕敏(mǐn)其本尊(zūn)也亲自回应。

ChatGPT之后(hòu)又(yòu)一应(yīng)用杀疯了(le),AIGC或进(jìn)入可控期,将洗牌(pái)科技行业?_黑料正(zhèng)能量(liàng)

不得不说当下AIGC已经变(biàn)得越来越强大(dà),甚(shèn)至输出的作品都(dōu)已经能以假乱真了。

02

难(nán)辨虚实,AIGC技(jì)术力爆(bào)发

警惕安全问题

近日,“苏州金鸡湖(hú)有游艇party”的(de)消息火遍(biàn)网(wǎng)络,而经(jīng)过(guò)警(jǐng)方辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由于(yú)这个活(huó)动里面给出的美女照(zhào)片都是AI制(zhì)作(zuò)的真人照片(piàn)绘图,因(yīn)为(wèi)太(tài)逼真,被大家当(dāng)成真事传播了

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可(kě)控(kòng)期(qī),将洗(xǐ)牌科技行业?_黑料正能(néng)量

不(bù)过仔细(xì)观察可以发现,活动发(fā)起者(zhě)提供的照片中有个很(hěn)大的漏洞(dòng)可以发(fā)现并非真(zhēn)人,而是(shì)AI绘图,那便(biàn)是(shì)图片中女性的手指部(bù)分有(yǒu)的存在异常。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业(yè)?_黑料正能量

有行业人事表(biǎo)示(shì):“现在因(yīn)为手指部分的绘画算法比较复杂(zá),AI还不太会画(huà)人的手,但最(zuì)新(xīn)看到的图片已经有越(yuè)来越(yuè)完美的AI模型出现(xiàn),以后可能就完(wán)全(quán)没有漏洞了(le)。

类似的(de)AI作图诈骗在国(guó)外也已有发生(shēng)。据英国广播公司(sī)报道,土耳其(qí)地震期间,有Tiktok用户使用AI合成了(le)儿童受灾的假(jiǎ)照(zhào)片发布到网络,以此诱(yòu)骗善良的人(rén)打赏“捐助”从而(ér)实施诈骗。

目前随着技术发展,AIGC已经能做出真人照片般(bān)的(de)绘图(tú)效果,如(rú)果这样(yàng)的图(tú)片被(bèi)用来诈骗,将(jiāng)非(fēi)常可怕。

此外AIGC还引发了很多担忧,一(yī)方面,批判者认为(wèi)AI在“学习(xí)”了大量前人的作品(pǐn)之后,其创作没有任(rèn)何(hé)情绪和灵魂(hún),难以和人类(lèi)的艺术创作相提并论。

另一(yī)方面,AIGC背后的版(bǎn)权、目前都(dōu)并没有得到(dào)有效(xiào)的解决,还有(yǒu)AIGC会不会代替(tì)人类“至高无上(shàng)”的创意。

马斯克(kè)也强调(diào),人工智能的安全问题需要得到(dào)重(zhòng)视,太晚(wǎn)就来(lái)不及了。

03

AIGC下一站除了(le)视频,还有远方

技术(shù)都是有两面性的,潜在的危害并不(bù)能(néng)掩盖其光(guāng)辉的贡献。现在看来(l半夜被C醒是一种什么样的感受ái),人工智能技(jì)术将是第四次工(gōng)业革(gé)命的核心(xīn)驱(qū)动力量,将创造新的增长奇迹。

过去一年(nián),人(rén)工智(zhì)能在技术(shù)和商业层面都有了巨(jù)大进展(zhǎn),AI绘画(huà)就是人工智能技术(shù)发生(shēng)方向(xiàng)性改变的一个代(dài)表(biǎo)。其下(xià)一站或许就是(shì)视(shì)频。

此(cǐ)前,Meta和谷歌先后发布了几条(tiáo)引爆(bào)科技圈(quān)的短(duǎn)视频(pín)。这(zhè)些(xiē)视频引发(fā)关(guān)注并非(fēi)内容做得多优秀(xiù),反而都非常简(jiǎn)单,比如一匹(pǐ)正在喝水的马,一只画画(huà)的玩具熊,或者一段骑摩托车(chē)的第一(yī)视角(jiǎo)录像,随便一个有(yǒu)手机的人(rén)都可以随手录下(xià)一段。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

但(dàn)这些短视频的创(chuàng)作方(fāng)式非常简单,创作者仅仅需要向AI输入一段话,甚至只是(shì)说一(yī)下要求,AI就可以根据需要(yào)生成一(yī)段视频。

谷歌发布的两(liǎng)个AI生成视(shì)频分别(bié)来自于Imagen Video和Phenaki,前者主要突出的是(shì)高清(qīng),与Meta的Make-A-Video没有太多的(de)差(chà)别。

在Make-A-Video公(gōng)布了AI生成(chéng)的视频后,AI圈就(jiù)已经玩了一波梗,一个能够做出更高清视频的AI还(hái)不足以(yǐ)在短时间内戳中(zhōng)兴奋点。

Phenaki更加令人震惊(jīng)的地方在于(yú),它可以制作出超过2分(fēn)钟的连贯的也有确切内容的视频,这才是(shì)真正让人们感到惊喜(xǐ)的地方(fāng)。因为(wèi)无论AI生(shēng)成的(de)视频多(duō)么高(gāo)清,也(yě)只能是为(wèi)内容生产者提供(gōng)一个灵感,一个素(sù)材,一个过场动画(huà)。

不过能够制作出有具(jù)体(tǐ)剧(jù)情内容的视频(pín)就(jiù)意味着,一些视(shì)频创作由AI代替人(rén)工完成(chéng)已(yǐ)经(jīng)初步有了可(kě)能。

当下AI的发展速度已经超过大(dà)部分人的想(xiǎng)象。内(nèi)容产业(yè)的本质(zhì)是供给(gěi)创造需求(qiú),AIGC作为全新的(de)内容(róng)生(shēng)产方式,可以为(wèi)内容(róng)产业带来更(gèng)新的内容风格(gé)、更快的生产(chǎn)速度,更低的生产成本,这无疑会驱动内容产业(yè)的大爆发。

除了AI绘图、视频,AIGC技术还(hái)能应用于音乐、代码(mǎ)、机(jī)器人动作等多种(zhǒng)内(nèi)容(róng)形(xíng)式(shì)的(de)生(shēng)成。不(bù)难发现该项技术不仅在游戏等行业(yè)能得到有效应用(yòng),对于下(xià)一代(dài)互联网(wǎng)各种元素的构建亦有关(guān)键意义。

从商业化的(de)角度来看,文(wén)化娱(yú)乐、教育、传媒等诸多领域,本身就对基(jī)于AI的可视化(huà)内容有强(qiáng)烈需求。

因此,AI绘画(huà)及视频或(huò)不是(shì)结(jié)果,而只是AI进(jìn)程中的一块重(zhòng)要拼图,有望在技术(shù)更新的加持下实(shí)现更(gèng)大(dà)的应(yīng)用价(jià)值。

AI从理解内容,走向(xiàng)了可以(yǐ)生成(chéng)内容,甚至能够创(chuàng)造出独立价值(zhí)和(hé)独立视角的内(nèi)容。AIGC的再次(cì)出圈,更代(dài)表着未来的先进(jìn)生产力即将到(dào)来。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌科(kē)技行业?_黑料正能量

04

紧抓大模(mó)型(xíng)与算力,牢(láo)固AIGC底(dǐ)座(zuò)

从(cóng)技(jì)术的发展(zhǎn)也可(kě)以看出,在语言大模型、图像大(dà)模型之后(hòu),多(duō)模态(tài)大模(mó)型(xíng)已经(jīng)成(chéng)为了新的(de)趋(qū)势。

大模型(xíng)被誉(yù)为当前人工智能(néng)发展(zhǎn)的智能(néng)底座,是全球竞争(zhēng)最激烈的研究方向之一,包括谷歌、亚(yà)马(mǎ)逊、百度、阿(ā)里、腾讯等众多头部企业都在竞相发(fā)力(lì)。

不过训练大(dà)模型的确价(jià)格不菲(fēi),以国盛证券(quàn)发布的《ChatGPT需要多少算(suàn)力》报告估算,GPT-3训练一次的成本约为(wèi)140万美元(yuán)。而对于一些更大的LLM(大型语言模型),训练(liàn)成(chéng)本则介于200万美(měi)元至1200万美(měi)元高价之间。

以ChatGPT在2023年1月(yuè)的独立访客(kè)平均(jūn)数1300万计算,其对应芯片需求为3万多片英伟(wěi)达(dá)A100 GPU,初始投(tóu)入(rù)成本约为8亿美元,每日仅电费就在5万(wàn)美元(yuán)左右。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技行业?_黑(hēi)料正能量(liàng)

此外不论(lùn)是ChatGPT还(hái)是AIGC,都离不开(kāi)庞大算力支持。在关注(zhù)各类大模型的发展同时,更应(yīng)该(gāi)关(guān)注算力网络的建设。

算(suàn)力网络(luò)正(zhèng)驱动AI产业发展进入史诗(shī)级加(jiā)速进(jìn)程,让AIGC及通用AI这一人工(gōng)智(zhì)能(néng)发展的(de)终极(jí)目标(biāo)离(lí)得(dé)更近。

因为算(suàn)力(lì)可以对突破性技术创新提(tí)供大力的支持。这方(fāng)面,多模态大模型是典型。作为面向未来强(qiáng)人工智能、通用人(rén)工智能的重要技(jì)术(shù)创新,多(duō)模(mó)态大(dà)模型已经在人工(gōng)智能领域提(tí)出(chū)了很多年,业界也(yě)有不(bù)少技术突破(pò),但是,多模态大模型进一(yī)步往下走,算力需求呈几何式上升,一般的(de)算力(lì)基(jī)础设施(shī)很(hěn)快将难以胜任。

从图像(xiàng)、文字、语音(yīn)单独一项的训练,到双模态、三模态的跃迁,让人工智能可(kě)以灵活应对不同模(mó)态的转化、像人与世界(jiè)交互(hù)一样自然,这(zhè)方面,由算力网络来驱(qū)动将有明显(xiǎn)优势。

ChatGPT之后(hòu)又一应用(yòng)杀疯了(le),AIGC或进入可控(kòng)期,将洗牌(pái)科技(jì)行业?_黑(hēi)料正能量

此外(wài),还有很(hěn)多需要爆发式增长的算力(lì)来支撑(chēng)的技术创新,将在人工智能算力网(wǎng)络(luò)支撑下快速推进。

AIGC已经(jīng)露(lù)出曙光(guāng),期待在大模型和大算力(lì)的支持下AIGC能持(chí)续(xù)颠(diān)覆(fù)内容生产的方式(shì),将创造的边际成本降(jiàng)低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 半夜被C醒是一种什么样的感受

评论

5+2=