橘子百科-橘子都知道橘子百科-橘子都知道

卅是什么意思,卅是什么意思,读音

卅是什么意思,卅是什么意思,读音 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火(huǒ)爆以来(lái),微软公(gōng)司创始人比尔·盖(gài)茨已(yǐ)多次公开谈论人(rén)工智(zhì)能话题。在(zài)最近的一次采访(fǎng)中,他再次表示:“AI可能会让科技行业迎来(lái)一(yī)次剧烈(liè)的(de)洗牌”。

这个(gè)结论是他(tā)在(zài)当地时间2月20日接受《In Good Company》节目专(zhuān)访时提出的。

他预期,AI的发展可能会威胁到(dào)谷歌的市占率,因为(wèi)微软在AI方面的(de)行动相(xiāng)当迅(xùn)速。而最(zuì)终科技巨(jù)头将(jiāng)把(bǎ)AI整(zhěng)合(hé)成用户(hù)的“全能(néng)助手”,包揽一切应用(yòng),与(yǔ)人们(men)进行沟通并(bìng)提供建议,可以(yǐ)取代(dài)亚马逊、Siri或(huò)Outlook等应用。

大佬口中全能助手的到来可(kě)能尚需时日(rì),但由ControlNet引发(fā)的(de)又一次AI绘画(huà)浪潮,让(ràng)AIGC在ChatGPT的话(huà)题热点包围中(zhōng)杀出重围。

ChatGPT之后又一(yī)应(yīng)用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控靠近

以AI绘画为代表的AIGC上一(yī)次爆火的时候,还是2022年8月,在美国科罗(luó)拉多州举办的新兴(xīng)数字艺术家竞赛中,一幅名为《太空(kōng)歌剧院》的作品获奖。

随后各大厂商的AI绘画软件被广大网友熟知并体验(yàn),Stable Diffusion便是其中代(dài)表。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入可控(kòng)期(qī),将洗牌(pái)科技行业?_黑料正能量

用户们可以在应(yīng)用中输入(rù)一(yī)组关键词或者(zhě)一张照片,就能获得一幅(fú)AI创作的画作。

作画(huà)的关键就是所输入的文本。同一组(zǔ)关键词也可以创(chuàng)作出很多张风格不一样(yàng)的(de)画作,这让创作(zuò)的过程就像开盲盒。

很多用户(hù)很(hěn)喜(xǐ)欢(huān)这种不(bù)确定的惊喜,他们会(huì)将生(shēng)成的美(měi)图当(dāng)做头像。而(ér)另一部分(fēn)喜欢翻看AI绘(huì)画的“翻车”作品。在社(shè)交(jiāo)媒体上(shàng),许多用户分享AI“翻车现场”,例如,一位网友的小狗照片被AI画成(chéng)了“肌肉(ròu)男”,还有网友的个人(rén)照片(piàn)被AI识别成了建筑。

而如今随着ControlNet的出(chū)现(xiàn)与(yǔ)加持,以往AI绘画的(de)填(tián)写(xiě)关(guān)键(jiàn)词游戏(xì)可能要被颠覆(fù)了。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料正能量

ControlNet是(shì)一位(wèi)正在斯坦福(fú)读博(bó)的(de)中国人张吕敏(mǐn)创作的一种基于(yú)控制点的图像变形算(suàn)法(fǎ),主要用于数字图像(xiàng)处理、计(jì)算机(jī)视觉和计算机图形(xíng)学等领域(yù)。

其SD插件一(yī)经发布,在短短(duǎn)的两天内(nèi)便成(chéng)为了AI绘画领域最新的热点。

在此之(zhī)前,大家用了很多(duō)方(fāng)法(fǎ)想让AI生(shēng)成的结果尽可能的符合要求,但是都不(bù)尽如人意,它(tā)的(de)出现代表着(zhe)AI生成开(kāi)始(shǐ)进入真正的可控时期。

因(yīn)为(wèi)ControlNet可以(yǐ)直接提取画面的(de)构图,人(rén)物的姿势和(hé)画(huà)面的深(shēn)度信息等(děng)。有了它的帮(bāng)助,就不(bù)用频繁的用提示(shì)词(cí)来碰运气,抽盲(máng)盒(hé)式(shì)的创作了。

通俗的说ControlNet相当于(yú)给AI绘画加了“魔(mó)法”,不少博主的作(zuò)品已经获得了(le)大量的浏览(lǎn)量,“viggo”就是(shì)其(qí)中之(zhī)一,他(tā)用朋友的照片直接带她们走进动漫(màn)世(shì)界。

ChatGPT之后又一(yī)应用(yòng)杀(shā)疯(fēng)了,AIGC或进入(rù)可控期,将洗牌科(kē)技行业?_黑料正(zhèng)能量

viggo先用StableDiffusion图(tú)片转文字。

再用Text2Prompt插件拓展找到对应的关(guān)键词(cí);最后(hòu)用(yòng)ControlNet插件绑(bǎng)定骨(gǔ)骼开始(shǐ)换关(guān)键(jiàn)词试效果。

ChatGPT之后又一应用(yòng)杀疯(fēng)了(le),AIGC或进入可(kě)控期(qī),将洗牌科技行业(yè)?_黑料正能量

通过(guò)图片就可以(yǐ)看出来,效果十分惊艳。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科技行(xíng)业?_黑料正能量

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科技行业?_黑料正能(néng)量

更厉害的是,除了真(zhēn)实(shí)的照片,草图也可以加上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实(shí)现线稿(gǎo)转全彩图。大神张吕(lǚ)敏其本尊(zūn)也亲自回应(yīng)。

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌科技行业(yè)?_黑料正能(néng)量

不(bù)得(dé)不说(shuō)当(dāng)下AIGC已经变得(dé)越来(lái)越(yuè)强大,甚至(zhì)输(shū)出的作品都已经(jīng)能以假乱真了(le)。

02

难辨虚实,AIGC技术(shù)力爆(bào)发(fā)

警惕安全问题(tí)

近日,“苏州金鸡湖有游(yóu)艇party”的消息火遍网络(luò),而(ér)经(jīng)过警方辟谣这所谓的(de)“party”可能是全(quán)国第一起AI绘图诈骗。

由于这个活动里面给出的美女照片都是AI制(zhì)作的真人(rén)照(zhào)片绘图,因(yīn)为太逼(bī)真(zhē卅是什么意思,卅是什么意思,读音n),被大家当成真事传(chuán)播(bō)了

ChatGPT之后(hòu)又(yòu)一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌(pái)科技行业(yè)?_黑(hēi)料正(zhèng)能(néng)量(liàng)

不过(guò)仔细(xì)观察可(kě)以发(fā)现,活(huó)动发起者提供的(de)照片中有个很大的漏(lòu)洞可以发现并(bìng)非真人(rén),而是(shì)AI绘图,那便是图片中(zhōng)女性的(de)手(shǒu)指(zhǐ)部分有的(de)存在异(yì)常(cháng)。

ChatGPT之后(hòu)又(yòu)一应用杀疯了(le),AIGC或进(jìn)入可控期,将洗(xǐ)牌科(kē)技行业?_黑料(liào)正能量

有(yǒu)行业人事(shì)表示(shì):“现在因为手指部分(fēn)的绘画算法比较复杂,AI还不太(tài)会(huì)画人的手,但最新(xīn)看到的图片(piàn)已经(jīng)有越(yuè)来越完美的AI模(mó)型(xíng)出现,以后可能就完(wán)全没有漏(lòu)洞了。

类(lèi)似的AI作图(tú)诈骗在国(guó)外也已(yǐ)有(yǒu)发(fā)生。据英国广播公(gōng)司报道(dào),土耳其地震期间,有Tiktok用户使用(yòng)AI合成了儿童受灾的假照片发(fā)布到网(wǎng)络,以此诱(yòu)骗善良(liáng)的人(rén)打(dǎ)赏“捐助(zhù)”从而实施诈骗。

目前(qián)随着技术发展,AIGC已经(jīng)能做出真(zhēn)人照片般的绘(huì)图效果,如果这样的图片被用(yòng)来诈骗,将非(fēi)常卅是什么意思,卅是什么意思,读音可怕(pà)。

此外AIGC还引发了很多担忧,一(yī)方(fāng)面,批判者认为AI在“学习(xí)”了大量前人的(de)作品之(zhī)后,其创作没有任何情绪和灵魂,难以和人(rén)类的(de)艺术创作相提并(bìng)论。

另(lìng)一方面,AIGC背(bèi)后(hòu)的版(bǎn)权、目前都(dōu)并没(méi)有得(dé)到有(yǒu)效(xiào)的(de)解决,还有AIGC会不会代(dài)替人类“至高无上”的创意(yì)。

马斯(sī)克也强(qiáng)调,人工智能的安全问题需(xū)要得到重视,太晚就来不及了(le)。

03

AIGC下(xià)一站(zhàn)除(chú)了视频,还有远方

技术都是有两面(miàn)性(xìng)的,潜在的危害并不(bù)能掩盖其(qí)光辉的贡献。现在看来,人工智能技术将是第(dì)四(sì)次工业革命的核心驱(qū)动力量,将创造(zào)新(xīn)的增长奇迹。

过去一年,人工智能(néng)在技(jì)术和商(shāng)业层面都有了(le)巨(jù)大(dà)进展,AI绘(huì)画就是人工智(zhì)能技术(shù)发(fā)生(shēng)方向性改变(biàn)的(de)一个代表。其下一站或许就是视频。

此(cǐ)前,Meta和谷歌(gē)先(xiān)后发(fā)布了几条引爆科技圈的短视频。这(zhè)些视频引发关注并非内(nèi)容做(zuò)得多优(yōu)秀,反而都(dōu)非常简单,比如(rú)一匹正在喝水的(de)马,一(yī)只画画(huà)的玩具熊,或者一段骑摩托车(chē)的第一视(shì)角录像,随便一个有手机的人都可以(yǐ)随手录下一(yī)段。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业(yè)?_黑料正能量(liàng)

但这些短(duǎn)视频的创作方式非常简单,创作者仅仅需(xū)要向AI输(shū)入一段(duàn)话,甚至只是说一下要求(qiú),AI就可以(yǐ)根(gēn)据需(xū)要生成一段视频(pín)。

谷歌发(fā)布的(de)两个AI生(shēng)成视频分(fēn)别来自于Imagen Video和Phenaki,前(qián)者主要突出(chū)的是高清,与(yǔ)Meta的Make-A-Video没有(yǒu)太多(duō)的差别。

在Make-A-Video公(gōng)布了AI生(shēng)成的视频后,AI圈就(jiù)已经玩了(le)一波梗,一(yī)个能(néng)够(gòu)做出更高(gāo)清(qīng)视频的AI还(hái)不足(zú)以在(zài)短(duǎn)时(shí)间内(nèi)戳中兴奋点。

Phenaki更加令人震惊的地方在于,它可(kě)以(yǐ)制作出超(chāo)过2分钟的(de)连贯的也(yě)有(yǒu)确切(qiè)内(nèi)容的视(shì)频,这才是真正(zhèng)让人们(men)感到惊喜的地方(fāng)。因为无论AI生成的视频多么高清,也只能是为(wèi)内容生产者提供(gōng)一个(gè)灵(líng)感,一(yī)个素材,一个(gè)过场(chǎng)动画。

不过能够制作出有具体剧(jù)情内容的(de)视频就(jiù)意(yì)味着,一些视频创(chuàng)作由AI代替人工完(wán)成(chéng)已经初步(bù)有了可能(néng)。

当下AI的发(fā)展速度已经(jīng)超过大部分人的想象。内容产业的本质是供给(gěi)创造需求(qiú),AIGC作为全新的内(nèi)容生产方式,可以为内容产业带(dài)来更(gèng)新的内容风(fēng)格、更快的生产速(sù)度(dù),更低的生(shēng)产(chǎn)成本,这无疑会驱动内容(róng)产业的大爆发(fā)。

除了AI绘(huì)图、视频,AIGC技术还能应用于(yú)音乐、代码(mǎ)、机器(qì)人动(dòng)作等(děng)多种内(nèi)容形(xíng)式的(de)生(shēng)成。不难(nán)发现该项技术不(bù)仅在游(yóu)戏(xì)等行业能(néng)得到有效应(yīng)用,对于下一代互(hù)联网各种元素的构建亦(yì)有关(guān)键意义。

从(cóng)商业化的(de)角度来看,文化娱(yú)乐(lè)、教育、传媒(méi)等诸多领(lǐng)域,本身(shēn)就对基于AI的可(kě)视化内容(róng)有(yǒu)强(qiáng)烈需求。

因(yīn)此,AI绘画及视频或不是结(jié)果,而(ér)只是AI进程中的一(yī)块重要拼图,有望在技术更新的加持(chí)下实(shí)现更大的(de)应用价值。

AI从(cóng)理解内(nèi)容,走(zǒu)向了可以生(shēng)成内(nèi)容(róng),甚至(zhì)能够(gòu)创造出独立价值(zhí)和独立视角的(de)内容。AIGC的再次出圈(quān),更代表着未(wèi)来(lái)的先进生(shēng)产(chǎn)力(lì)即将到来。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正能量

04

紧(jǐn)抓大模型与算力,牢固AIGC底(dǐ)座(zuò)

从技术的发展也可以看出(chū),在语言(yán)大模(mó)型、图(tú)像(xiàng)大模型之后(hòu),多(duō)模态(tài)大模(mó)型已经成为了新的趋势。

大模(mó)型被(bèi)誉(yù)为当前人(rén)工智(zhì)能发展(zhǎn)的智能底座,是全球竞(jìng)争(zhēng)最激烈的(de)研究方(fāng)向之一,包括(kuò)谷歌、亚(yà)马逊、百度、阿(ā)里、腾讯等众多(duō)头部企业都在竞(jìng)相发力(lì)。

不过训练大模型的确价格不菲,以(yǐ)国盛证券发布的《ChatGPT需要多少算力》报(bào)告估算,GPT-3训练一次(cì)的成本约(yuē)为140万美元。而(ér)对于一些更大的LLM(大型语言模型),训练成本则介于200万美元至1200万美(měi)元高价之间(jiān)。

以ChatGPT在2023年(nián)1月的独立访(fǎng)客平(píng)均数1300万(wàn)计算,其对应芯片需求为(wèi)3万多片英伟(wěi)达A100 GPU,初始投(tóu)入(rù)成本约为8亿美(měi)元(yuán),每(měi)日仅电费就在5万美(měi)元左右。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行(xíng)业?_黑料正能量

此外(wài)不论是ChatGPT还(hái)是AIGC,都离不开庞大算力支(zhī)持。在关注(zhù)各类大(dà)模型的(de)发展(zhǎn)同时,更应该关注(zhù)算力网络(luò)的建设。

算力网络正驱动AI产业发展进入(rù)史诗(shī)级加速进程(chéng),让AIGC及通用AI这一人工智能(néng)发展的(de)终极目标离得更近。

因为算力可以对突破(pò)性技(jì)术创新提供大(dà)力的支持。这(zhè)方面,多模(mó)态大模型(xíng)是典(diǎn)型。作为(wèi)面向(xiàng)未来(lái)强人工(gōng)智能(néng)、通用人工智能的重要(yào)技术创新,多模态大模型已经在人工智能领域提出(chū)了(le)很多(duō)年,业界也有不少技术突破,但是,多模态大模型进一步往(wǎng)下走,算力需求(qiú)呈几(jǐ)何式上升,一(yī)般的(de)算力基(jī)础设施很(hěn)快(kuài)将难以胜任。

从图像、文字、语音(yīn)单独一项的(de)训(xùn)练,到双模(mó)态(tài)、三(sān)模态(tài)的跃迁(qiān),让人(rén)工智能(néng)可以灵活应对不同模态的转化、像人与世界交互(hù)一(yī)样自然,这方(fāng)面(miàn),由算(suàn)力网络来驱动将有明显优势。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控期(qī),将洗牌科技行业?_黑料正能量

此外,还有很多需(xū)要爆发式(shì)增长的算力来支撑(chēng)的(de)技术(shù)创新(xīn),将在(zài)人工(gōng)智能算力网络(luò)支(zhī)撑下(xià)快速推进。

AIGC已经露出(chū)曙(shǔ)光,期待在大模型和大(dà)算力的支(zhī)持下AIGC能持(chí)续颠覆内(nèi)容生(shēng)产的(de)方(fāng)式,将创造的边际成(chéng)本降低,让万众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 卅是什么意思,卅是什么意思,读音

评论

5+2=