自聊天机(jī)器(qì)人ChatGPT火(huǒ)爆以来(lái),微软公司创始人比尔(ěr)·盖茨已多次公开谈论人工(gōng)智(zhì)能话题。在最近的一(yī)次采访中,他再(zài)次表示:“AI可能会让科技(jì)行业迎来一次剧(jù)烈的洗牌”。
这个结论(lùn)是他在当地时间2月20日(rì)接受(shòu)《In Good Company》节目(mù)专访(fǎng)时提出的。
他预期,AI的发展可能会威胁到(dào)谷(gǔ)歌(gē)的市(shì)占率,因为微软在AI方面(miàn)的行动相(xiāng)当(dāng)迅速。而最(zuì)终科技(jì)巨头(tóu)将(jiāng)把AI整(zhěng)合(hé)成用户的“全能助(zhù)手”,包揽一(yī)切应用,与(yǔ)人(rén)们进行沟通并提供(gōng)建议(yì),可以取代亚马(mǎ)逊、Siri或Outlook等应用。
大佬口中全(quán)能助手的(de)到来(lái)可(kě)能(néng)尚需时日,但(dàn)由ControlNet引发的又一(yī)次(cì)AI绘画浪潮,让AIGC在ChatGPT的话(huà)题热点包围中杀出(chū)重围。
01
ControlNet颠(diān)覆AI绘画(huà)新玩法
AIGC向可控(kòng)靠近
以AI绘画为(wèi)代表(biǎo)的(de)AIGC上一次爆火的时候(hòu),还是2022年8月,在美国科(kē)罗拉多州举(jǔ)办(bàn)的(de)新兴数字艺术(shù)家竞赛中,一(yī)幅(fú)名为《太空歌剧院》的作(zuò)品(pǐn)获奖(jiǎng)。
随后各(gè)大厂商的AI绘画(huà)软件(jiàn)被广大(dà)网友熟知(zhī)并体(tǐ)验,Stable Diffusion便(biàn)是其中代(dài)表。
用户们可以在应用(yòng)中输入一组关键(jiàn)词或(huò)者一张照片,就(jiù)能(néng)获得一幅AI创作的画作。
作画的(de)关键就是所(suǒ)输入的文(wén)本。同一组关键(jiàn)词也可以创作出(chū)很多张风(fēng)格(gé)不一(yī)样的画作,这(zhè)让创作的过程就像开盲(máng)盒(hé)。
很多用户很喜(xǐ)欢这种(zhǒng)不确定的惊喜,他们(men)会将生成的美图当做头(tóu)像(xiàng)。而(ér)另一部分喜(xǐ)欢翻看(kàn)AI绘画的“翻车(chē)”作(zuò)品。在(zài)社交媒体上,许多(duō)用户分享AI“翻车(chē)现场”,例(lì)如(rú),一位网友的(de)小狗照(zhào)片(piàn)被AI画成了“肌肉男”,还有网友的个(gè)人照片被AI识别成了(le)建筑。
而如(rú)今随着ControlNet的出(chū)现与加持,以往AI绘画的(de)填写关键词(cí)游(yóu)戏可(kě)能(néng)要(yào)被颠覆了。
ControlNet是一位(wèi)正在斯坦福读博的(de)中(zhōng)国人张吕敏创作(zuò)的一种基(jī)于控制(zhì)点的图(tú)像变形算(suàn)法,主要用(yòng)于数字图(tú)像处理、计算机视觉和计算机图形学等(děng)领域(yù)。
其SD插(chā)件一(yī)经发布,在短(duǎn)短的两天内便成为了AI绘画领(lǐng)域最新的热点。
在此(cǐ)之前,大家(jiā)用(yòng)了(le)很多方法想让AI生成(chéng)的结果(guǒ)尽可能的符(fú)合要求,但是(shì)都不尽(jǐn)如人意,它的出现代表(biǎo)着(zhe)AI生成开(kāi)始进入真正的可(kě)控(kòng)时期。
因为ControlNet可以直接提取画面(miàn)的(de)构图,人物的姿势和画(huà)面的深度(dù)信息等。有了它的帮助,就(jiù)不(bù)用(yòng)频繁的用提(tí)示词来碰(pèng)运(yùn)气(qì),抽盲盒式的创作(zuò)了。
通俗的说ControlNet相(xiāng)当于给AI绘画加了“魔法”,不少博(bó)主的作(zuò)品已经获得了大量的浏览量,“viggo”就是其中之一,他用朋友的(de)照片直接带她们走(zǒu)进动(dòng)漫(màn)世界。
viggo先用StableDiffusion图片转文字(zì)。
再用Text2Prompt插件拓展找到对(duì)应的关(guān)键词;最后用ControlNet插件绑定(dìng)骨骼开始换关键词试(shì)效果。
通过图片就可以(yǐ)看出来,效果十分(fēn)惊艳。
更厉害的是,除了真实的照片(piàn),草图也可以(yǐ)加上(shàng)“魔法”,知乎大(dà)牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能(néng)实(shí)现线稿转(zhuǎn)全彩图。大神张吕敏其本尊也(yě)亲自回应。
不得(dé)不说当(dāng)下(xià)AIGC已(yǐ)经变得越来越(yuè)强大(dà),甚至输出的作品(pǐn)都已经能以(yǐ)假乱真了。
02
难(nán)辨虚(xū)实,AIGC技(jì)术力爆发
警惕(tì)安全问题
近日,“苏州金(jīn)鸡湖有游艇(tǐng)party”的消息火(huǒ)遍网络,而(ér)经过(guò)警(jǐng)方辟谣(yáo)这所谓的“party”可能是全国第(dì)一起AI绘图诈骗。
由(yóu)于这(zhè)个活动里面给出的美女照片都是AI制作的真人(rén)照片绘图,因为太逼真,被大家当(dāng)成真事传(chuán)播(bō)了。
不过仔细观察可以发(fā)现,活动发起(qǐ)者提供的照片(piàn)中(zhōng)有个很(hěn)大的漏(lòu)洞(dòng)可以发(fā)现并(bìng)非真人,而是AI绘图(tú),那便是图片中(zhōng)女性的手指部(bù)分(fēn)有的存在异常(cháng)。
有行业(yè)人事(shì)表示:“现在因(yīn)为手指部(bù)分的绘画(huà)算法比较复杂,AI还不太(tài)会(huì)画(huà)人的(de)手(shǒu),但(dàn)最新看到的图片已经有越来(lái)越完美的(de)AI模型出现,以(yǐ)后可(kě)能就完全没(méi)有漏洞了(le)。”
类(lèi)似(shì)的AI作图诈(zhà)骗在国外也已有发生。据英国广播(bō)公司报道,土耳(ěr)其(qí)地震期(qī)间,有(yǒu)Tiktok用户使用AI合成了儿童受灾的假照片发(fā)布(bù)到网(wǎng)络,以(yǐ)此诱(yòu)骗善良的人(rén)打赏“捐助”从(cóng)而实施诈骗。
目(mù)前随着技术发展,AIGC已经能做出(chū)真人照(zhào)片(piàn)般(bān)的(de)绘图效果,如果这(zhè)样的图片被用来诈(zhà)骗,将(jiāng)非常(cháng)可怕。
此(cǐ)外AIGC还引发了很多(duō)担(dān)忧,一方(fāng)面,批判者(zhě)认为AI在(zài)“学习”了大量(liàng)前(qián)人的作品之后,其创作没有任何情绪和灵魂,难以(yǐ)和(hé)人(rén)类的艺术(shù)创作相提并论(lùn)。
另一方面,AIGC背后(hòu)的版权、目前都并没有得到(dào)有效(xiào)的解决,还有AIGC会不会代替人类“至(zhì)高无上”的创意。
马斯克也强调,人工智能的(de)安(ān)全问(wèn)题(tí)需要得到重(zhòng)视,太晚就来不及了。
15个工作日是多长时间 15个工作日包括周六周日吗>03
AIGC下一站除了视频,还有远方
技术都是有两面性(xìng)的,潜在的(de)危害(hài)并(bìng)不能掩(yǎn)盖(gài)其光辉的贡献。现(xiàn)在看(kàn)来,人工智能技术将是第四(sì)次工业革命的核(hé)心驱动(dòng)力(lì)量,将创造新的增(zēng)长奇迹。
过去一年,人工智能在技(jì)术和商业(yè)层面都有了巨大进展,AI绘画就是人工智能技术发生方(fāng)向性改变的一个(gè)代表。其下一(yī)站(zhàn)或(huò)许(xǔ)就是视(shì)频。
此前,Meta和谷(gǔ)歌先后发布了几(jǐ)条引爆科技圈的短(duǎn)视频。这些视频引发关注(zhù)并(bìng)非内容做(zuò)得多(duō)优秀,反而都非常(cháng)简单,比如一(yī)匹正在(zài)喝水的马,一只画画的玩具熊,或者(zhě)一段骑摩托车的第一(yī)视角录像(xiàng),随便一个有手机的(de)人都可以(yǐ)随(suí)手录下一段。
但(dàn)这些短(duǎn)视频的(de)创作方(fāng)式(shì)非常简单,创(chuàng)作者仅仅(jǐn)需要向AI输入一段话,甚至只是(shì)说一下要求,AI就可以根据需要生成一段视频。
谷(gǔ)歌发布的两个AI生成视(shì)频分别15个工作日是多长时间 15个工作日包括周六周日吗来自于Imagen Video和Phenaki,前者主要(yào)突出的是高清,与Meta的(de)Make-A-Video没(méi)有太多的差别。
在Make-A-Video公布了AI生成的视频后(hòu),AI圈就已经玩(wán)了一波梗(gěng),一个能(néng)够做出(chū)更高清视(shì)频的AI还不足(zú)以(yǐ)在(zài)短(duǎn)时(shí)间(jiān)内戳(chuō)中兴(xīng)奋点。
Phenaki更加令人震惊的地方在于,它可以制作出超过2分钟的(de)连贯(guàn)的也有确切内(nèi)容的视(shì)频,这(zhè)才(cái)是真正让(ràng)人(rén)们(men)感到惊喜(xǐ)的地(dì)方(fāng)。因(yīn)为无论AI生(shēng)成的视频(pín)多么高清,也只能是为内容(róng)生产者提供一个灵感,一个素材,一个过场动画。
不过(guò)能够(gòu)制作出有(yǒu)具体剧情内容(róng)的视频就(jiù)意味着,一些视频(pín)创作由AI代替人(rén)工完成已经(jīng)初步有了可(kě)能(néng)。
当下AI的发(fā)展速度(dù)已经(jīng)超过大部分人(rén)的想象。内(nèi)容产业的本(běn)质(zhì)是供(gōng)给创(chuàng)造需(xū)求,AIGC作(zuò)为(wèi)全新的内容生产方式,可以为(wèi)内容(róng)产(chǎn)业带来(lái)更(gèng)新的内(nèi)容风格、更快的(de)生产速度(dù),更低的(de)生(shēng)产(chǎn)成本,这无(wú)疑会驱动内容产业的大(dà)爆发。
除了AI绘(huì)图(tú)、视频,AIGC技(jì)术还(hái)能应用于(yú)音乐、代码、机(jī)器人动作等多种(zhǒng)内容形(xíng)式(shì)的生(shēng)成。不难发现该项技术不仅在游戏等行(xíng)业能(néng)得(dé)到有效应(yīng)用,对于(yú)下一(yī)代互联网各种元素的(de)构建亦有关键意义。
从商业化的角度来看(kàn),文化娱乐、教育、传媒等诸多领域,本身就对基于(yú)AI的(de)可视化内容有(yǒu)强(qiáng)烈需(xū)求(qiú)。
因此,AI绘(huì)画及视频或不是结果,而只(zhǐ)是(shì)AI进(jìn)程中(zhōng)的一块重要拼图,有望在技术更新(xīn)的(de)加持下(xià)实现更大的(de)应用价值。
AI从理解内容,走(zǒu)向(xiàng)了可(kě)以生成内容,甚至(zhì)能够创造出独立价值和独立视角的内容。AIGC的再次出圈(quān),更代表着未来(lái)的先进(jìn)生(shēng)产(chǎn)力即将到来。
04
紧抓大模(mó)型与(yǔ)算力(lì),牢固AIGC底座
从技术的发(fā)展也可以(yǐ)看出,在语言大模型、图像大模(mó)型之(zhī)后(hòu),多模态(tài)大模型已经成为了新的趋势。
大模型被(bèi)誉(yù)为当前人工(gōng)智(zhì)能发展的智能底座,是全球竞争(zhēng)最激烈的(de)研究方向之一,包括谷歌、亚马逊、百度、阿里、腾讯等众(zhòng)多头部企(qǐ)业(yè)都在竞相发力。
不过训练(liàn)大模型的(de)确价格不菲(fēi),以(yǐ)国盛证券发布(bù)的《ChatGPT需(xū)要多少算(suàn)力》报告估算(suàn),GPT-3训(xùn)练一次的成本约为(wèi)140万美(měi)元。而对于一(yī)些(xiē)更大的LLM(大型语言(yán)模型),训练成本则介于200万美元(yuán)至1200万(wàn)美元高价(jià)之(zhī)间(jiān)。
以ChatGPT在2023年1月的独立访客平均数1300万计算(suàn),其(qí)对应芯片需(xū)求为3万多片英伟达A100 GPU,初始投入成本(běn)约为8亿美元(yuán),每日仅电(diàn)费就在5万美(měi)元左(zuǒ)右。
此(cǐ)外不论是ChatGPT还是(shì)AIGC,都离不开(kāi)庞大算力支持。在关注各(gè)类大(dà)模型(xíng)的发展(zhǎn)同时(shí),更应该关注算(suàn)力网络的建(jiàn)设。
算力网(wǎng)络正驱动AI产(chǎn)业发展进(jìn)入史(shǐ)诗级加速进程,让AIGC及通用AI这一人(rén)工智能发(fā)展的终极目(mù)标离(lí)得更近。
因为算(suàn)力可以对突破性技术创新提供大力(lì)的支持。这方面(miàn),多模态(tài)大模型是典型。作为面向未来强人工智(zhì)能、通用人(rén)工智能的重要技术(shù)创新,多模态(tài)大(dà)模型已经在人(rén)工(gōng)智能(néng)领(lǐng)域提(tí)出(chū)了很多年,业界也有不少技术(shù)突破,但(dàn)是,多模态(tài)大(dà)模型进一步往下走,算力(lì)需(xū)求呈几(jǐ)何式上升,一般(bān)的(de)算力基(jī)础设施很快(kuài)将难以胜(shèng)任(rèn)。
从图像、文字、语音单独(dú)一(yī)项的训练,到双模态、三模态(tài)的跃迁(qiān),让人工(gōng)智能可以灵活应对(duì)不(bù)同模态的转(zhuǎn)化(huà)、像人与世界交(jiāo)互(hù)一样(yàng)自(zì)然,这(zhè)方面,由算力网络来驱动将有明显优势。
此外,还有很(hěn)多(duō)需要爆(bào)发式(shì)增长的算力(lì)来支撑(chēng)的(de)技术创新(xīn),将(jiāng)在人工智(zhì)能(néng)算力网络支撑(chēng)下快速推进。
AIGC已经露出曙光,期(qī)待(dài)在大模型(xíng)和大算力(lì)的支持下AIGC能持续(xù)颠覆内容生(shēng)产的方式,将(jiāng)创(chuàng)造的边际成(chéng)本降(jiàng)低(dī),让(ràng)万众受益(yì)。
未经允许不得转载:橘子百科-橘子都知道 15个工作日是多长时间 15个工作日包括周六周日吗
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了