继ChatGPT之后,美国AI巨头OpenAI继续震撼着世界,凭借着更逼真的视频生成技术,推出了新的人工智能系统Sora,该系统可以根据用户的文本提示创建逼真的视频。这一举动所带来的影响丝毫不亚于一次核爆。就在中美科技界,以及全世界网友,都在为此惊呼之时,解飞今天和您聊聊,Sora的问世,到底意味着什么呢?
建立于1888年的北洋水师,其舰队实力曾是亚洲第一,世界第九,结果在1894年的甲午海战中,面对日本海军溃不成军,全军覆没。究其原因,日本海军的主力战舰吉野号,其航速达到了23节,而北洋水师的明星战舰致远舰仅为18.5节。而曾经日本所拥有的迄今为止人类史上最大的战列舰大和号,在1945年的冲绳岛战役中,被美军航母舰载机所击沉,大和号战列舰威力虽然巨大,但恰逢战列舰的主力舰地位开始被航空母舰所取代。不是战列舰不够优秀,而是属于他的时代已成回忆。
每当一轮新的科技革命到来之时,它所冲击和颠覆的,就不仅是一群人,或一些行业,而是一个时代。
首先,人们自然将Sora看作是OpenAI开发的首个AI视频生成模型,只要你文本内容、关键词或图片输入其中,Sora就能在一秒钟内生成一段长达60秒的高质量视频。在OpenAI官网公布的其中一个示例视频中,一个皮肤白皙、身材高挑的亚洲面孔女性,身着一件皮夹克,里面穿着一件红色连衣裙,拎着一个手提包,走在东京繁华的街道上。说实话,从行走的动作、场景、行人,以及周边的环境、光影的逼真度,都令人叫绝。关键是,当镜头拉近后,还能清晰地看到女人脸上的痘印和脖子上微微的颈纹。
当然,现在就说Sora对影视工业将产生致命打击,还言之过早。因为虽然Sora可以通过文本便生产出一段精美的视频,但无论是视频的主题、脚本、分镜头,以及台词的表现力,这都离不开人的创意,他是人为艺术的一部分。而一部电影,是由无数个60秒组成的,所以短期内,Sora还很难颠覆整个行业,可是随着它的学习能力加强,将世界上所有的电影、短视频都看过一遍,那时,它对这个世界的理解和认知将超出你我的想象,那么下一个问题来了,这是否意味着,AGI,也就是通用人工智能时代即将到来?
这就是我想要聊的下一个问题,很多人都将Sora看作是一个文生视频的工具。如果是这样,那么这一轮的科技革命就像早前数次一样,它的意义就在于解放双手,提高生产效率。Sora的问世也就意味着,要么就是促使大量视频工作者下岗,要么就是视频工作者的得力助手,只要你有好的想法的创意,Sora就可以帮你实现。但实际上这样的理解太过于浅显了,Sora所代表的意义远不止于此。
当奥尔特曼将ChatGPT推出的时候,将它包装成了一个聊天机器人,由于准入门槛低,人们觉得与机器人对话十分有趣,于是靠着口口相传,OpenAI这家公司迅速从科技界出圈,成为世界顶流。但在这看似简单人机聊天的背后,是数字大模型的突破,实现了AI对人类语言的基础理解。同时呢,也给中国科技企业造成一种假象,似乎我们也能迎头赶上,毕竟他的重点还只是语言和文本。所以在ChatGPT3.5发布的时候,国内的科技企业当中,也出现了一批追赶者。
到了Sora的问世,OpenAI公司的CEO奥尔特曼,又将它巧妙的包装成了文生视频的工具,于是网友惊呼,未来零基础也能做精美短视频了。
Sora的横空出世,也使得中美之间的科技博弈更趋白热化。在美方无理打压中国芯片产业的大背景之下,不免有人会为此担忧,认为国内大模型连ChatGPT的文本能力都还只能望其项背,更奢谈Sora的视频生成能力了。就连许多国内业内人士也悲观的认为,中国跟美国的AI差距可能还在加大。中美之间在AI方面的差距固然存在,但我们也完全没必要就此妄自菲薄、一蹶不振。
我们需承认,如今在AI领域的重大突破,几乎都是由美国企业所推动的,但“后发优势”的能量也不可小觑。所谓“后发优势”,其中最显著的特点,就是降低风险和不确定性,少走弯路,直奔主题。
如果说美国的优势在研发,那么中国的优势在执行。Sora的出现为中国AI领域完成了探路,接下来,我们需要做的,就是快速整合资源,将技术进行实际落地应用。而国产化的Sora也完全有可能出现。所以不必担心在AI领域,一步跟不上,就步步跟不上。
应该说,技术的一次次突破,也是计算机一次次的进化的过程,最初期的计算机是无法识别图形和图像,只能识别代码,到后来可以识别图形中的某个物体,再到理解文字与现实的逻辑,再到完全理解图像,可以理解图像中不同的物体之间,它们具有怎样的物理规律,物体与物体产生交互的时候,图像应该有怎样的反应。简单举例,就是人走过树荫,阳关照射下来,不同角度的光影应该是怎样的。只有到这个阶段,它仅靠文字形容自动生成的视频,为何看起来如此的真实。因为AI已经掌握了这个世界的运行规律,甚至是证明了数字世界确实是可以与现实世界的物理定律相结合的。
想到这里,不寒而栗,就像刘慈欣在《三体》当中所说的那样,物理学真的消失了。如果一切看似现实的世界都可以被模拟出来的话,谁又能知道,我们所处的这个世界,到底是真实存在的,还是被设计出来的呢?
Apple所推出的Vision Pro,将一个空间计算的全新视界带到了我们的面前,人们可以借此感受到3D空间场景虚实结合的全新体验,不断的挑战和刷新着人们在视觉世界当中的认知边界。生成式AI对话工具 ChatGPT、图像生成工具DALL-E、再到如今的视频生成工具Sora,电影《头号玩家》中所展现出的未来生活场景,似乎正在一一实现。
这个甲辰龙年注定不一般,这一轮的科技革命,是从软件到硬件多位一体的集成式大爆发,我们也将迎来和见证一个前所未有的科幻时代。