周鸿祎：Sora的面世给职业警醒，中美在 AI 范畴有巨大距离｜钛媒体AGI

liukang20247天前718吃瓜1085

钛媒体App得悉，全国政协委员、360集团创始人周鸿祎在2月23日的一场活动中要点回应外界聚集的AI（人工智能）焦点论题。

优雅的周鸿祎：Sora的问世给行业警醒，中美在 AI 领域有巨大差距｜钛媒体AGI的图像

周鸿祎表明，和美国比较，我国在 AI 技能上存在距离是客观事实。

“我说中美有距离，我一向坚持这么说，看到距离才知道怎样去迎头赶上，假如你都不供认距离，咱们早就遥遥抢先。咱们抢先的都很过分了。在刷榜的效果里，国产大模型底子独占了Top1到Top10，GPT-4都被刷到10名开外去了。可是Sora的面世仍是给了咱们一桶清醒的冷水。”周鸿祎称。

不过，周鸿祎也说到，中美在 AI 上的距离首要体现在方向上，一旦方向正确，国内公司立刻就会迎头赶上。不管是Sora选用的Transformer模型，仍是Sora自身，实质都是软件，“现在的落后，我觉得大约一到两年就能处理。”

谈及最近深陷争议的“AI带课网红”李一舟，在周鸿祎看来，人们的确需求 AI 科普教育，“他犯了一个很大过错，便是不应收费。”周鸿祎泄漏，自己将在不久后推出免费的 AI 课程，期望能用最浅显的言语解说最深邃的技能，为咱们做好 AI 科普。他详细在2月29日发布相关事宜。

“AI 科普很要害，咱们虽然都在谈AI，实践对AI充溢惊骇，以为 AI 会带来大规划赋闲，实践上，AI 是人类最好的朋友。”周鸿祎谈到，现在整个大模型赛道还没开端挣钱，现在仅有能挣钱的便是“英伟达”，除此之外微软、OpenAI都是在赔钱。

“依照推翻式立异的思路，一个推翻式立异的东西出来并不是完美的，它有很大的缺陷，它最大的价值是降低了运用的门槛。”周鸿祎猜想，大模型未来的盈利期至少还有十年。

周鸿祎着重，AI 大模型必定是一场工业等级的革新。“这才刚刚开端，假如每个人都赚了许多钱了，就跟今日互联网公司很挣钱相同，这个职业就会‘老练’了。”

以下是周鸿祎此次回应关于 AI 的部分内容收拾：

问：请问您是怎样看待Sora的？它对职业的影响会有多大？是否还会呈现相似于之前百模大战的竞赛格式，您是怎样看的？

周鸿祎（以下简称周总）：Sora的技能原理国外评论的也十分多。像今日stable diffusion发了一个相似架构开源的东西。我经常讲，人家一开源，咱们科技就前进。所以，再往下，国内或许在原始立异从零到一做的弱一点，但一旦OpenAI宣告了技能方向，宣告了产品，我以为国内的仿照很快会跟上。所以，必定又有许多家，做出相似的文生视频相似的东西，我觉得会呈现你说的百模大战的这种状况。

问：最近关于 AI 练习这块的言辞和争议比较大，不知道您怎样看？您觉得这个职业怎样标准？

周总：有两点我是必定的。

榜首，AI 的科普在我国变得十分要害。因为我触摸许多人，咱们虽然在谈AI，实践上咱们对AI是有惊骇的，这种惊骇被网上一些号给带节奏，觉得AI会导致大规划赋闲，AI会带来职业的溃散。你去用一用 AI 就知道说，AI是人类有史以来创造的人类最好的朋友，也是最好的东西，它可以让咱们许多人解锁技能，可以让咱们变得。比方我曩昔不会画画的，或许我曩昔不或许去做导演拍视频的，我可以解锁这个才干。所以，特别对年青人来讲，AI更是让你从一个资格十分浅的人，立刻可以跟那些有经历的人站在同一个起跑线上。

第二，我一向以为，AI并不会带来职业的溃散，或许是让哪个职业（被）推翻掉，它实践上会给这个职业，比方对短视频职业、影视工业、广告业带来正向的推进，只需那些不必AI的人会被用AI的人筛选。

可是许多人说，你讲这些道理没有用，现在网上只需立个摄像头，装腔作势的在摄像头前面讲一番话包含我自己也是，就会有许多人信以为真，咱们也供认不了谁讲的是对的，谁讲的是错的，所以，我以为最重要的是，AI 必定要自己去用，必定要去缩小。包含我跟许多企业的老板也讲，企业里边为什么要经过一个含 AI 量的概念。企业里边从上到下，从内到外都要去用AI的东西，用了才知道它的长短在哪里，它的鸿沟在哪里，它的长处是什么，它的缺乏是什么，防止AI惊骇症或许AI万能论，这两个观念都是不对的。

咱们用了AI之后，对AI有一个科普，才干更好的知道怎样去拥抱AI。所以，我觉得搞AI科普教育是对的。

咱们需求科普教育，所以我以为AI的科普教育是十分重要的，但我以为他犯了两个过错：榜首：他应该免费；二、还有他背面没有自己 AI 的产品，好像是把许多国外的产品做了套壳，这个我就不点评了，这样做必定是有问题的。

所以，我最近在考虑，我预备开一个免费的AI课，咱们觉得我讲课行吗？可是我必定不敢收费了。

问：咱们想让您多解说一下，咱们该怎样了解这样的距离，或许距离加大背面的中心原因是什么？

经典的周鸿祎：Sora的问世给行业警醒，中美在 AI 领域有巨大差距｜钛媒体AGI的插图

周总：榜首，我说中美有距离，我一向坚持这么说，看到距离才知道怎样去迎头赶上，假如你都不供认距离，咱们早就遥遥抢先，咱们抢先的都很过分了，你要天天这么觉得，不是有的公司从前精确的预言什么时分逾越GPT4。咱们做个大模型就去刷榜，刷榜的游戏你们都知道，把那个考题预先训一遍。当然在刷榜的效果里，国产大模型底子可以独占Top1到Top10，GPT4都被刷到10名开外去了，可是，Sora的面世仍是给了咱们一桶清醒的冷水，让人看看仍是有点距离。

第二，我觉得GPT手里有些秘密武器没有亮出来。在上一年OpenAI“宫斗”的时分他们就争辩了半响，现在GPT5现已在蓄势待发了，GPT-5发没发的问题彻底取决于奥特曼的心境和他的节奏感。奥特曼什么时分发呢？当Google要做什么事情的时分，或许当META要做什么事情的时分他就会发一个东西。所以，考虑到他们对AGI的决心，我以为在人工智能的原创方面上，咱们跟他们的距离首要在原创方向上。

咱们知道，搞技能最难的是找到原创方向。原本人工智能、深度学习、神经网络，我略微慨叹一点，你们爱听不听。包含META的杨立昆 (Yann LeCun）在拼命进犯Sora、进犯GPT、进犯Transformer模型。

其实，Transformer模型不是OpenAI创造的，可是OpenAI是榜首个挑选了一种新的用法，便是在里边无限地加参数的巨细，加留意力的衔接数目，加神经网络的层数，也便是说他们信任一种叫做暴力美学，便是只需是大力出奇观，所以，许多的跟Transformer其时一同竞赛的模型，像T5、BERT，咱们在小数据、小参数状况下的功用才干，Transformer都不是最好的，可是只需加大参数之后，只需Transformer是能支撑无限的加大规划。所以，到现在来看Transformer这套模型至少被验证了，是现在效果最好的。

所以，咱们听了解这一点吗？这个方向必定是正确的。OpenAI走对了方向。

其次，Transformer是把文本，文本是一个一维的数据，一个单词在另一个单词的前后，只需前后联系。处理图片他们现在也是用相似的办法，图片是二维的，一个像素，有X、Y轴的联系。视频是3D的数据，为什么呢？一个色块除了有在图片上的方位之外，它有依照时刻移动的联系或许依照时刻变形的联系，所以，这次Sora的呈现在技能上有个巨大的效果，OpenAI用Transformer架构成功完成了对各式各样的文字、图片、声响还有视频的归一化的处理，并且再加上Transformer自身对语义的了解，对常识的了解，所以，它这次能做出Sora是把GPT的才干融在里边了。它还做了一个文生图的东西叫做DALLE，把DALLE的才干也融在里边了，所以它就比Pika、或许Runway这种仅仅使用Diffusion模型做像素的仿制这种效果要好许多。所以，Transformer现在全国际都在跟这个架构，这次处理视频怎样做呢？最早咱们也不知道该用什么架构做，有的人是用Diffusion做，便是Pika、Runway这种概念，便是把动画看成是多帧图片，把一张张图像出来，可是它没有用Transformer模型来做。所以，在这种方向性的立异上，OpenAI做得十分好，我觉得距离首要在这儿边。

我方才啰里八嗦讲了点技能细节。榜首，咱们和他人的距离首要在方向感上，一旦方向感确认，我国公司的学习才干和仿照才干会很快，并且你可以幻想，立刻就会有人去挖Sora团队的那些人，这些人中有些人会出来创业，比方同行会发布开源的东西，会发布一些揭露的论文，所以，这儿边许多办法很快都会走漏出来或许共享出来，对我国团队来说去跟进，不是一个很难的问题。可是Sora让我觉得最震慑的是说，它发生视频是一个副产品，它在做这个过程中忽然发现说，经过对许多视频资料的学习，不只学到了怎样去绘出图画，最重要的它要绘出实在的这种、契合咱们每个人常识的视频，它有必要要了解这个国际许多元素之间的互动联系，我不知道咱们了解不了解这个意思。

所以，我再举个比方，Sora假如开测验账号，假如能拿到之后，你们可以多替我做个试验，让Sora画一场篮球赛，让Sora画一场足球赛。假如一个人底子没有看过篮球和足球，不懂得篮球和足球轨道不相同，得分规矩不相同，它是画不出来的。比方说篮球打到篮板上会反弹不会穿曩昔，但篮球打到篮筐里就会笔直的落下来，篮球在地上会弹起。这些常识假如Sora不把握，你可以幻想一个人假如都没有看过，没有把这个常识总结下来，他要把它复现出来几乎是很困难的。

我经过这个比方来讲，为什么Sora让人离AGI又近了一步呢？GPT实践上是处理了机器和人之间相互了解和交互的问题，因为它了解了言语。了解了言语的时分，杨乐坤就从前进犯，说它不了解，它仅仅会填空。但实践上，一旦把人的言语了解了就意味着是十分大的前进，因为言语是人类所独有的创造的东西，人类用言语可以描绘逻辑，人类用言语可以描绘这个国际的模型，人类可以用言语来描绘人类堆集的常识。所以一旦把言语了解了，就意味着AGI的榜首个难关就霸占了。

可是光是能说话了，智能是没有太大用途的。因为它对这个国际的许多规则并不知道，比方你弄个机器人，想让机器人到冰箱里拿个西红柿炒鸡蛋，你发现练习起来就很难。因为它要知道西红柿是硬的摔不破，鸡蛋一摔就会摔破，他要知道怎样磕鸡蛋，这些常识靠文本常识是不行的，有必要要像咱们人类相同要见过之后才干知道。所以，这次Sora等于有意无意，我个人觉得对OpenAI来说或许也是无意中做出来的，大力出奇观之后他发现说，他实践上经过Sora的练习办法让机器可以跟国际互动了。

最终他使用Diffusion模型仅仅把他要做的视频做出来，但前面它必定是在Transformer模型里把这个国际的一些规则给了解了，我不知道咱们了解这个意思吗？因为我做过一个比较，一个画面一只猫早上去挠主人要吃的，那个主人在床上翻身，你们看过那个吗？你们或许光留意猫和主人了，没留意那个枕头。你知道那个主人在枕头上一翻身，枕头被压皱了，枕头柔软的感觉。这个假如用计算机特效来做，这必定是一个噩梦，你用什么函数来描绘这个枕头的陷落，来描绘这个枕头的皱纹，咱们就会做的不像真的。可是Sora有限的算力，它必定是看过床和被子、枕头相似的这种感觉，所以它把这种感觉可以重绘出来。所以，我觉得这是Sora最了不得的当地。

为啥我说它最终实在的奉献是给通用机器人和主动驾驶呢？你让通用机器人和主动驾驶有了对实在国际这种交互和感知的才干，你对这个国际的了解就比了解言语又更近了一步。

所以，这次Sora在AGI上的打破，从人类的视点来说，是了不得的打破。

问：关于我国来说，2024年，有没有其他的一些共同、值得拓宽的优势？您怎样看待本年我国在 AI 方向的远景？

周总：我觉得我国仍是有优势的。虽然咱们现在言辞一边倒，老是以为，因为在原创技能上咱们落后，它是一个客观事实。可是，这个落后，仅有达观的这个落后不像光刻机和芯片距离那么大。究竟Transformer模型也好，Sora也好实质上仍是软件，所以，现在这个落后的时刻，我觉得大约也便是一年到两年的时刻，是可以去处理的。

可是，另一方面，你不需求比及全面赶上GPT-4，全面赶上Sora，咱们才干去使用。所以，现在有一条主线是做Sora和GPT4这种超级通用的大模型。这是一条主线。2022年、2023年我国追逐的还不错，用了不到一年的时刻赶上GPT-3.5了，我觉得仍是OK的。

2024年，我觉得应该是使用之年。不然咱们对GPT会有啥感觉？便是能写诗，能斗乐子，能解奥数题，但离作业还太远。或许能在作业方面帮咱们做一些作业。Sora咱们震慑多点，是因为Sora比GPT更近一步，咱们显着感觉短视频发生在影视工业、游戏职业、广告业可以做点详细的事了，但依然是一个通用的东西。我觉得2024年，除了这两件事之外，2024年在企业方面在笔直范畴，大模型是大有可为的。

大模型原本要实在发生一场工业革新，大模型必定要进入到百行千业，跟许多企业的事务流程或许产品功用相结合。咱们泛泛地讲做一个通用大模型逾越GPT4，真的逾越GPT4是比较难的，可是GPT4是一个全才生，啥都懂，可是它不专。但假如我在某一个事务范畴有共同的事务数据，我就此在一个笔直范畴把大模型练习的很好，并且把大模型和企业的许多事务东西结合在一同。就像大模型不只需脑子，并且有共同的常识，还有手跟脚，那么，我觉得在一些笔直范畴大模型的才干，一方面能逾越GPT4是彻底有或许的。并且做笔直的模型，我也很附和一个观念，它不需求做千亿、万亿的模型，它只需做百亿的模型，这样对许多企业承当的成原本说也没问题。

震撼的周鸿祎：Sora的问世给行业警醒，中美在 AI 领域有巨大差距｜钛媒体AGI的照片

假如你做企业，依照我的一个预言，大模型无处不在，企业里边将来不会只需一个超级大模型，企业里边会有多个小规划的、百亿级的大模型，每个大模型就干一个场景的加强作业。这个大模型再跟企业的事务渠道结合起来，按这种形式，对现在许多企业来说大模型彻底用得起，并且可以用得很好。

所以，咱们（360公司）在网络安全方面做一个安全的笔直大模型，用的是百亿的模型练习的。因为360有两个优势，一是我有许多安全东西，等于用这些东西的才干给它完成了才干的增强。大模型不能只动嘴，不能只考虑，它还要有手和脚。还有咱们有许多专家堆集的常识，360安全大数据堆集的常识，咱们把这些常识全都灌到大模型里去，现在这些大模型现已彻底替代了360的安全大脑，现在在用户那里试用，碰到APT进犯现已可以主动发现、主动处置、主动给用户出陈述。在这一件事发现APT这件事上，我可以骄傲地说咱们逾越了GPT4，当然你别跟人家比全面才干。

所以，我是觉得，2024年不管在To c、To B都应该出来一个详细的场景。

问：我想问一下，在文生视频后，视频生文离咱们还有多远？

周总：这个问题问得有意思。文生视频是最难的，文生视频的过程中，有必要有视频生文的技能做支撑。所以，在这次Sora的技能陈述里，它管这个技能caption，许多人把它翻译成字幕技能，便是视频生文和图生文的技能。OpenAI从Tiktok，包含从美国许多电影里搬了许多视频片段来做练习，光是给它看视频没有用，必定是要把视频打上标签，要注明，这儿就需求用到图和视频生文的技能，这个技能比较简略。

问：现在有越来越多的年青人期望创建 AI 公司，那么您以为开释技能最大潜力的方向在哪里？

周总：我简略说，AI现在看有三个方向。一个方向是做大模型自身，这块我不以为年青创业者能做，要想做就应该参加大厂去做，因为你没有满足的显卡、没有满足的算力，没有长时刻的投入，国外这些公司说白了现在微软OpenAI一年都要赔上百亿美金，投入是巨大的，显着小创业公司必定干不了。现在这些小创业公司，我也不点名，就算融到几轮资，做了一个大模型出来又怎样呢？因为现在免费大模型现已把这个从原子弹变成了茶叶蛋了，大模型几乎是免费的。所以，这条路我以为便是你说的，我不附和他们走。

第二个，使用大模型的API在to C场景找一些使用，适当于用他人的，用百度、用360、用阿里的大模型做后台，大模型适当所以一个agent，给我供给才干的支撑，我找一些用户场景，这条路是比较可行的。但这个不是简略的套壳，套壳是你做得跟GPT、跟Sora、跟Stable diffusion做的差不多，这种套壳是没有价值的，只需大模型厂商哪天一晋级套壳的东西就会死一批。比方说我举个比方，Sora出来了，是不是做文生视频就没有价值了，不是的。Sora只能做一分钟，可是你要做十分钟的话，比方你是不是需求有一个工程的办理，让它帮你把十分钟的东西调Sora做出来十段视频，最终你要把十段视频连在一同，你要配音，你要加字幕，有些当地是Sora的效果，有些当地是配上你自己拍的视频。只需你找到用户的场景，你后边可以调各种人工智能的强壮的API的支撑，你仍是可以做出使用等级，不要老是在中心技能上说我要去跟Sora去。所以，最近Pika说预备转型，假如它转型成功，它的人机界面比Sora更友爱，它在Sora之上可以供给更杂乱的视频剪辑才干都是有时机的。

第三，我方才重复说了好几遍的，从现在来看GPT实在的效果仍是在进步生产力，在我国国家也在支撑更多的企业做数字化，所以大模型进企业，并且用百亿的这种规划十分低的本钱进企业是彻底可行的，并且企业里边只需你不贪多贪大，说我给你做一个什么很庞大的大模型，而是选一个比较详细而微的场景处理问题，那么它逾越GPT4的或许性是十分大的。但这儿边就需求放下身段，因为这时分用什么场景、用什么事务必定要找到某些职业、某些专业的这种笔直事务的公司，要跟他们协作。这时分有点像你做乙方他人做甲方，对许多创业者来说是巨大的应战，因为创业者有时分比较牛比较自我，或许不必定听得进他人的定见，他觉得我懂中心技能，但你要把中心技能用到许多传统企业里，在事务上的确要听这种传统企业的调度。

问：大模型现在难在哪里？

周总：榜首，这个方向出来之后，国外也有两条道路的奋斗，一条是以OpenAI的闭源，还有一条是以META为代表的开源，所以，开源的道路，开源的方针要打过闭源，他们会不断的去猜想闭源怎样做，会把许多东西开源出来。开源出来的优点是天底下有许多好公司还有许多大公司程序员个人会活跃的在开源项目里，咱们都踩着他人的基础上奉献效果，所以它的化学效果会十分显着。我现在猜想，最近在国内我找了一些大学，包含昨日回来的时分和清华的张亚勤教授，他原本是微软我国的头，也在百度当过总裁，现在到了清华当我的教师去了，我现在不是在清华念书，所以也跟他聊了聊，现在许多的技能里边用到了那些模型和算法应该都是揭露的，实践上OpenAI最大的才干一个是找方向，一个是工程化思路十分谨慎，现在便是要把这个工程化的思路探究出来。所以，咱们前面学GPT的过程中，也是方向现已确认了，往东走毫无疑问必定能走通，但详细碰到一个槛怎样过，碰到一个山怎样翻，它也有许多详细的坑要踩，有许多详细的办法要验证，所以这个需求时刻。

第二，我的猜想对算力或许会是一个槛节。网上有些言辞也不对，网上说Sora的参数不大，只需30亿参数，这个人弄错一个概念，视频的参数和文本的参数不能简略做比照，就像文本我有十万字，视频只需640×480，可是它两个占的存储量彻底不在一个数量级上，所以，榜首它不只需30亿参数，第二就算只需30亿参数，视频剖析对算力的耗费应该是远远逾越做一个千亿模型。所以，我觉得现在国内的显卡都被卡脖子之后，或许算力是一个问题。所以，包含GPT，包含Sora为什么只能做一分钟，我在猜想，因为它和4秒、6秒有实质的不同，4秒和6秒是因为悉数用像素生成，没有国际的常识之外，4秒、6秒之后的图怎样样就想不出来了。所以，Sora能处理一分钟，意味着它也能做十分钟，也能做六十分钟，但它为啥不做？我觉得也是因为算力的约束，还有本钱的约束。

所以，对国内来讲，下面怎样可以把算力会集起来。

为啥我重复做科普，Sora假如仅仅是一个文生视频的东西，咱们落后就落后了，不就咱们广告落后点，不就咱们电影拍得慢一点嘛，这些落后都不会给大国竞赛带来问题，不就对娱乐业带来影响。但实践上这件事预示着AGI的一个要害节点，所以，这件事对国家是挺重要的。

问：关于大模型的盈利期，您的判别何时能呈现？

周总：我以为大模型的盈利还没开端，现在仅有能挣钱的便是英伟达，国外最挣钱的是英伟达，除了英伟达之后国外包含微软也不挣钱，微软每年在赔钱，OpenAI也在赔钱，所以还没有进入到盈利期。我估量亚马逊会挣钱，云厂商和硬件厂商必定首先挣钱，可是我觉得假如能场景化了，2023年、2024年在一些场景化上或许可以看到这种挣钱的时机，所以，大模型的盈利，这是一场工业革新等级的革新，未来的盈利期至少有十年以上。

这个盈利会十分长，至少十年，现在咱们还没赚到钱，除了英伟达赚到钱了，咱们还没人赚到钱，这表明刚刚开端，假如每个人都赚了许多钱了，就跟今日互联网公司很挣钱相同，这个职业就现已老练了。

告发/反应

返回列表

上一篇：读书会︱今日咱们需求什么样的世界史（下）

下一篇：iPhone 17 Air用高密度电池苹果不在续航上退让

热门吃瓜网

周鸿祎：Sora的面世给职业警醒，中美在 AI 范畴有巨大距离｜钛媒体AGI

以下是周鸿祎此次回应关于 AI 的部分内容收拾：

相关文章

王毅在《人民日报》撰文留念中俄建交75周年

监管美国核武器的美军战略司令部副司令炒作“我国核威胁”

明晚，2000架无人机点亮江城夜空！

李承铉选527表达戚薇撒狗粮谐音意为“我爱戚”

大S及其情感历程

热门吃瓜网友科普：大S老公是谁？背后的故事大揭秘

揭秘！此前发现的不明飞行物是火流星？怎么构成的？会落到地上吗？

Copyright Your WebSite.Some Rights Reserved.

Powered By 吃瓜黑料. Theme by TOYEAN.