登录甲子光年
其他登录方式
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
找回密码
获取验证码
注册甲子光年
获取验证码
注册即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
绑定手机号
获取验证码
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
完善资料
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
微信登录
扫描二维码 | 授权登录甲子光年
【独家】甲小姐对话徐怀哲:Morph AI要做第一个AI native的视频生产工作流
作者:刘杨楠 编辑:张一甲 2024-02-29

Morph AI成为Stability AI首位视频产品领域的合作伙伴。这家年轻的AI公司要做新一代视频工作流的定义者。


作者|甲小姐 刘杨楠


一家创业公司最绝妙的状态,或许是身处最闪耀的赛道,集资本、媒体、学界各方青睐,并拥有一个年轻且充满干劲的团队,朝着一个共同的宏愿前进。


Morph AI,这家成立不到一年的AI生成视频公司,正处在这样的阶段。


创始人徐怀哲是香港科技大学的人工智能博士,2023年4月,他组建了一支极其年轻的团队,联创和团队核心成员均为90后、95后、00后,并立下一个宏大的远景,要“做第一条AI native的视频生产工作流”


2023年4月,Morph AI成立。当时,整个行业正被包裹在ChatGPT掀起的文本生成模型狂欢中,难度似乎更高的视频生成模型“高处不胜寒”,尚处于将热未热的状态。但10个月后的今天,生成式AI领域迎来新宠儿——Sora。


Sora正在重塑传统的视频生产模式。甲子光年智库提出,基于AIGC视频生成工具的提示交互式视频生产制作方式将成为新范式。

“So exciting!”Sora发布当天,徐怀哲在朋友圈感叹并写下:“现阶段如何结合已有模型能力,提供更好的工具和全新的workflow(工作流)是整个行业的下一个match point。”


而Morph AI要做的,就是成为新一代视频工作流的定义者


北京时间2024年2月29日凌晨,Morph AI迎来里程碑式的一刻。知名人工智能企业Stability AI宣布与Morph AI达成合作,Morph AI成为Stability AI在视频产品领域的首位合作伙伴。

与此同时,Morph AI发布了面向全球用户的网页端产品——Morph Studio


Morph Studio有三大关键词:


“All in one”,即将视频生成、剪辑、后期等环节集于一体,用更可视化的方式激发创作者的想象力,支持创作者调用AI模型探索每个镜头的无限可能;


“可互动视频”,即基于生成式AI全新的信息分发机制,激发用户对视频的二创兴趣;


“可互动视频社区”,则是可互动视频内容生态的载体,让很多优秀创作者提供模板素材,其他创作者可以去复制、借鉴、创新某个工作流,把视频替换为自己想要的效果。


Morph要做第一家把video foundation model落地为创作者使用工具的公司。”徐怀哲在对话中多次强调这一点。


本文,甲小姐对话Morph AI创始人&CEO徐怀哲,聊聊这位年轻创业者对“游戏终局”的思考,以及对当下的小心求证。


1.谈路径:“人类智慧只是智慧的一种范式”


“世界是不是真的需要一个解析解?”


甲小姐:Sora最让你exciting的点是什么?


徐怀哲:我看到Sora第一个case就感觉这是非常了不起的工作。看的case越多,越感觉Sora拉开整个行业一个身位,行业已经进入一个全新的阶段。Sora无疑加快了整个应用层的发展速度,也印证了我们之前在模型层的一些猜想,这是最让我感到exciting的地方。


甲小姐:你曾预测2024年AI生成视频赛道会迎来Midjourney时刻,Sora的出现是那个时刻吗?


徐怀哲:更准确地说,Sora更像文本模型的GPT-3时刻。我们逐帧分析了Sora生成的大量case,发现Sora并不十全十美,但它有两个特点:通过scaling law和原有模型拉开了差距;验证了scaling law可以work。对Morph来说,这是一个积极信号,意味着视频很快会迎来它的GPT-3.5甚至GPT-4时刻,对整个行业都是巨大利好。


甲小姐:Sora出现前,头部玩家还没有百分百确认scaling law是终极范式吗?


徐怀哲:过去几年深度学习快速发展,让我们更加坚定地相信scaling law,只是不确定该用哪条技术路径实现。从去年11月开始,我们分别尝试了三条路线:Diffusion with U-Net;Diffusion with Transformer,即DiT路线;以及纯Transformer路线。我们在相对小的数据集里做了试验,但没有比较出哪个更好。Scaling law的前提是有足够多的数据量来scale up。OpenAI无疑表明DiT路线更有潜力。


甲小姐:现在大家应该All in DiT,还是去寻找下一个更好的路径?DiT会成为AI生成视频的“大一统”范式吗?


徐怀哲:很难有确定性答案,但现阶段大家对DiT还是很有信心。我相信DiT的潜力还没有完全释放。如果scaling law成立,我相信OpenAI已经拿更多数据和算力去做这件事了。


甲小姐:Sora和ChatGPT的发酵节奏很相似,哪个带给你的震撼更大?


徐怀哲:作为一个视频创业者,一定是Sora的震撼更大。但客观来讲还是ChatGPT的冲击更大,因为那是更普世意义的scaling law所带来的震撼。ChatGPT带来的变革不同以往,Sora只是重复了相似的变革。


甲小姐:Sora能快速引起这么大反响,和OpenAI的营销措辞也有关,比如他们直接将Sora拔高到了“物理世界的通用模拟器”高度。你认为从Sora到通用世界模拟器这条路走得通吗?


徐怀哲:Sora至少在这条道路上。我们内部很欣慰OpenAI能这样说。举个例子,一个婴儿学习世界知识最先学到的是视觉知识,先看到这个世界,后来逐渐学习语言。GPT可以直接学文字,而Sora可以直接学习视觉,之后再配上文字。


甲小姐:Sora“物理世界的通用模拟器”这个说法很快面临争议,谷歌、杨立昆等试图将Sora“拉下神坛”,他们认为Sora不能真正模拟现实世界,有很多幻觉。另外,文字对AI生成内容的容错性更高,而视频只要有一帧、一个要素不符合现实物理规律,比如力学、光学,就会不真实,这种差异是否会导致scaling law在视频方面走得不那么顺利?


徐怀哲:GPT发布后我特地看了杨立昆的评价,他一直是一位非常好的批评者。他对ChatGPT也提出了类似的批评,这套话术可以挑战2017年以后出现的每一个深度学习模型,实则是在批评深度学习Data driven(数据驱动)的范式。


但我从更宏观的人类历史角度分析,很早以前,我们非常追求“解析解”,比如牛顿第二定律可以用一个简单的公式去表达运动,但很难用一个非常解析的方式去解三体运动规律,三体运动需要用计算机去解。


今天我们真正要解决的问题是,世界是不是真的需要一个解析解?


人类的智慧可能只是智慧的一种范式,而ChatGPT、Sora等其他范式能够通过大量模拟世界学习到世界规律。我坚定地站在深度学习的数据驱动流派——即通过大量的数据去模拟世界所得到的结果,可能会比一个解析解更能反映世界的真实物理,更能体现智能。用一个物理公式概括现实世界已经不可能了,Data driven似乎是一个高级文明,更有可能成为理解世界最终奥妙的一把钥匙,而不是一个解析解。


甲小姐:就像电影《降临》所讲述的,外星文明和人类文明处于同一个物理世界,但两个文明遵循两套完全不同但各自自洽的物理体系,人类的物理体系只是一种范式。


但杨立昆多次在X上“狠批” Sora,他强调了文字跟视频的区别,比如视频是高维连续的,而文字是离散的。模拟世界需要“可复现”的生成,视频似乎比文字难度更高。在你对深度学习的信仰中,文字和视频有没有本质区别?


徐怀哲:Scaling law和Data driven是近十年内唯一的解。


其实,文字是一个信息密度更高的信息载体。比如“酸的橘子”和“甜的橘子”,只换了一个token,却把这句话引到了截然不同的语义。视频是连续的图片,每帧与每帧之间的信息密度相对较低。对于观看者来说,相邻的两帧视频可能差别不大,不会彻底改变语义。因此我认为视频的容错性反而比文字更高,这也导致它更难被training。“酸”和“甜”是截然不同的语义,模型很好捕捉,但视频的每一帧可能只有几个像素点的差别,更难被模型捕捉。如果逐帧分析Sora生成的视频,会发现里面还有很多谬误,但整体已经很惊艳了。


这对消费者来说是一个利好,但是从模型训练角度来讲,如何在信息密度很低的模态中捕捉细微的差别,是比语言更难的任务。今天大家推测Sora的模型参数是30亿,相对比较小,scale up之后,模型表现可能会更好。


甲小姐:对于视频生成模型发展的阶段,你是否有类似自动驾驶L0到L5的划分体系?


徐怀哲:很难类比。如果真要类比,现在的视频生成还在L2左右。今天Sora生成的视频很震撼,但依旧不可被消费。如果一个视频里没有声音,整体表现力会弱很多。


完整的视频生成方法不仅有文生视频、图生视频,还涉及一些编辑工作,之后要放在Pr、AE等后期软件里剪辑。Sora只是解决了视频制作里的其中一环,Sora距离完全脱离人为干预还有些距离。我们认为一个能够打通音频、文字、剪辑、生成环节,一体化生成视频的App更有可能是行业最终解决方案。


Morph的使命就是把真正的video foundation model以相对较快的速度落地,让创作者们用我们的工具做出真正有意义的视频。


甲小姐:你们想做的是一个完全端到端的视频生成产品?


徐怀哲:对,最后它应该是个whole package(完整的产品组合)。


甲小姐:对于AI生成视频的所有公司来讲,如今都要面临一个战略决策,是调整路线对齐 Sora,还是继续走自己的路,你预判大家会如何选择?


徐怀哲:我不能代替同行发声,但我可以从两个身份分享观点。


作为Morph的创始人,我们会持续跟进Sora,不断提高我们的研发水准,真正让video foundation model尽快落地。一个非常有意思的公司就是Character.AI,它是一家大模型公司,但并不强调大模型,更强调大家能够在他们的产品中获得乐趣,这也是Morph在追求的事情。


作为一个研究者,DiT路线也让我很兴奋。我们大概在四五个月前也尝试过,但由于算力以及各种资源限制,我们做得不够深入。今天OpenAI验证了DiT的可行性,未来我会继续盯紧这条路线,看看如何做出新的突破。


甲小姐:在你看来,AI生成视频行业未来的发展节奏如何?


徐怀哲:ChatGPT发布后,全世界都在玩一场“明牌游戏”,总体上行业没有什么秘密了。大家都已经认定了这是时代潮流,所有的资本、人才都会跑到这个领域里。之前我们会看到很多微变革,概念火一下就没了,但生成式AI的一致性很强,无论文生文、文生图还是文生视频,影响力一直在扩散。所以,我认为Sora发布之后整个行业的技术发展、产品进度都会被加速,我个人更期待的是怎么通过视频技术为创作者和用户带来更多价值和乐趣,我相信这件事会以一种令人意想不到的速度去发展。


2.谈定位:“想做好应用层,模型层能力也要跟上”


“Morph要做第一家把video foundation model落地为创作者使用工具的公司。”


甲小姐:你们对产品的定位是什么?


徐怀哲:好的创作离不开好的工具,给创作者提供一个高效的工具链和创作的workflow是我们这款App最大的意义。


甲小姐:你在朋友圈写道:“现阶段如何结合已有模型能力,提供更好的工具和全新的workflow是整个行业的下一个match point。”这是否意味着你们放弃自研模型,聚焦应用?


徐怀哲:我们没有把模型层放到应用层的对立面,而是剥离了模型层和应用层的能力


模型层聚焦的问题是如何生成时长更长、质量更高、风格更多元的视频,应用层则要兼容创作者的需求。其中,可控性很重要。我们非常重视创作者的需求,结合我们的技术背景,我们有信心可以从创作者需求出发去优化我们的模型。


因此,我们将战略聚焦为把video foundation model落地到应用层,但并不意味着我们放弃模型层。想把应用层做好,模型层能力也得跟上。单纯做应用很难有机会,我们还是要强调自研模型,企业的模型研发能力直接关系到产品的竞争力。


甲小姐:为什么不直接all in应用层,模型层就接入Sora等模型的API?


徐怀哲:现在应用和foundation model之间还有gap,需要研发能力很强的团队把gap填平。Morph要做第一家把video foundation model落地为创作者使用工具的公司。


甲小姐:你如何分配公司在模型层和应用层的资源投入?


徐怀哲:我们的资源分配比较灵活。在适当的时候,模型层提供的能力可以接到应用层上,通过调试模型让应用表现更好,两个团队紧密结合,而不是非此即彼。


甲小姐:你们本次发布的产品是什么形态?


徐怀哲:Morph Studio是一个网站App,与此同时,我们也坚定相信Vision Pro的生态会挤占Macbook,未来会考虑往Vision pro上拓展。


甲小姐:为什么这么早就开始考虑终端形态的问题?


徐怀哲:对于AI native的视频产品来说,在手机端的操作是不符合用户需求的。而Vision Pro直接在用户面前呈现一个3D画质的大屏幕,给AI native App提供了大量新机会。


甲小姐:在Vision Pro里你能提供的不仅是一个视频工作流,它甚至能通过对话,直接让用户沉浸在元宇宙里,还可以编辑用户所处的环境?


徐怀哲:对,我甚至可以去看别人的视频,切入别人的工作流里和他的视频互动。


甲小姐:这一年,你经历了哪些关键决策和思考过程?


徐怀哲:第一个关键决策是去年二三月,我们讨论要不要出来创业。当时我们很兴奋,也有很大挑战,因为我们预判OpenAI的动作会很快,但我们相信视频赛道有巨大空间,并值得参与。


第二个关键决策是去年11月,我们将模型层和应用层分离。作为一家创业公司,我们始终认为OpenAI是竞争对手,我们要时刻做好应用层爆发的准备,提前布局应用层,同时在模型层也不能落后。单纯嫁接模型做应用是不可能成功的,我们要做好技术储备,把产品打磨好。


3.谈生态:“知道珠穆朗玛峰有多高就行,第二梯队还在香山”


“现在我们就要思考游戏的终局。”


甲小姐:还原一下你们和Stability AI的合作经过,他们选择Morph的核心原因是什么?


徐怀哲:其实我们很早就开始探讨合作了。去年开始,我们两方就在社区围绕视频产品有很多交流,Morph也通过社区参与展示了自己的模型研发能力,这对开发一款好的应用至关重要;此外我们很早就和他们分享过我们产品的整体设计,他们对我们将发布的网页端产品Morph Studio很有信心。


这是一个相互补充的合作,我们双方都有很强的模型,在经营战略上也有一定共识,而且我们也十分愿意在Stability AI的生态中深入模型研发和应用落地。这也是Stability AI在视频产品领域的首次合作,我们双方几乎是同时提出了合作的诉求,并很快达成一致。


甲小姐:你们具体的合作方式是什么?


徐怀哲:首先是模型层面的合作,双方各取所长,且我们代表了两种生态,Stability AI是开源生态,Morph是闭源生态,但我们相信应用层应该包含开源和闭源。所以通过本次合作,Morph Studio可以调用Stability AI的模型,我们也会向用户明确哪个是Morph的模型,哪个是Stability AI的模型。


其次,借助Stability AI生态中的工具,Morph将为用户打造更完整的视频创作工作流。最后还会有一些市场合作,帮助我们更好地做用户增长。我们不方便透露太多技术合作的细节,可以肯定的是,我们会建立长期合作,合作战略将随着技术和行业的发展,以及我们的应用实践不断调整。最终目的还是帮助技术突破和落地,以及相互学习,共同进步。


甲小姐:你应该深度调研了国内外很多做视频生成模型的企业,也很了解大家的水平。如果Sora是第一梯队,第二、第三梯队大概做到什么程度?


徐怀哲:你知道珠穆朗玛峰有多高就行了,讨论第二梯队的意义不是很大。


甲小姐:第二梯队都在香山?


徐怀哲:是的(笑)。


甲小姐:目前业内大多都在讨论模型层,少有人讨论应用层,你认为业内对Sora的讨论热情过高了吗?


徐怀哲:Sora给整个行业打了一针强心剂,我觉得怎么讨论都不过分,因为它太神奇,太有意思了。另外,视频作为娱乐消费属性更高的模态,大家对应用层的关注存在滞后性。如果我们这次发布能引发大家对应用层更多深层次的思考和讨论,我也非常开心。


甲小姐:OpenAI的技术报告并没有公布Sora的训练细节,我们也无法测试和交互,现在就大范围讨论应用层,是否为时过早?


徐怀哲:不会。Foundation model和能用起来的产品之间始终存在天然的gap,这个gap就是应用层的机会。这些机会不应该等到完全搞清模型再去做,那时候可能为时已晚了。现在我们就要思考游戏的终局。知道终点在哪,过程中很多决策和执行会更容易做。


甲小姐:你认为OpenAI会直接推出一个端到端的Super App吗?


徐怀哲:不排除这种可能性,但这似乎并不符合OpenAI的调性,OpenAI想做的是生态。另外,视频的天花板非常高,而且能玩出花样的细分赛道非常多。例如卫星技术带来卫星电视,大家开始看电视剧;到了互联网时代,大家看YouTube、优酷、哔哩哔哩;再到移动互联网时代,大家有TikTok、快手、Musically。视频领域永远会有新的赛道和新的商业模式跑出来。我想世界上不存在一家AI视频公司能吃掉所有细分赛道,一定会出现新的机会、新的社区、新的范式。


4.谈产品:“生成式AI最大的突破就是把所有模态从静态变为可互动”


“生成式AI‘拍扁’了整个视频制作流程,最终实现‘以假乱真’,无形之中形成了一个全新的工作流。这个工作流该怎么定义才是接下来应用层该集中关注的方向。”


甲小姐:AI生成视频有三类形态:Video-to-Video、Image-to-Video、Text-to-Video,你们的demo里还提到了“Idea-to-Video”?


徐怀哲:几种生成形态我们都有,目前我们更看重如何帮助创作者利用我们的工具将idea快速、方便地实现。


甲小姐:你们给Morph Studio定义了三个关键词:“All-in-one (一体式AI视频创作) ”“Interactive (可互动视频) ”“Community (可互动视频社区,创作者社区) ”。这三件事为什么重要?


徐怀哲:“All-in-one”,是因为目前调用单一模型并不能高效呈现创作者的idea,先在网站上生成视频,再去其他软件做后期,会消耗创作者很多精力,但我们本次发布的Morph Studio已经有效解决了这一问题,把视频制作、剪辑、后期等放在了一起;


“可互动”是一种通过生成式AI实现的新的分发机制,比如一个视频前十秒是我喜欢的,后十秒我不喜欢,过去的方式是把它划走,但未来用户可以直接进行二创,替换掉自己不喜欢的部分。我认为生成式AI最大的突破就是把所有模态从静态变为可互动。比如你可以持续向ChatGPT提问,直到问出你满意的答案为止。这种可互动方式比过去单一的推荐和搜索都更有趣。视频本身作为一种很有趣的模态,它实现可互动性会更令人兴奋;


我们也非常乐意通过工具的方式切入,把可互动视频展现出来给大家玩,这就是Morph想要做的第三件事——“可互动视频社区”。


甲小姐:先看“All-in-one”。传统的视频产业链很长,涵盖“IP-策划剧本-投资-制作-宣发-播出-周边衍生品”等环节,而你们所说的“all in one”聚焦把制作环节缩短?


徐怀哲:是的。生成式AI “拍扁”了整个视频制作流程,最终实现“以假乱真”,无形之中形成了一个全新的工作流,摒弃了拍摄和很多前期准备流程。新的工作流下,如何发挥新的优势,弥补新的劣势,是我们应用层要集中关注的问题。我认为从AI的角度去思考这个工具该怎么做,这个工作流该怎么定义才是接下来应用层应该集中关注的一个方向。


未来,对于创作者而言,单个镜头的可能性更多了。当我们把视频制作、剪辑、后期放在一起后,创作者能更一目了然地知道如何串联视频片段。我们的工具则提供了一个更可视化的方式,来激发创作者的想象力。目前我们正在尝试在画板上呈现更多元的视频素材,并将素材的排列组合更可视化。


甲小姐:Runway和剪映似乎有相似功能,你们的差异化在于?


徐怀哲:Runway和剪映都是基于传统的workflow,我们想做一条全新的workflow,集生成、剪辑、后期为一体的AI视频创作工作流。传统的工作流每一步都有明确的先后顺序,而我们的all in one产品是基于生成式AI,支持创作者调用AI模型去探索每个镜头的无限可能。


甲小姐:我们再看“可互动视频社区”。这有点像沉浸式的互动游戏,让玩家可以进入不同平行时空,感受不同的故事后续,而你们为此提供了一种更简单的生产方式?


徐怀哲:是的。如果只是我们人为发视频,很难形成大规模的二创社区。最有机的方式就是让很多优秀创作者提供一些模板,其他创作者可以去复制、借鉴、创新某个工作流,把视频替换为自己想要的效果。


我们很相信社区的力量能够把整个可互动视频生态做得非常有意思。我们的产品早期更多是工具属性,后期会在工具属性之上形成一个创作者社区。随着创作者社区的门槛逐渐被拉低,会有更多人进来玩这些视频。


甲小姐:这些模板素材的版权归属于谁?


徐怀哲:版权归创作者所有。未来,当一位创作者抛出一个很好的workflow后,其他用户使用前需要支付一些费用,这是我们的一种商业模式。


甲小姐:定义产品每个特点时,你的判断标准是什么?


徐怀哲:直接在模型上做套壳产品肯定不行,要从创作者的创作习惯出发,打穿模型层和应用层,为创作者定制各异的、真正高效的工作流。此前我们调研了很多创作者的需求,发现现有产品很难帮他们搭建高效的工作流。


甲小姐:你们的产品面向专业人士还是普通大众?


徐怀哲:一个社区保持有机活力的前提在于运营者并不强调社区要往哪个方向发展,更多由用户去决定他们喜欢什么样的方向。我们可能在早期会做得稍微垂直一些,未来还是会铺开来做比较通用的方向,最终结果还是由用户来决定。


甲小姐:你认为Morph Studio会成为AI视频时代的“Supper App”吗?


徐怀哲:一定会的。


5.谈竞争:“我们最知道用户需要什么”


“一个有机的社区正是因为有这些可爱的创作者们,才变得更丰富、有趣。”


甲小姐:甲子光年梳理了目前国内在文生视频领域的公司,你怎么看待这些潜在竞争对手?


徐怀哲:视频整体的技术路线在趋于一致化,这是Sora带给我们最大的惊喜,接下来肯定会有很多人加入竞争,我认为这是一个好现象。如果创业创到一个没有任何人跟你竞争的赛道,很有可能是你做错了。


更多人进来至少说明这个行业在“水涨船高”。Sora在蓄水池里放了很多水,我们作为这个赛道的“船”,自然而然会随着水位高涨而受到更多关注,这让我们很开心。视频行业的天花板很高,抓住任何一条细分赛道,都会成为一家了不起的公司,我们要做好自己的事。


甲小姐:你们的护城河是什么?


徐怀哲:Morph的模型层研发能力一直处于行业领先地位,且我们有一个粘性极大的创作者生态圈。我本科差点就去学电影专业了,我一直在关注电影技术,并且定期与相关创作者交流,对创作者需求有更深入的理解。生成式AI时代,我们最知道用户需要什么,并且能基于用户需求把模型层真正落地,让创作者用到更趁手的工具。


甲小姐:产品一旦定义出来,就变成明牌了。如果字节要做,你们还有机会吗?


徐怀哲:首先,我们的模型研发能力很强,整个团队,包括我自己都是技术出身,对模型层的理解领先于其他团队。


其次,真正有意义的事情是把模型层和应用层相结合。很少有人能够像我们一样既了解技术,又了解用户需求。


最后,社区的用户忠诚度很高。Reddit最近在寻求上市,他们是一家很老牌的互联网企业,他们的产品在中国产品经理眼中没有什么可取之处,但是Reddit上聚集了大批死忠粉。创作者社区的魅力也在于此,他们并不会因为某些公司花重金打造了一款新产品就离开社区。相反,我认为一个有机的社区正是因为有这些可爱的创作者们,才变得更丰富、有趣。现在我们团队里已经聚集了非常多优秀的社区运营者和视频创作者。


6.谈商业:“YouTube市场有多大,AI生成视频的市场就有多大”


“我们提供了可互动视频这个全新的范式。”


甲小姐:Morph Studio最先落地的用户群是什么?


徐怀哲:大致分三层:第一层是创建优秀workflow的创作者,属于金字塔尖的用户;第二层是AI视频的二创人群,不会从头创建workflow,而是对已有的工作流进行编辑;第三层是AI视频的观看者,是金字塔底端数量最大的用户。


甲小姐:Midjourney的盈利模式主要是付费订阅,向用户按月收取费用。在你们的设想中,公司的商业模式是什么?


徐怀哲:也是付费订阅。


甲小姐:你如何判断你们所处赛道的市场规模?


徐怀哲:YouTube有多大,这个市场就有多大。我们提供了可互动视频这个全新的范式。如果把社区做得足够大,它有可能像Instagram一样,从一个工具变成一个巨大的交流社区。


甲小姐:你创办Morph的初衷是什么?


徐怀哲:20年前,大家获取信息最快的方式是用搜索引擎去搜索,10年前是通过推荐系统推荐。今天,生成式AI带来了一种新的信息分发方式——对话。


创办Morph的过程中我看了乐高的纪录片,讲了乐高如何用非常有限的积木morph(变形)出千奇百怪的玩具形态。我一直很喜欢做视频,做视频和做乐高一样,视频创作者也会把相关联的视频片段morph到一起,讲述一个又一个有趣的故事,这也是公司名称“Morph”的来源。


甲小姐:你们目前融资进展如何?


徐怀哲:我们一共融了两轮。最新一轮在去年11月完成,现在我们正在接触一些新的基金,有几家已经聊得比较成熟了。


甲小姐:从体感上看,国内外创投界对Sora以及整个AI生成视频的认知是否存在gap?


徐怀哲:国内VC对Sora这波AI的信息获取效率还挺高的,国内外的关注重点差不多。


甲小姐:目前你们的团队有多少人?


徐怀哲:10人左右。


甲小姐:你们的核心团队都很年轻,Sora也是博士毕业生带队实现的,是否越年轻的团队在这个赛道越有竞争力?


徐怀哲:年轻意味着我们都很沉入一线,对技术的跟进速度最快,了解程度最细致。我们平常接触到的AI视频创作者也非常年轻,彼此的年龄gap比较小,我们能更好地触达他们,并理解他们的创作习惯。


甲小姐:OpenAI的技术信仰是Scaling law,你对于AI生成视频有没有自己的技术信仰?


徐怀哲:最先把video foundation model落地到每位创作者的工作流中,这是我们的技术信仰和价值观。


甲小姐:此时此刻你应该正处在一个绝妙的创业阶段——处于有一个想象力巨大的赛道,全世界聚光灯都汇聚于此,团队也很年轻很有干劲。回顾这一年的创业历程,你印象最深的是什么?


徐怀哲:我们的技术能够真正帮助到很多视频创作者,这让我感到非常兴奋。


  • 40123
  • 126
  • 136
  • 0
评论