2024年12月10日—12月11日,“万千流变,一如既往”2024甲子引力年终盛典在北京中关村国家自主创新示范区展示中心举办。70多位科技行业重要嘉宾带来了关于人工智能、机器人、科学智能、新质生产力等领域的最新分享和深刻洞见,其中大量内容为行业首发。
现场,昆仑万维CEO方汉为观众带来了主题为《技术创新下,AI大模型如何驱动娱乐、社交、游戏出海?》的分享。
分享会上,方汉首先介绍昆仑万维在 AI 产业链硬件算力层、模型层和应用层全面布局情况,通过多元化产品满足不同需求实现商业化和出海,并指出AI社交产品或为有潜力的长期商业模式。
对于中国企业蓝海策略,方汉认为C 端市场规模最大、盈利最多,是商业化和出海的重点方向,并且中国人在 C 端赚钱有天赋,中国企业可发挥此优势,关注 C 端市场需求。 同时AI产品要重视产品模式和商业模式上的创新,利用文化平权机遇;创新方向上可从追求 “新”,保证 “好”方面有所突破。
对于初创企业,在研发成本和风险的限制下,注重创新形式,创造用户未见过的内容、娱乐和社交形式,如一些低成本高收益的创新游戏。传统赛道中,将产品质量做到极致也能吸引 C 端用户,如高品质游戏和电影,这也是商业化和出海的有效途径。模型落地要以工具型产品为切入点,重视用户自我表达诉求。
以下是昆仑万维CEO方汉演讲实录,「甲子光年」整理删改:
方汉(昆仑万维董事长兼CEO):各位尊敬的来宾,大家好!我是昆仑万维的董事长兼CEO方汉,作为一家中型互联网企业,其实在整个AI浪潮中,我们进入是比较早的,从2020年开始投身AI研发。但是作为一个企业,我们的中心目的还是要在商业化上取得成功,我们在AI应用落地的探索上可能做得尝试比较多的,而且作为一个出海型企业,90%的收入来自于海外,因此在海外做的尝试也非常多。
所以,我就从公司这四年来,和大家分享一些在AI产品落地上的经验和教训,以及对于AI产品怎么做商业化、怎么出海,还有中国企业在这中间怎么样寻找到自己的蓝海。
昆仑万维经验:AI 产业链全面布局,情感供给或为长期赛道
首先简单介绍一下我们,公司是2008年成立的民营企业,最早做游戏,2015年上市,上市之后我们做了一些转型,主要在出海方面。中国互联网企业的技术实力跟产运实力迭代速度远远超过其他国家的,公司早期我们在海外收购各种老牌的互联网的厂牌,通过增长和运营能力做大。
在2020年之后,我们开始寻找第二个增长曲线,最后我们选定了AI,这四年我们一直探索AI方面的工作。
我们在海外大概有四亿的月活用户,海外收入占比90%,在100多个国家和地区开展业务,在20多个国家有办公室。海外比较大的研发中心在波兰,我们是中国企业里出海走得比较早、做的事情也比较多的。
首先,介绍一下公司在AI产业链布局,在硬件算力层,我们也是买显卡比较早的企业。在模型层,2022年12月就发布了首个开源文本大模型,在应用层,做了很多方面的探索,在国内做AI助手,在海外做AI的游戏、AI社交、AI视频以及AI音乐等方向。
公司从2022年12月开始做开源,2023年正式发布了天工1.0大模型,今年4月份发布了天工3.0,音乐大模型技术指标也处于全球领先位置。
11月20日,公司发布了端到端的语音模型「天工大模型4.0」4o版(Skywork 4o),以及新产品「实时语音对话助手Skyo」,为什么我们会做这样的模型呢?还是从应用层倒逼的,因为所有的用户都需要延迟更低的语音进行输入和输出,这个对于C端的意义其实是非常重要的。
11月27日,也推出了慢推理「天工大模型4.0」o1版(Skywork o1),各种评测指标上有很好的表现。公司的应用矩阵大家也可以知道,在国内昆仑万维做AI搜索,海外做AI音乐、AI短剧、AI社交等方面的探索。其中AI音乐又分成了B端AI 音乐商用创作平台 Mureka,C端的全球首个AI流媒体音乐平台Melodio。在AI短剧方面,公司做了一个产品AI短剧平台SkyReels。
11月出,在AI搜索侧做了重大升级,我们也在探索AI搜索泛领域里面一些比较独特的突破点,比如天工彩页,目前来说应该是用AI来创作PPT里面最方便的产品之一。同时天工AI也在金融投资、科研学术的AI搜索方面做了升级。
SkyReels,是首个集成视频大模型与3D大模型的AI短剧平台。其实在今年上半年Sora出现的时候,我说今年中国一定会出现跟Sora等级的视频生成模型,到今天这一点其实也得到了验证。
当前除了美国以外,基本上中国公司也出来了很多家,大家也知道Sora经过这么长的时间,才正式对C端开始发布。但是我看到了一些早期的评测,说它跟现在就市面上已经跑出来的这种视频模型,还是没有代差。
这个后面也会跟大家分析,整体来看在视频生成模型上,技术的红利期已经变短了。有一个讨论是,Sora更像ChatGPT在文本大模型上面吃到很长的红利期,还是更像早期DALL·E 3这样一个图像生成模型,根本没有吃到图像生成的红利。
我个人倾向于应该是介乎两者之间,更倾向于它是吃不到一个完全体的红利。我们为什么要做一个视频生成跟3D大模型的结合呢?实际上我们自己感觉到在视频生成模型里面有一个巨大的痛点,这个叫可控性。
最近可以看到中国著名导演,用AI来生成了自己的短片。我们知道短片的每一个镜头都是经过大量抽卡来实现的,而且现在视频生成的价格也非常贵,大家其实都是在拼命的去找这个点数,找这个额度来生成自己的视频。
我们一直认为要让C端或者让创作者能够更便宜的使用视频生成来创作自己的剧集,可控性是一定要解决的。可控性我们认为用3D模型跟视频大模型结合来做可控的事情,这个事情对于C端用户是非常有价值的。
所以,公司做了自研剧本大模型SkyScript、自研分镜大模型StoryboardGen、自研3D生成大模型Sky3DGen,以及业界首个将AI 3D引擎与视频大模型深度融合的创新平台WorldEngine。我们提出来的SkyReels短剧平台,本质上是一个面向短剧创作者的解决方案。能够让短剧创作者可以一次成片,而不用陷入长期多次抽卡的局面。
此外,昆仑万维发布了全球首个AI流媒体音乐平台Melodio,以及 AI 音乐商用创作平台 Mureka。公司做音乐模型的理由比较简单,因为在海外有一个全球最大的K歌平台,公司其实在音乐数据的积累上有非常深厚的积累。大家可能知道人类到现在为止总共只创作了4000万首音乐,我们的训练集已经用了将近2000万首数据集来做这个事情。
我们在这方面也在不断去迭代,现在全球能够跟我们在一个水平线上的,应该目前只有Suno。
Linky是公司发布的AI社交产品,日活跃用户已经突破50万。大家知道AI社交产品第一个创新的是Character.AI,为什么这个产品的创始人回谷歌去了,但我们仍然非常看好这个赛道,逻辑非常简单,人类的情感供给一直解决不了成本的问题。
在社交平台上,绝大多数普通人在社交平台上想获得情感供给是非常困难的,但是在AI出现之后,AI可以用极低的成本给所有用户提供这个情感供给。我们认为这是这条赛道一个长期的商业模式。
中国企业蓝海策略:发挥C端盈利优势,关注产品或商业模式创新
下面和大家分享一下,对于将来怎么走、怎么想的,以及过去的一些经验和教训。
第一个,由于风险投资的差异,导致中美AI创业环境其实是很不一样的,大家可以知道,中国AI创业企业,不管是在数量上还是得到的投资上,以及投资金额,与美国企业的处境差距都非常大。
这个也是一个现实,这会导致什么呢?导致中美在AI创业上方向上有蛮大的变化。在美国的AI同行,他们其实都还忙着去做大模型,去上规模;中国同行已经要面对一个很残酷的事实,得让我们的企业尽快盈利。
这一点从长期来看,有比较深刻的影响,国外AI创业公司的分布,基本上还有很多在做底座大模型。在做落地上面,他们对于医疗健康、法律、金融服务这些最赚钱的行业仍然是最关注的。
但是对于中国企业来说,其实中国企业大家会看到做娱乐、做媒体的蛮多的,这一点其实反而欧美企业没有中国人多。那么为什么会这样呢?在C端赚钱这个事情上,中国人是有非常强的天赋。
举个例子,原来我们做游戏领域,大家都知道游戏领域一直是欧美非常强的,他们的4A游戏做了这么多年,中国直到今年才出现了第一款4A游戏是黑神话。但是中国厂商发明了免费道具游戏Free to play,中国企业通过这个模式已经在全世界走出了一个完全不同的路,可以说是大杀四方,导致欧美同行也得转向这个模式,而且它预付费可以说相提并论,甚至市场规模更大。最直接的例子是中国的游戏巨头腾讯控股了世界上很多家做游戏的公司。
我们还会观察到一个现象,到底Scaling Law放缓没放缓呢?从目前的情况来看,训练的Scaling Law其实还是有所放缓的。
但是基于慢思考的、推理的Scaling Law又开始涌现,我觉得这些都是非常正常的一个事情,举个例子,现在的情况非常像70年代,个人PC的芯片刚刚兴起的时候,各种摩尔定律其实都在剧烈的变化过程中。但是有一点是确凿的,百万Token的成本一定是以每年几倍的速度在往下降。
最近清华的刘知远老师,他做了一个统计,最近两年的GPT-3.5的API成本大概下降了266倍,就是说所有的推理成本其实是在不断急剧下降的,成本每下降一个量级,它的商业模式能够服务的人群也会上升一个量级。
随着Scaling Law以及推理成本的极大下降,模型能做的事越来越多,能够服务的人群也越来越广,我觉得这一点对于所有创业企业,其实是一个非常好的一个机会。
第二,SOTA的红利的短暂与持续。在OpenAI出来的时候,它的文本大模型碾压全世界的其他所有人,所以吃了很大的红利,但是后来DALL·E 3,就没有吃到这个红利。包括现在的Sora,我认为他也不一定能吃到最大的红利。
为什么?因为技术的扩展已经散不开了,我不认为任何一个技术的扩散是可以通过禁运,可以通过你的保守来保持的。
举个最简单的例子,我个人从1994年开始做互联网,1995年有人就靠写网页,那时候给一个企业做一个网站,就能买一辆奥迪。在今天在北京,你会做网页,你做一个企业的网站,可能给你500块钱。这就是说任何一个技术都会迅速的泛化,迅速的“白菜化”。所以说我认为SOTA红利会越来越短暂,百花齐放才是下个时代的主旋律。
中国AI企业能够拿到的投资其实比美国同行要少的多。此外,除了中美两国以外,其他国家的企业能够拿到的投资更少,创业的数量会更少。但是对于中国企业来说,我们的钱很少怎么办呢?那么我们就要以软博硬。
大家都知道,所有做推理优化以及做商业模式创新的企业,其实中国企业应该是数量最多的。
2023年、2024年以及今年上半年,所有AI企业去挖的人全部是做算法的工程师,做算法的研究人员,他们能够拿到薪资一定是最高的,几百万上千万都是有可能的。
但是现在所有的AI企业都开始去找比较好的产品人员,算法人员的供给已经迅速提上来。但是AI产品该怎么做?现在所有人都没有一个概念或者说没有一个定论,其实是说AI产品在产品模式和商业模式上的创新,是远远落后于在技术上的创新。
但是,真正对于C端用户来说,产品跟商业模式上的创新才更重要。所以说,大家去观察中国AI企业的产品创新或者商业模式的创新,看他什么时候能开始大规模爆发,就要看AI企业的产品人员和技术人员的薪资比,逐渐回归到目前传统互联网企业的比例上的时候,AI企业的产品创新跟商业模式创新就会大规模做起来。
中国企业得到的投资相对比较少,也倒逼中国企业在产品优化上、在模式创新上会涌现出更多的结果。
中国企业蓝海策略:利用文化平权机遇,追求“新”,保证“好”
昆仑万维做海外比较多,做AI产品的尝试比较多。我们会发现AI带来一个很重要的因素就是文化平权。
什么叫文化平权?举个例子,大家都知道好莱坞的电影在全世界是一个非常强势的文化。但本质上好莱坞电影这个强势的来源是它的资金投入,美国一部大片可能一亿美金的投入,什么时候开始中国自己的大片,开始逐渐的打败好莱坞大片呢?
其实是在中国经济发展之后,我们单部电影的投入达到上千万、上亿之后,我们才能制作出跟美国商业大片同级别的影片,代表就是流浪地球。但是全世界能够像中国这样把电影行业跟好莱坞去抗衡的,其实国家并不多。全世界能够抵抗好莱坞的,可能只有中国、印度这样的国家。
其他很多国家是完全没有这个能力的,为什么呢?还是资金投入的问题。我在尼日利亚的时候,他们当地人拍一部片子,平均的制作成本是十万美金,这样十万美金拍出来的片子,不可能跟一亿美金的好莱坞大片去对抗的。
而AIGC能力的出现,包括我们现在做的视频生成能力的出现,一定会将一部好莱坞大片质量的电影制作成本,从现在的一亿美金,很迅速的下降到几十万美金甚至几千美金,几年之后几百美金都是有可能的。这样的结果是什么呢?所有语言的人都会用AI来创作属于本民族的内容产品。
这样的结果将会实现文化的平权,而这个红利,很有可能是中国企业去吃到。而且可以看到,在给全世界人民去铺电信网络的,主要是中国企业。相信在AIGC领域,给全世界各个国家去搭基础平台的一定是中国的初创企业出海。
再跟大家分享一下我们做产品的经验。公司做C端产品,跟用户交流的比较多,当前大家都在谈各种AI模型的技术指标,大多是从技术人员的角度来讲的。对于用户来说,他其实对于你给他的内容产品,他根本不关心你是用什么东西做出来的,他只关心两件事情。只有这两件事情你做到了一件,C端用户才会去采用,那就是新或者是好。
首先说“好”,好比较简单,在传统的电影赛道、游戏赛道,把质量做到极致,用户就会买单。典型的代表就是在游戏行业,就是原神和黑神话,它是全世界品质最高的MMO和动作类游戏,用户就会买单。在电影领域就是像流浪地球、美国的漫威系列电影,它的质量绝对好,用户一定是会买单的。
但是对于很多企业来说,你要做到“好”,意味着巨大的风险和巨大的资金投入。对于初创型企业来说,要在新上下功夫。产品、内容形式是之前没有见过的,娱乐形式、商业模式是之前没有见过的,用户也可能会买单。
还是以游戏举例说明,像原神和黑神话,它的研发投入成本都在几亿人民币以上。与此同时,在重庆有一对夫妇开了一个五个人的工作室,总共研发成本可能不到100万,他们做了一个创新型的产品游戏叫戴森球,目前它的销售额已经超过了八个亿,本质上这就是新。
对于我们中国的AI初创企业来说,“新”和“好”上面其实大家还是要在新上下功夫,我们怎么样用AI创造出用AIGC的能力,给最终用户创造出他没有见过的内容形式、娱乐形式、社交形式。
通过模式上的创新,一定能够让大量的用户去买单,这里面我们其实已经看到了一些方向。比如说像短剧、AI聊天,但是我们还没有看到,能够让所有用户都很惊叹,很愿意去使用的AI的产品形式,但我认为在2025年以及2026年,这种产品是一定会大规模出现。
从上一波或者上上一波的互联网和移动互联网战争的结局来看,最后规模最大,盈利最多,产品的赛道一定是C端。因为只要能击穿一部分人,就能击穿至市场全世界几十亿人口,C端用户的规模一定是最大的。所以如果想成为下一代的互联网AI巨头,一定是在C端产品上做出各自的创新。
模型落地:以工具型产品为切入点,重视用户自我表达诉求
对于所有的企业来说,现在大家也说过当前AI企业算法人员是最贵的,算法人员也是最宝贵的,我们的模型怎么去落地呢?所有人都是从做工具开始。
在图形算法刚刚出现的时候,企业有做各种编辑工具的产品。其中一个产品,它也是做工具的,让大家可以把视频转成动画的gif,这个产品最后从工具转成了平台,它就是快手。
对中国所有的AI创业企业来说,现在想活下去,一定是做工具,让用户通过工具来付费,这既是所谓“工具为先”,工具是现在最容易赚钱的产品。
不管是卖API,还是让C端用户付运费,还是让C端用户去买点数。长期来看,一定是通过产品模式上的创新,才能够真正把企业带到下一个台阶。只做工具的企业,我们认为是没有长期前途的,但一定是有短期利益的,只有你在模式上的创新,才能够在长期的竞争中间制胜。
“实现通用人工智能,让每个人更好地塑造和表达自我”是公司的使命,但对于AI企业,其实也是要在这两点中间去取舍。首先是实现通用人工智能做基础大模型、做B端应用,让整个人类的生产力再上一个新台阶。第二点,让每个人更好地塑造和表达自我,其实本质上就是用AIGC为所有的人类创造更多的娱乐内容,让所有人可以产生更多的多巴胺,产生更多的肾上腺素,这个其实也是非常重要的,也是很多AI企业可以选择的一个方向。
今天跟大家的分享就到这里,谢谢大家。