搜索
探秘“京西智谷”:为什么这里能助力大模型赋能千行百业?
作者:刘杨楠 2024-04-28

“京西智谷”春天的故事。


作者|刘杨楠

编辑|王博


1992年1月17日,在北京站最东侧的站台,一位老人登上了南下的专列。之后一段时间,他发表了一系列谈话,开启了中国改革开放的新篇章,当时媒体的评价为——“东方风来满眼春”。


春天的故事不只这些,就在这位老人出发的前一天,北京西边的永定镇也紧锣密鼓部署起来——石龙工业区成立了。石龙工业区当时是享有经济开发政策的新兴经济技术开发区,也是京西最有代表性的工业区之一。


二十年后,石龙工业区被纳入中关村国家自主创新示范区,成为中关村门头沟园的一部分。石龙工业区也顺势开启了“二次创业”战略——从传统工业向高科技产业转型。


2019年,门头沟千年采煤史画上句号。而在同年获批的门头沟区分区规划(2017年—2035年)中,新城南部片区被定义为“创新发展轴”,位于这里的中关村门头沟园,其主导产业中出现了人工智能。随后,人工智能成为了门头沟区三大产业之首。


去年,中关村门头沟园又一次迎来发展“跃迁”。


2023年2月,伴随首届北京人工智能产业创新发展大会的举办,门头沟区政府、中关村发展集团、华为公司联合建设的“京西智谷”人工智能计算中心(以下简称“智算中心”)在中关村门头沟园正式上线,智算中心首期算力规模100P,“京西智谷”成为了门头沟区的新名片。

“京西智谷”展示中心,图片来源:「甲子光年」拍摄

春天的故事还在继续。


一年后,今年2月29日,在第二届北京人工智能产业创新发展大会上,“京西智谷”联合智谱AI、百川智能、中国科学院自动化研究所等24家在京企事业单位发起“大模型应用产业联合体”;北京市首个自主创新人工智能算力集群完成签约并落地“京西智谷”;“京西智谷”还与央视网成立了“AGI(通用人工智能)联合研究中心”。


4月13日,随着“京西智谷”·北京联通自主创新人工智能算力中心的点亮,“京西智谷”算力总量达到500P,可服务200多家中小企业和单位,而这些都是基于国产自主芯片的全栈自主算力。


「甲子光年」注意到,为中小企业提供普惠的算力服务,在北京市范围内,门头沟区是第一个破题的。如今,这种勇于破题的精神转化成了打造生态的决心。


目前,“京西智谷”智算中心已经连接了600多家人工智能企业和单位,涵盖智慧医疗、智慧城市、智能制造、智慧园区、智慧金融等多个领域。


门头沟区正在绘制一张人工智能生态蓝图,而这张蓝图上的亮点,正是这一家家与门头沟产生关联的企业。


1.人工智能企业,涌入门头沟


2024年春节前,丁立决定把公司从宁波搬到门头沟。


丁立是羽人科技创始人兼CEO。羽人科技成立于2019年,专注于用AI赋能传统行业的软件开发,其核心产品Flappy是一个专为真实生产环境设计的大模型应用开发框架,目标是弥合大型语言模型与开发者之间的鸿沟,让没有AI背景的传统软件开发者也能够开发行业AI应用。


在大模型技术生态中,开发框架是相对底层的环节,再往下一层就是算力基础设施,往上一层是模型。羽人科技既做模型,又做框架,对算力有很大需求。


羽人科技公司规模不大,而算力成本又是一笔巨大的开支,使用普惠的国产算力服务,几乎是羽人科技的唯一选项。


然而,国产算力有一个十分顽固的痛点——软硬件适配很不方便。一个直观的例子是,过去很长一段时间内,国产芯片跑不了Pytorch(一个基于Python的开源深度学习框架)相似的问题无形之中增加了国产算力服务的成本。


在丁立和团队一筹莫展之际,转机很快发生了。


2023年,丁立在一次行业活动上偶然认识了北京中发展智源人工智能科技发展有限公司(以下简称“中发展智源”)的工作人员。

中发展智源简介,图片来源:中发展智源

中发展智源是由中关村发展集团和智源研究院共同发起设立的人工智能专业集成服务商,也是“京西智谷”智算中心的运营方。


“京西智谷”智算中心依托与门头沟区探索的“政府引导+市场化运作”平台建设模式,即由区政府与中关村发展集团、华为公司三方合作——政府负责顶层设计、政策保障;中关村发展集团负责设施建设、配套服务、提供空间载体;华为公司负责技术支持、挖掘行业资源。各司其职,合作共赢。


通过中发展智源,羽人科技与北京昇腾人工智能生态创新中心开始合作。


在全国算力基础设施领域,昇腾是一个不可忽视的存在。此前,昇腾人工智能计算中心已经在深圳、武汉、西安、许昌、广州、青岛等城市落地。


近年来,华为在软硬件生态适配方面做了大量工作。2023年10月,PyTorch基金会官网宣布,华为加入PyTorch基金会,成为中国首个、全球第十个PyTorch最高级别Premier会员PyTorch社区最新发布的2.1版本,已同步支持昇腾NPU,并在华为的推动下,更新了更加完善的第三方设备接入机制。

昇腾AI全流程,图片来源:昇腾

羽人科技和昇腾的合作进展十分顺利。“2023年5月之后,我们所有项目基本都是拿昇腾910A、910B去跑,没遇到太大的问题,性价比也非常可观,成本几乎是英伟达的1/5。”丁立告诉「甲子光年」。


在和昇腾合作的过程中,羽人科技也和门头沟区各方打了不少交道。多次互动后,考虑到后续合作的沟通成本和算力维护的便利性,丁立和团队成员共同决定,直接把公司从宁波迁过来,落地门头沟。“真正来到门头沟后发现,这里离市区的距离比我们想象中近很多,周边设施也很齐全,生活成本相对较低,最后我们就下决心干脆把办公室也迁过来。”丁立说。


搬公司可不是一件容易的事。羽人科技只有十多个人,基本都是技术人员,对于公司迁址所涉及的一系列流程和事务并不在行。


园区的工作人员给我们迁址所需要做的准备拉出了一个详细清单,而不是直接给我们一个标准的SOP流程让我们自己弄,基本帮我们补齐了公司在行政方面的短板,”丁立感叹道,“作为园区运营方,中发展智源的工作效率远远超出我们的预期。”


除了空间上的服务,中发展智源还与企业形成合作伙伴,共同拓展人工智能市场。目前中发展智源正与羽人科技合作开发一款参数量在30B量级的的公文写作大模型,以企事业单位等为目标客户,提供一站式公文知识赋能和智慧应用写作平台。


他山科技总经理马扬当年也被园区的诚意所打动。


他山科技于2017年在门头沟区成立,是一家致力于人工智能触感芯片及应用解决方案的高科技公司,由共同工作了二十年的清华背景的跨国研发团队创建,属于“清华系”。他山科技在海淀区落地似乎是顺理成章,但结果并非如此。


马扬回忆,公司成立之初在找办公地点,“有一位创始人刚好住在京西”,门头沟区的招商人员多次给他山科技抛出橄榄枝。经过数次沟通,马扬和团队发现,门头沟区的地理位置和资金实力虽然和海淀及海淀周边区域存在差距,但政府投入人工智能的决心和诚意深深地打动了团队,最终决定落户门头沟。


“区里会尽可能帮我们争取一些市区两级的资源,即使在疫情期间资金紧张,园区还是给区内企业按时发放了针对专精特新企业的20万元补贴,确实让我们很受感触。”马扬告诉「甲子光年」。


相似的故事还发生在智子引擎身上。


相比前两家企业,智子引擎更接近大模型风暴中心。智子引擎的核心团队是中国人民大学高瓴人工智能学院教授卢志武带领的课题组。


卢志武是国内第一波入局大模型的学者,带队参与北京智源研究院“悟道”项目并设计了多模态大模型“文澜BriVL” (
Bridging-Vision-and-Language),迈出了国内在多模态大模型领域的第一步。


不过,在这轮关于大模型的商业竞争中,智子引擎并没有在“百模大战”中恋战太久,而是开辟了一条更务实的路——不烧钱,追求自我造血。


2023年下半年,智子引擎搭建了北京团队,开始选择办公地点。智子引擎训练大模型,需要有地方部署自己的算力集群。


然而,智子引擎多方调研后发现,有些地区算力资源紧张,很难顾及到中小型创业公司。最后,门头沟区提供的普惠的算力服务让他们决定在此落地。未来两年,智子引擎计划在门头沟部署一定的算力资源。


中科视语(北京)科技有限公司是中国科学院自动化研究所科技成果转化企业,2018年就在门头沟成立。可以说,中科视语一路见证了“京西智谷”从无到有的蜕变。“自建算力中心成本对我们来讲非常巨大,”中科视语联合创始人张腊说,“智算中心建成后,中科视语成为了第一批享受到红利的企业。”


目前,双方的合作模式也比较灵活。智算中心会根据中科视语的实际需求签订月租或年包服务,合作过程中,也会根据实际需求灵活调配算力。除提供算力外,智算中心也会提供昇腾配套的工具链,支持行业模型的训练部署和调试,降低了企业适配整体计算环境的时间成本。


目前,“京西智谷”智算中心已支持70多家企业孵化基础大模型、行业大模型和应用模型。今年3月,众智汇海、擎问科技入驻京西智谷,门头沟区的人工智能生态蓝图还在不断点亮。


2.国产智能算力迎来春天


在现代人工智能领域,算力扮演着推动创新、实现突破的核心驱动力。


根据北京市经济和信息化局2023年6月统计的数据,截至2022年底,北京市已建算力总规模约为12414P,其中通用算力8672P、智能算力3402P、超算算力340P;北京市实际使用算力总规模约为17053P,其中通用算力10552P、智能算力6416P、超算算力85P,算力使用规模是北京市建设规模的1.37倍,溢出算力需求主要通过在津冀、晋蒙区域部署的数据中心进行支撑。


随着人工智能的飞速发展,算力需求也在不断增加,其中智能算力的供给提升明显。甲子光年智库测算,截至2022年底,国内智能算力在总体算力中占比约22.8% ,智能算力已步入“20%+”的渗透率阶段。


这意味着什么?


在分析新兴产业周期时有一个概念——破壁渗透期,意思是在新事物取代旧事物的过程中,某个事物渗透率一旦超过20%,就会加速渗透,最终吞并市场。

AI渗透率:拐点已至,全民AI时代开启,图片来源:甲子光年智库

据新华社报道,今年北京计划新增公共智能算力8000P。


在英伟达多款高性能芯片被限制出口到中国的情况下,这些新增的智能算力中将有相当一部分来自国产算力。


但是在2023年,国产算力也曾一度“不好卖”。


“我们的国产算力上半年情况是不好卖,下半年情况是不好买,从买方市场转向了卖方市场。”回顾去年的情况,中发展智源人工智能公司董事长、总经理,中关村建投公司总经理周瑞说。


去年12月1日,在「致追风赶月的你」2023甲子引力年终盛典上,智谱AI COO张帆介绍,智谱AI很早就在关注国产算力,并在2022年8、9月份就利用国产芯片训了一个百亿的模型,这在当时“不能说唯一,但也是少有的”。


“起初,大家可能并没有下定决心,但在当前的形势下,没有坚定的决心是不行的。因此,这也加速了大家拥抱国产算力的进程。”张帆说。


智进网络是首批使用“京西智谷”人工智能计算中心算力资源的企业。智进网络CEO王少飞告诉「甲子光年」:“我们对接的用户主要是央企,他们有大量的私有化的数据,这些数据只能在内网,他们的需求更多的是企业级大模型私有化部署,并结合具体业务场景形成智能体。客户很难买到适用大模型训练和推理的英伟达GPU。所以在这方面我们和昇腾做了大量的技术工作。”


昇腾和PyTorch的适配,也坚定了智进网络继续使用国产算力的信心,“这很大程度降低了我们从英伟达卡迁移的成本,我希望昇腾,包括国产算力,能够加速生态的建设。”


北京昇腾人工智能生态创新中心CTO杨光介绍,“京西智谷”的算力平台已经适配了现在主流的大模型和小模型,“如果你要使用一种模型来孵化行业模型,只需带着数据,我们的全流程包括预训练、微调+推理部署都能够支持;如果你需要针对模型调优定制化的服务,我们正联合智谱AI,提供一系列针对模型本身的优化和调优能力。”


“我们在人工智能方面有两张牌,”中关村门头沟园党工委书记、管委会主任谭李丽表示,“第一张就是自主创新的技术体系;第二张就是大算力+大模型赋能千行百业,聚焦应用的创新创业生态。”


「甲子光年」从中关村门头沟园了解到,下一步门头沟区将继续聚力打造首都地区算力供给体系的规划“京西一极”,持续建设大规模人工智能算力基础设施,计划今年年中建设运营1000P,年底保障E级算力集群落地,力争建设北方智能算力枢纽中心。


门头沟的智能算力建设,从这个春天开始,进入了快车道。


3.“京西智谷”速度


今年春节假期后的第一个工作日,一场会议在门头沟区政府大楼召开,区领导以及各委办局、中关村门头沟园、中发展智源、华为等单位负责人参会,主题是——第二届北京人工智能产业创新发展大会的协调工作。


「甲子光年」在协调会现场注意到,作为大会发起方,门头沟区对这场大会非常重视。区领导会过问每一个细节,每一个被问到的负责人也都准备详细的方案,会后也形成了明确的待办事项,并定下截止日期,由相关负责人推进。


这种务实、高效的开会风格,已经超过了不少以效率著称的互联网大厂。


同样是在春节假期后第一个工作日,位于门头沟区的中关村(京西)人工智能科技园园区一期项目就开足了马力,全面复工。


园区相关负责人表示:“2023年底,我们实现了当年开工、当年结构封顶。今年一季度我们‘起跑即冲刺、开局即决战’,目标是到年底具备竣工验收条件,计划2025年上半年开园。”园区建成后,预计将引入人工智能企业200余家,实现产值超百亿元。

中关村(京西)人工智能科技园效果图,图片来源:中发展智源

根据北京市科委、中关村管委会信息科技发展中心今年2月发布的数据,北京人工智能相关企业数量约2200家,约占全国的39%,其中独角兽企业33家,占全国的50%。北京人工智能领域学者超过1.5万人,占全国4.9万人的30.6%,位居第一。


尽管这些企业和人才主要集中在海淀区,五道口也被认为是大模型领域“宇宙中心”,但是这并不意味着其他地区没有机会。


门头沟区委副书记、区长吕晨飞在第二届北京人工智能产业创新发展大会上表示,门头沟区是北京人工智能重点布局区之一,近年来,门头沟区立足地区实际,在全市人工智能产业发展大局中找准自身定位,与海淀等人工智能强区实现错位发展,瞄准“小切口”做好“大文章”。


如何理解瞄准“小切口”做好“大文章”?会上公布的门头沟区人工智能产业发展路径,就是答案。


一方面,探索建设安全自主的人工智能生态,即构建基于国产自主芯片的全栈自主算力,并融合国产自主软件,打造以国产自主大模型为基础的全要素国产自主创新产业生态。


另一方面,着力建设全国数字视听领域生成式人工智能高地,即借助央视和门头沟区的合作,重点聚焦数字视听领域,以AI+5G+4K/8K为方向,深入探索“大模型+垂类模型”应用,形成“大算力+大模型+大应用”模式,积极打造前沿技术先行先试的展示窗口。


在第二届北京人工智能产业创新发展大会上,“京西智谷”联合北京人工智能代表企事业单位发起了“大模型应用产业联合体”。“联合体”依托华为硬底座和软底座,立足北京,放眼全国,协同人工智能产业模型、应用、服务等各类伙伴,共同探索人工智能生态合作模式,建立人工智能产业标准,打造繁荣的人工智能产业生态,加速人工智能产业升级。


4月19日,在Llama 3发布后,猎豹移动董事长兼CEO、猎户星空董事长傅盛在其视频号上说:“AI不应该是大公司和巨头之间的游戏,而是应该所有人都能参与的,而且我们对AI真正的期待,是能够低成本解决问题。”


开放是普惠的基础。门头沟区正在试图建立一个更开放的商业生态,来最大程度填平中小企业追赶世界领先水平的鸿沟。

“大模型应用产业联合体”发起仪式,图片来源:大会主办方

“京西智谷”速度在这场大会之后并没有放缓。


3月7日和4月9日,门头沟区先后两次召开“京西智谷”高质量发展专题会。门头沟区委书记喻华锋,区委副书记、区长吕晨飞两次都出席会议。喻华锋要求,要争分夺秒加快推进算力中心建设,完善人工智能算力基础设施,形成“大算力+大模型+产学研创新孵化”的产业发展新模式。


在两次会议之间的3月27日和28日,喻华锋还先后赴浙江省杭州市阿里巴巴集团、安徽省合肥市中科大先进研究院、科大讯飞股份有限公司、国仪量子(合肥)技术有限公司就人工智能产业发展进行考察调研。


而这段时间,全球人工智能行业都在提速。国外的OpenAI、Google、Meta、Apple、xAI、Anthropic、Mistral、Inflection、Databricks等公司,以及国内的百度、MiniMax、昆仑万维等公司均有新动作。


不要忘了,英伟达在3月还发布了“地表最强”GPU Blackwell B200,以及GB200组合芯片,算力竞赛进入一个新阶段。


“追赶”是2023年中国人工智能产业的一大关键词,或许也会成为2024年的关键词。


这并非是国内位于金字塔尖的大厂和独角兽独有的课题,而是中国成千上万家人工智能企业共同需要完成的历史课题。


为加速人工智能产业发展,门头沟区实施了《门头沟区人工智能大模型产业创新发展三年行动计划(2024-2026年)》:力争到2026年,将门头沟区打造成为全国具有影响力的人工智能大模型自主创新产业集聚区。建成30万平方米高品质人工智能特色产业园,引进或培育5家通用人工智能大模型企业、50家人工智能行业大模型企业和300家人工智能应用型企业,建设50个行业标杆解决方案、50个重点应用场景示范项目,聚焦文生视频、数字人、智能制造等关键环节建设5个公共技术平台。


门头沟区,也将通过“京西智谷”为北京乃至全国的人工智能产业注入一股动力,与每一家来到门头沟的企业,一起奔赴AGI。


这或许很难,或许需要很长的时间。


但是,有着千年采煤史的门头沟最不缺的就是“奉献精神”和“长期主义”。


(封面图由「甲子光年」使用AI生成,描绘了AI“眼中”未来的门头沟)

点击进入「甲子光年」公众号阅读原文:https://mp.weixin.qq.com/s/UYtO2PVDKFS9tjI_c_7PAQ


  • 1487
  • 0
  • 0
  • 0
评论
登录甲子光年
其他登录方式
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
找回密码
获取验证码
注册甲子光年
获取验证码
注册即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
绑定手机号
获取验证码
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
完善资料
登录即表示你已阅读并同意
《甲子光年用户注册协议隐私政策
微信登录
扫描二维码 | 授权登录甲子光年