阿里国际用AI重写了1亿款商品的标题和详情页。
作者|王艺
编辑|栗子
2023年是跨境电商在海外狂飙突进的一年。中国电商“出海四小龙”(SHEIN、速卖通AliExpress、Temu和TikTok Shop)开启快马加鞭的扩张时代,在全球市场和海外对手展开激烈竞争。
在各大电商平台纷纷推出的“全托管(商家只负责供货,跨境电商平台提供运营、物流、售后等服务)”和“半托管”(平台负责卖货,但商家自己承担国际干线物流、到达目的地国后的配送费用)模式下,商家的销量实现了大幅增长。
但除了依靠中国制造的强大供应链和极致性价比之外,还能如何实现长期可持续的增长,在全球与亚马逊等海外巨头竞争呢?
点“科技树”或许是唯一的解法。
生成式AI时代到来之后,从ChatGPT到Sora,AI工具的快速迭代,也给跨境电商行业带来了更多可能性:不仅80%以上的独立站卖家正在探索和利用AI技术来降本增效、提升用户体验,而且各大跨境电商平台从2023年下半年开始也在相继布局AI。
比如亚马逊云科技去年推出了名为Amazon Bedrock的人工智能服务,允许客户通过Anthropic、Stability AI和亚马逊的现有模型构建GenAI应用程序;Shein将AI用于预测潮流趋势和电商图片生成;Shopee、Lazada、TikTokShop、Shopify等也在相继布局AI电商。
更能证明AI在电商领域商业价值的案例是阿里国际数字商业集团(下文简称“阿里国际”)。
在阿里巴巴2024年一季度的财报中,阿里国际零售业务营收222.78亿元。同比增长56%,是本季度增长幅度最大的业务。
阿里国际这匹“黑马”并不是最近才冒头的。
在2022年前三季度,阿里国际零售业务增长还处于个位数,一度甚至因为疫情小幅下滑震荡。自2023年第二季度(自然年自然季)以来,国际零售就开始狂飙——不仅保持两位数同比高增长,且增速越发陡峭;2023全年四个季度,同比增速分别为41%、60%、73%、 56%,成为阿里近三年增速最猛的业务。
阿里国际高速增长的业绩背后,还有一个秘密推手就是AI。
1.电商出海,AI“造船”
2023年4月,阿里国际在内部成立了“AI Business”团队,试图用AI能力赋能跨境电商。
之所以尝试用AI解决跨境电商的问题,与阿里国际本身所处的环境有关。
在国内内卷越发严重的情况下,中国的互联网公司纷纷出海。阿里作为最早开展跨境电商业务的中国公司,尽管具备先发优势,但是也不得不提防四周环伺的强敌,在商品品类供给、物流配送时效、售后服务保障等环节都不能松懈。
同时,跨境电商业务的特点,也决定了这是一个非常适合用AI来进行升级改造的领域:
以上种种,都是做跨境电商的商家,尤其是中小商家们出海路上的“九九八十一难”。
而近年来兴起的AI大模型,恰恰为上述难题提供了绝佳的解决方案。
以市场营销环节为例,AI可以自动根据用户和商品的特征生成多条种草内容,同时也可以快速、批量地生成大量广告素材,并生成海量的SEO文本详描、卖点等,辅助流量的提升;
在导购体验环节,AI不仅可以生成真人模特上身图取代服饰平铺图,更是可以改写主图的“牛皮癣多、清晰度不足、展示不清”等问题,强化主图的美观度和清晰度;
此外,针对大部分商家和用户头疼的翻译问题,多语言的AI模型可以提供精准的小语种翻译及纠错服务,让语言不再是门槛;而在售后环节,AI也可以识别商品的货损程度、划痕程度等,帮助用户挽回损失。
此前,坊间一直流传着“AI无用论”,主要是诟病AI大模型商业化困难。红杉资本也在年初的AI Ascent表示,2023年美国科技界在训练AI用的GPU上花了500亿美元,但是生成式AI的年收入只有30亿美元,投入产出比为17:1。
但是AI大模型不赚钱的主要原因不在于技术,而在于找不到合适的应用场景。
百度创始人李彦宏就曾公开表示:“模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说,卷大模型没有意义,卷应用机会更大。”基于应用场景反推所需的AI能力,再从数据、算法、算力等多方面夯实基础,似乎成为互联网企业的共识。
当苦苦寻找应用场景的AI,遇上了急需提质增效的跨境电商,供给与需求实现了高度匹配,二者迅速一拍即合。阿里国际AI Business也因此应运而生。
2.阿里国际AI加速
目前,阿里AI Business团队拥有超过100人的团队规模,其中算法研发工程师在1/3左右,其他人员负责模型推理应用、基建以及具体产品的开发运营。
AI Business的算法团队主攻三个方向:多语言的电商大模型训练;对话模型和下游任务;图像生成和理解能力,分别针对跨境电商的商品信息本地化、客服机器人和客服翻译、内容种草和广告投放等不同场景的需求制定的。
依托AI Business团队强大的技术能力,过去一年,阿里国际在跨境电商的应用端不断进行尝试和探索,在广告投放、AI图像生成、导购体验、退款Agent等40多个场景中用AI进行了优化:
比如广告投放场景,针对人工生产营销素材制作周期长、产量有瓶颈的痛点,阿里国际通过多模态识别+多语言文本生成+AI图片处理+投放效果强化学习等AI能力,沉淀了自动化选品+卖点提炼+图片生成的AI全链路广告创意素材生成解决方案,不仅可以针对一个商品智能批量地生成营销广告素材,更是可以学习优秀的投放案例,生成营销图模板,还可以根据训练数据生成打分模型、挑选最佳的营销素材。加入AI能力后,商家的广告制作成本下降了5%,广告投放ROI提升了5%。
AI自动生成营销素材,提升广告效果,降低投放成本,图源:阿里国际
比如AI图像生成场景,针对电商图制作成本高、设计工作流耗时长、缺乏国际化设计及小语种人才的痛点,阿里国际提供了白底图、营销图、详情页翻译、模特图、模特试穿、视频翻译、数字人等工具,覆盖了商家从商品上架到站外投放营销物料生成全场景,帮助商家解决电商类图像和视频“从无到有”的问题。
AI 为服饰品类提供虚拟模特上身效果图,图源:阿里国际
以速卖通卖家Zeuslap为例,这是一个专门销售显示器的电商品牌。从2023年11月起他们就开始使用阿里国际的AI图像生成功能,用于店铺装修的banner、商品场景图、商品详情图、 各大社交媒体的封面图等。
Zeuslap商品页面 图源:AliExpress
AI图像生成帮助Zeuslap的主理人Mary夫妇极大节省了时间成本,以前需要花很多时间在找素材和设计上,现在只需选择模板、上传商品就可以完成,而且效果更佳。AI能力也大大加速了Zeuslap的业绩增长,使其很快就从一个从夫妻老婆店成长为平台行业第一的品牌。
再比如退款场景,针对商品从海外运回国成本高、退回失败会造成很大货损的问题,阿里国际运用多模态大模型技术进行纠纷理由识别及凭证校验,理解各种数据后计算出部分退款的金额,为消费者提供“不退货、部分退款”的方案,最大化顾客满意度、最小化商家成本。
具体来说,模型可以通过训练,学习和理解用户纠纷理由、用户留言、退款凭证(货值损坏程度)、交易快照、物流路线等数据,并通过学习历史人工判责Case处理方式,进而做出“是否要退货”、“如果不退货,那退款多少”的判断。
AI退款Agent工作流程 图源:阿里国际
最后以拒付(Chargeback)场景为例,这是做跨境的商家都怕遇到的售后纠纷——货物发出去了,消费者拒绝付款。以往,要进行拒付抗辩,商家需要花数小时来准备每个环节的资料、证据。不少中小企业因为缺乏相关经验,面对拒付纠纷只能“自认倒霉”。现在,阿里国际的AI拒付抗辩Agent,能够在几分钟内整理好所有资料,自动生成抗辩信,发送给海外信用卡机构。
AI拒付抗辩Agent帮助商家减少金融合规损失 图源:阿里国际
测试数据显示,AI拒付抗辩Agent一年可以帮阿里国际旗下各平台的中国跨境商家挽回2000万人民币的损失,保护商家权益。
可以说,跨境电商场景的探索,让阿里国际的AI技术,从国内14亿人口的市场,一下子扩展到全球80亿人口的市场,也为跨境卖家提供了更加便捷、高效、低成本的运营体验,极大赋能了万千跨境商家的生意增长。
7月16日,在阿里国际的一场AI主题的分享会上,阿里国际数字商业集团副总裁、AI业务负责人张凯夫透露,阿里国际已经在40多个场景里测试了AI能力,赋能了50万中小商家,1亿款产品得到了优化;近半年的时间里,平均每两个月,商家对于AI的调用量就翻1倍。“越是中小商家,越能从AI的应用中获益”,张凯夫说。
3.海量调用背后的秘密
如此庞大的调用量是怎么实现的?
秘诀就在于阿里国际AI能力的可控和可用。
在相当长的一段时间里,大模型的可控性和可用性差,是导致其无法快速进行应用落地的原因。以文生图功能常用的Stable Diffusion为例,经常出现手指、头发等细节的失真问题,导致生成的模特或商品图无法直接使用。
此外,由于缺乏特定的行业和场景数据,加之有些大模型泛化能力不足,导致了电商场景下大模型的可用性差,比如翻译的不够精准,或者难以做到广告投放的“千人千面”。
在沟通会上,张凯夫表示,AI Business并不是一个训练基础模型的团队,而是从业务视角出发做灵活的选择——如果市面上有足够好的开源模型,经过SFT、RAG等调优后发现效果能够满足业务预期,那么就可以使用现成的开源模型;如果有些场景需求满足不了、比如遇到上述问题,那么就使用自研模型,或者采用自有技术做进一步的训练和调优。
具体怎么做自研、怎么调优呢?阿里国际将重点放在了三件事上:
这个统一的大模型,就是阿里国际最新推出的多语言增强大模型MarcoPolo。它基于海量高质量多语言数据训练(其中小语种2.5T tokens),提供8B/57B/72B等不同规格参数量模型,支持128K长上下文,用更低的成本实现了更优的效果。
MarcoPolo-VL的底层技术,是阿里国际自研的的多模态大模型架构Ovis。不同于其他MLLM(多模态大模型)通常由视觉编码器经MLP连接器投影后以非结构化方式直接生成内容,Ovis借鉴了LLM(大语言模型)中的文本嵌入策略,引入了可学习的视觉嵌入表,将连续的视觉特征先转换为概率化的视觉token,再经由视觉嵌入表多次索引加权得到结构化的视觉嵌入。
Ovis由三个关键组件构成:视觉tokenizer、视觉嵌入表和LLM。图源:https://arxiv.org/pdf/2405.20797
这种新型的模型架构规避了基于MLP连接器的MLLM常见的信息丢失、信息错误、过拟合风险等局限性,能够更好地进行多模态内容的识别和生成。评测结果表明,在相同参数量级下,Ovis在多项基准测试中均优于主流开源MLLM,并且Ovis-14B的性能整体上超越了闭源模型Qwen-VL-Plus;Ovis-7B在视觉感知、推理和编程、数学和科学、生活场景等多种多模态任务上也均有优秀的表现,该模型也已在Huggingface、Github等社区全面开源。
图源:https://arxiv.org/pdf/2405.20797
在自研模型之外,阿里国际还会通过一系列的技术手段不断改进多模态内容的生成效果。以目前文生图最大的痛点“可控性差”为例,为了解决这个问题,AI Business的算法团队会分两步走,第一步是不断通过训练、RAG等提升模型能力,第二步则是通过多轮交互逐步改进出图效果。
之所以要进行“多轮交互”,主要是由于用户与AI产品的交互大多是通过自然语言进行的,自然语言的表达不够精确,需要算法团队在后台通过并行化拆分(Pipeline Parallelism)的方式逐步调优。比如用户告诉AI“把台灯放在图片的左边”,这本是一个模糊的概念,但是通过将图片切片、变成九宫格的形式,将台灯先放在桌子的左下角,然后再通过多轮的交互对话逐步调整,更有可能生成用户满意的图片。
在这些技术优化的基础上,阿里国际研发的视觉和多模态模型实现了更稳定、可控的出图品质和更高效的出图速度,8秒就可生成一张图片,还可以自动美化背景、一键虚拟试衣,极大降低了商家的图片制作成本,提升了商品图的点击率。
图源:阿里国际
经过一年多的努力和尝试,Spark的能力已经应用在了40多个应用场景中,赋能了50万中小商家,有超1亿件的商品信息得到了优化。
同时,也正是得益于该平台,阿里国际AI的使用量开始大幅上升。近半年的数据显示,平均每两个月,商家对于AI的调用量和推理量就翻1倍,同时每4-5个月推理成本还可以降低50%,为中小商家们带来了1%-30%的点击率、转化率和消费者满意度提升。
阿里国际AI一年来成果,图源:阿里国际
4.跨境电商“All in AI”
正如前文所提到的,2023年是“AI电商”的元年。除了阿里,Shein、TikTok Shop以及亚马逊、Shopify等跨境电商平台也在加码和布局AI:
亚马逊除了推出可让用户构建应用程序的全托管生成式AI服务Amazon Bedrock外,还推出了生成式AI助手Amazon Q,可以帮助客户做软件开发和数据分析;同时,亚马逊的AI Listing功能让卖家能够撰写更高质量的文案,其最新的电商AI搜索工具Rufus也能够为买家提供购买建议、产品比较、商品推荐等内容,将原来AI对电商的赋能从“转化率端”转向了“流量端”;此外,2023年以来,亚马逊还围绕AI-generated review highlights(AI评论整合)、Fit Review Highlights feature(AI服装合身功能)generative AI to make product listings even more informative for customers (AI链接编写)这三类功能推出了一系列AI产品,帮助商家在经营上提质增效。
Rufus产品图,图源:网络
Shein从其主打“小单快返”柔性供应链的第一天开始,就已经将AI和大数据融入了企业的基因;生成式AI时代到来之后,Shein更是在图片生成、图片优化、虚拟试衣、客服机器人等领域都用上了AI功能。
社交媒体新星TikTok则在广告领域发力,推出了名为“Symphony AI ”的配音工具,可以将内容无缝翻译成十多种语言和方言,创作者和商家可以跨越文化和语言的界限,与全球观众和消费者进行有效沟通;他们还在测试一项名为”Symphony Digital Avatars“的全新功能,该功能允许品牌商在广告过程中使用AI生成数字分身,以增加广告的“人情味”,提升品牌营销效果和购买转化率。
AI生成广告示意图,图源:Ad Age
独立站电商平台Shopify更是靠着AI战略实现了逆风翻盘:他们不仅用AI重构了网站90%的购物体验,更是推出了AI商家助手SideKick,可以回答业务的核心问题、调整网站销售策略并执行,还能根据卖家的促销活动需求,对网站进行快速的装修升级。推出AI功能后,Shopify在2023年第三季度的总收入达到17.1亿美元,净利润成功扭亏为盈。
在各个布局AI的跨境电商平台中,阿里国际有着其独特的优势:
首先是电商经验优势。
阿里国际是中国最早出海的跨境电商企业之一,加之背靠阿里这一庞大的电商生态帝国,阿里国际拥有十多年电商经验积累和超3亿海外消费者,这为其积累了丰富的跨境电商场景和用户行为洞察,为大模型训练提供了最天然、最好用的素材;
其次是行业know how。
电商很大程度上是一个经验驱动的行业,从阿里巴巴1999年就开始做跨境业务,到如今已经有25年的历史;而阿里国际旗下也囊括了AliExpress、天猫淘宝海外、Lazada、trendyol、Daraz、Miravia等多个平台,拥有非常丰富的电商人才储备和业务经验。这些都为其积累了大量行业know how,让其在搭建面向AI的业务场景时更顺畅、阻力更小;
最后是完善的AI基础设施。
跨境电商业务流程多、场景复杂多样,需要大量的Agent来辅助,才能实现自动化的工作流进而降本增效。阿里国际一直秉持“应用为先”的发展战略,很早就把AI和数字化的能力松耦合地集成到了现有的业务场景和产品体系里,保留了大量的API接口,这让其在大模型时代到来之后能够迅速跟上步伐、将大模型的能力集成到各个业务中。
在阿里国际看来,相比于国内电商,AI大模型对于跨境电商的助力更大,效果也更明显。
阿里国际AI业务算法负责人骆卫华表示,以商品推荐的“千人千面”为例,传统算法需要对用户信息有更多的认知和了解之后,才能完成这一任务。如今的情况是,国内淘系的用户和订单数据相对来说更加丰富,而海外的用户数据则比较稀疏。“想要在稀疏的数据上做出更好的效果,这有些时候会是一个挑战”。
而有了AI大模型的加持之后,则可以极大缓解因为用户数据不足导致的推荐不精确问题,极大提升推荐效果和用户满意度。
张凯夫也表示,一直以来互联网平台的核心任务都是“搜推广(搜索、推荐、广告)”,在大模型出来之后,很多人都在关心“大模型如何改造搜推广”,但是这在国内进度非常缓慢,原因就在于国内的搜推广已经做的很好了——依托海量的用户数据和优质算法,抖音的内容推荐已经做到了世界领先,淘宝的电商搜索也是全球做得最好的。在原有技术已经足够领先的情况下,大模型很难再从底层架构上完全颠覆掉原有的搜推广模式,只能是锦上添花;
而反观跨境电商,由于用户数据比较稀疏,搜推广做得还不算完善和成熟,因此将有限的、稀疏的数据接入大模型之后,搜推广的效果往往表现地更加突出,用户体验更好,转化率提高得也更明显。
在阿里国际看来,AI与跨境电商的结合只是迈出了第一步——在用AI将电商的“降本增效”做到极致后,阿里国际可能还会探索更多跨境电商和AI相结合的场景,比如往前切产品,在货架电商像直播电商、内容电商演进的大趋势下探索更多样的AI电商产品形态;往后切供应链,颠覆传统的“内贸转外贸”模式,用中国的数字基础设施做物流、供应链等“电商基建”的全球化升级。“我们认为现在只是起步阶段,其实未来的业务增量空间里,AI能产生更多有创新性的东西”,阿里国际技术平台负责人徐昭说。
下一步,阿里国际还计划将自己的AI能力开放给阿里生态之外的商家,用AI赋能更广阔的跨境电商市场。
无论是降本增效,还是提振业绩,我们都看到了AI给跨境电商带来的种种新的可能。而未来AI和大模型将如何与跨境电商更紧密的结合,阿里国际又将如何升级自己的AI产品和能力,我们也拭目以待。
(封面图来源:阿里)