高盛发表报告,过去一周多间企业相继发布大模型,包括DeepSeek公布R1大模型、字节跳动的Doubao-1.5 Pro和Moonshot的Kimi的k1.5大模型,随着中国企业在AI方面的持续进步,在基准测试方面,引起了投资者的密切关注与全球同业相比,上述公司其表现优异,且训练/运算能力要求亦明显低於全球同行。
高盛表示,虽然该行不对各种模型性能进行评价,但亦注意到最近模型改进和成本效率的来源可能来自MoE(Mixture-of-Expert)架构,它对每个任务使用更少的激活参数、更加重视後期训练(包括深度思考模式、推理能力),而成本达最佳化,例如资源高效的训练方法,因为中国企业专注於在高端晶片供应约束/不确定性的情况下实现效率最大化;而模型的强化学习(RL)方面,其中模型可以随着时间的推移作出自我改进,此属通用人工智慧(AGI)。同时,该行注意到,包括DeepSeek R1/V3 和阿里巴巴(09988.HK) +1.100 (+1.261%) 沽空 $10.59亿; 比率 15.684% 的Qwen在内的中国开源模型自推出以来就吸引了开发者的广泛兴趣,因具透明度,而且每代币定价与全球模型相比明显较低。
该行相信,效能日益敏捷的中国大模型和计算成本效率的显着提高,料将为更广泛的采用、探索及扩散提供更大的空间。随着最新发展,该行料因入门槛降低,资本雄厚的网路巨头与新创公司之间可能存在竞争。
股份方面,就应用而言,该行继续认为腾讯(00700.HK) +7.600 (+1.921%) 沽空 $12.24亿; 比率 13.138% 最有能力推出To-C人工智慧代理应用,因为微信兼具社交和交易功能。对於云端/资料中心,该行注意到围绕晶片/运算能力限制的地缘政治的不确定性,以及训练/推理成本优化的进展,但预计网路巨头的云端业务(阿里巴巴是中国最大的相关业务上市公司),云端运算超大规模供应商和数据中心如万国数据(GDS.US) 、世纪互联(VNET.US) 将受益於公有云及人工智能运算需求的持续成长,而人工智慧采用率的提高将推动这些领域成长。(wl/k)(港股报价延迟最少十五分钟。沽空资料截至 2025-01-27 16:25。) (美股为即时串流报价; OTC市场股票除外,资料延迟最少15分钟。)
AASTOCKS新闻