打响“百模大战”,成都大模型赛道迎来加速跑

来源:中国网 时间:2024-07-05 18:42:27 编辑:张夏桐 点击:

7月4日,2024世界人工智能大会在上海启幕,聚焦大模型、算力、机器人、自动驾驶等重点领域,与“人工智能+”相关的创新应用成果和产品备受瞩目。

大会上,商汤科技、科大讯飞、星环科技等企业带来的新一代大模型集体亮相;摩尔线程也带来了其AI旗舰产品夸娥(KUAE)智算集群解决方案的重大升级,旨在打造专为万亿参数级别的复杂大模型训练设计的国产通用加速计算平台;“AI大模型产业发展的关键要素与创新生态”闭门研讨会举办……吸引着全行业的目光。
近年来,全世界数十万亿级的数据被投入大模型训练当中,一次次挑战着开发者和硬件算力的极限,大国、巨头加速ALL IN。在这场未来产业的激烈竞争中,成都已经成为其中的有力参与者。
今年,四川省把人工智能作为1号创新工程精准支持。成都也接连出台了《成都市进一步促进人工智能产业高质量发展的若干政策措施》等相关文件。5月,成都市3个人工智能大模型通过国家备案,实现了成都行业大模型备案的零突破。
大模型发展面临哪些挑战?成都能否从中找到新赛道竞争的破局点?是人工智能产业当下聚焦的重点。
01“驭风”而行场景孕育大模型落地
目前,大模型技术在国内日趋升温,许多厂商正在积极推进大模型在垂直领域的应用探索。复旦大学自然语言处理实验室教授张奇认为,“推理能力”是通用人工智能核心,目前GPT4.0在企业端直接端到端使用仍有巨大困难,大部分场景下直接使用只能达到20%至85%的准确率,因此需要对AGI的边界有清晰认知,如何选择场景,才是大模型技术落地的关键。

今年4月北京发布的《北京市人工智能大模型行业应用分析报告》中提到,通过举办人工智能大模型创新应用大赛的形式助推大模型的技术落地。大赛设置了政务、金融、产业升级、医疗、文化教育、智慧城市6个大模型领域热门赛道,挖掘出了一批典型的行业应用案例,梳理凝练出了大量核心业务场景和高质量行业核心数据,为大模型后续发展进行“预训练”。
今年7月,在2024世界人工智能大会的浦东新区人工智能产业生态推介会上,上海浦东张江“模力社区”正式启用。作为浦东新区人工智能产业生态的重要组成部分,“模力社区”将为人工智能领域的创新团队和企业提供更加便捷的交流合作平台,推动产学研用深度融合,加速形成大模型创新生态。
在场景应用方面,成都市深挖AI大模型在生产、生活、城市治理等领域应用实践并发布机会清单引导科技研发。根据《成都市人工智能产业高质量发展三年行动计划(2024—2026年)》,成都将大力实施场景融合应用培育行动,在2026年打造150个创新应用场景,培育示范应用产品超过500个。
02抢占赛道直面发展挑战与机遇
如同形式各样的城市排名,在火热的“百模大战”之下,大模型备案数量似乎成为人工智能产业实力的重要指标,各地对大模型的重视程度也不断提高。成都市场上已经诞生了一批具有竞争力的大模型:成都海艺互娱科技有限公司的“海艺绘画大模型”,聚焦AI绘图和视频生成领域,满足企业和个人个性化的设计需求;成都晓多科技有限公司的“晓模型XPT”大语言模型已经赋能电商、金融等多个行业;成都考拉悠然科技有限公司的多模态产业通用大模型已经面向半导体、烟草、城市治理等500多个高能项目……

数据显示,国内已经推出超300个大模型,截至今年4月已经有117个大模型完成了生成式AI备案服务,其中属地位于北京的有51个、上海24个、广东19个……百花齐放、百家争鸣的同时,“百模大战”也逐渐进入白热化阶段。
目前成都在“百模大战”中处于什么位置?四川省人工智能研究院副院长、四川省人工智能行业协会秘书长陈章表示,根据他的观察和推断,成都已通过备案的大模型数量大概处于全国第六、七名左右的位置,在他看来,这个排名不算太高,还可以争取再往前靠。
03强力支撑大模型产业提速跑
总体来看,加速大模型应用落地依然是围绕“算力、算法、数据”开展工作。成都正利用自身发展优势,寻找行业破局点,迎头赶上。
增强算力基础设施。正如没有超高速风洞,造不出顶级的导弹和战斗机,没有足够的算力支撑,大模型训练也难以迈进。今年的政府工作报告上提到,适度超前建设数字基础设施,加快形成全国一体化算力体系,培育算力产业生态。要以广泛深刻的数字变革,赋能经济发展、丰富人民生活、提升社会治理现代化水平。

成渝地区是国家“东数西算”工程的枢纽节点之一,成都已经形成国家超级计算成都中心、成都智算中心“双中心”格局。
可喜的是,近年来成都不断发布《成都市围绕超算智算加快算力产业发展的政策措施实施细则》等算力发展相关政策,推进产业建圈强链,构建“超算+智算+通算+边缘计算”多元异构算力设施,目前智能算力规模已超过4700 Pflops,并计划到2026年实现算力规模2万PFLOPS,未来成都的获得算力成本将进一步下降。

稳抓高质量行业数据。算力规模的基础设施建设是一个漫长的过程,同时还受到摩尔定律、芯片研发实力、算力成本等多方面因素影响,打下高质量数据基础是成都破局的重要发力点。
人民网财经研究院发布的《2024年中国AI大模型产业发展报告》指出,国内大模型的数据缺乏多数据源的调用,可供大模型训练的有效数据源呈现碎片化分散状态,政府部门的权威数据、大型企业掌握的行业或内部数据通常不对外公开,仍需构建高质量的AI大模型训练数据集,扩充数据源提高数据质量。
四川拥有全部41个工业门类,成都作为四川省会城市,利用好完整工业体系中的高质量数据,使得利用行业大模型打通“人工智能+”最后一公里成为可能。
今年5月,第七届数字中国建设峰会举办,成都获批成为全国首批7个数据标注试点基地之一。成都已建成覆盖全市2140余万常住人口和390余万法人等系列基础数据库,向社会公众开放数据3亿条;授权运营公共数据575类5.7亿条,数字城市竞争力排名全国第5。
通过数据标注,可以将原始数据转化为机器学习算法可理解的形式,是新一代人工智能发展的关键抓手。参考北京人工智能数据训练基地,若能有效组织数据供给方、加工服务方、模型训练方“进场”合作,推动高质量数据价值释放,将对通用模型和行业垂类模型训练精调提供极大助力。
相信只要找准突破口,随着大模型技术奇点的到来以及行业标准化体系的建设与完善,成都规划中的人工智能万亿级市场定能实现。(张夏桐 陈梦雪)