充分发挥海洋特色资源及算力、数据、应用场景等优势,发力海洋人工智能大模型——
青岛:抢占“AI+海洋”新赛道
■位于青岛市人工智能产业园的青岛人工智能计算中心。
2024年,人工智能(AI)再度成为“热词”。今年政府工作报告提出,深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。这是“人工智能+”首次被写入政府工作报告。
人工智能是引领新一轮科技革命和产业变革的重要驱动力。一年多来,以ChatGPT、Sora、GPT-4o等为代表的人工智能大模型相继问世,正在深刻重塑着人类的生产和生活方式。纵观国内外,人工智能大模型正处于应用爆发期。据国家网信办数据,目前我国已有117个大模型完成备案。眼下,人工智能大模型领域“百模大战”态势愈演愈烈。行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式,赋能千行百业。
不入局,就出局。这是人工智能大模型时代来临时很多城市的切实感受。青岛也深知,面对“人工智能+”这一赛道,如果抓不准、抓不住,就有可能失去发展主动权和竞争主导权。所以,青岛充分发挥海洋特色资源和算力、数据、应用场景等优势,发力海洋人工智能大模型,加快抢占“人工智能+海洋”新赛道。
这是一条注定充满荆棘但又必须要走的路。挑战与机遇并存。
■坐落于中国移动(山东青岛)数据中心的中国移动智算中心(青岛)可为人工智能大模型建设提供算力支持。
青岛发力海洋人工智能大模型
数据——丰富数据赋能大模型训练
建立了全球最大的海洋大数据存储体系,建成了全国首个海洋数据交易服务平台,数据交易额达1369万元,汇集训练数据总量超过30PB,能够为大模型训练提供丰富的数据支持。
算力——算力设施建设进展迅速
中国联通(青岛)智算中心和中国移动智算中心(青岛)已相继启用,截至目前,青岛算力总规模超2300P,预计2026年总算力达12000P。建成由神威国产超算、X86超算、GPU和大数据存储四大集群构成的超大规模混合算力平台,算力规模处于国内头部方阵,是国内支持人工智能大模型训练规模最大、性能最优、支撑重大专项最多的国产超算集群。
算法——掌握了一批实用“工具”
发挥崂山实验室“虹吸效应”,汇集由中科大、清华大学科学家领衔的国内顶尖团队,经过两年多研发,完成了具有1700亿参数规模训练任务,培育了“瀚海星云”通用大模型和具有海洋特色的“问海”垂直大模型;中国海洋大学研发了“琅琊泊”海洋环境预报大模型、北极海冰大模型;山东省港口集团正在研发赋能智慧化港口建设的“港口行业大模型”……
■青岛市人工智能产业园加速崛起为人工智能产业发展新高地。
核心要素强,具备先发优势
2022年11月,OpenAI发布对话式AI模型ChatGPT,这是一个堪称划时代意义的人工智能大模型。随后,ChatGPT不断更新、进化,不仅能展开自然的多轮对话、高效的精准问答,还能生成论文、小说等各类文本。ChatGPT的成功,有力推动了人工智能技术的普及化进程,也让“大模型之战”愈演愈烈。
没有人预料到,就在前不久,OpenAI再次发布GPT-4o,该人工智能大模型具备实时语音通信、实时视觉等功能,让人与AI交互的体验感显著提升。这是对话式AI的又一发展里程碑,也让人们真切感受到人工智能的“超能力”,以及人工智能大模型迭代之快。
到今天,包括ChatGPT等在内的人工智能大模型层出不穷,越来越广泛地应用于人机交互、语音识别、无人驾驶、人脸识别等社会生活场景,以及新药研发、材料设计等产业进程。更为重要的是,人工智能大模型拥有自我学习的能力,在不断进化中,正进一步转化为现实生产力。
或许有人会问,人工智能大模型如此之强,它是如何建立的呢?这就必须提到人工智能大模型研发建设的三大核心要素——数据、算力、算法。简单来说,数据是基本要素,用来构建大模型,并通过不断“喂数据”,促进大模型更新、进化;算力是核心动力,随着AI模型的复杂性和数据量不断增加,对算力的需求也会急剧上升;算法是关键支撑,是利用数据、依托算力,按照预先设定的架构运行,是解决问题的工具,很大程度上决定了AI模型的质量。
所以,要想建设人工智能大模型,数据、算力、算法缺一不可。而海洋是高质量发展战略要地,是青岛最突出的特色优势。在海洋领域,青岛数据、算力、算法三大核心要素强,具备先发优势,正因如此,青岛正全面发力海洋人工智能大模型,抢占“AI+海洋”新赛道。
具体来看,在数据方面,青岛建立了全球最大的海洋大数据存储体系,建成了全国首个海洋数据交易服务平台,数据交易额达1369万元,汇集训练数据总量超过30PB,能够为大模型训练提供丰富的数据支持。
在算力方面,青岛算力设施建设进展迅速,中国联通(青岛)智算中心和中国移动智算中心(青岛)已相继启用,截至目前,青岛算力总规模超2300P,预计2026年总算力达12000P。目前,青岛已建成由神威国产超算、X86超算、GPU和大数据存储四大集群构成的超大规模混合算力平台,算力规模处于国内头部方阵,是国内支持人工智能大模型训练规模最大、性能最优、支撑重大专项最多的国产超算集群。
在算法方面,青岛发挥崂山实验室“虹吸效应”,汇集由中科大、清华大学科学家领衔的国内顶尖团队,经过两年多研发,完成了具有1700亿参数规模训练任务,培育了“瀚海星云”通用大模型和具有海洋特色的“问海”垂直大模型;中国海洋大学研发了“琅琊泊”海洋环境预报大模型、北极海冰大模型;山东省港口集团正在研发赋能智慧化港口建设的“港口行业大模型”等,掌握了一批实用“工具”。
应用场景广,绘制“导航地图”
“人工智能若找不到应用场景就没有用。用人工智能赋能传统产业、培育新兴产业、打造未来产业,才是人工智能的核心。”中国科学院院士吕建的这句话,用来表述人工智能大模型同样适用。
一大利好是,青岛不仅拥有构建海洋人工智能大模型的数据、算力、算法优势,而且也具备场景优势。最突出的一个例子是,青岛在海洋药物与生物制品产业的应用场景、前景已经得到了验证。近年来,青岛借助超算,通过人工智能虚拟筛选、智能药物设计等手段,从海量的海洋生物资源中寻找具有药用价值的化合物,快速、高效筛选出了抗癌药物BG136和抗乙肝病毒药物LY102,大大加快了海洋药物研发进程。
这其中的原理是,通过人工智能虚拟筛选,即将海洋天然产物三维结构数据库与药物分子靶点数据库比对分析,不断测试库中的海洋化合物对可能与特定疾病有治疗意义的生物分子靶点的活性;通过智能药物设计,即对海洋化合物展开结构改造和设计,进一步评估海洋化合物的成药潜力。这不仅几何级减少了发现海洋药物的时间,而且将海洋药物筛选准确率从不足20%提升至60%以上,大大缩短研发周期并提高了成功率。
不仅仅是海洋药物与生物制品产业,海洋人工智能大模型的应用场景还有很多。在海洋渔业方面,可通过收集、整理和分析渔业生物等相关数据,更准确地评估渔业资源的健康状况,并制定相应的保护措施和管理策略;在船舶与海洋工程装备产业方面,能够进一步提高海洋装备的控制水平,包括船舶动力定位智能化、水下姿态控制智能化、水下导航智能化等;在海水淡化与综合利用产业方面,可以通过智能算法优化海水淡化过程中的膜分离技术,设计出具有高效脱盐性能的膜,提高分离和脱盐的效率,使海水淡化更加经济高效;在海洋交通运输产业方面,可应用于智能引航、船舶调度、航道维护、安全管理以及环境保护等方面,打造智慧港口。
如上所述,海洋人工智能大模型有助于推动海洋传统产业转型升级,海洋新兴产业培育壮大,同时,它还能够打造未来产业。例如,人工智能技术在海洋勘测和资源开发中具有广泛应用,通过利用人工智能算法分析海底地质特性和海底环境,可以更加精准地建立三维地质模型,帮助勘测人员评估海底潜在矿产资源的丰富程度,提高资源勘测的效率和准确性。除此之外,还能够通过自适应策略开展海洋数据挖掘,发现未知特性、预测海洋环境的变化,进而推动海洋资源勘探。
业界普遍认为,发展“人工智能+”,必须在“+”的应用场景上突破,并进一步明确应用场景中哪些方面需要大模型。目前,青岛已围绕海洋气象预报、海洋灾害预警、智慧港口建设、海洋药物筛选与研发、海洋资源勘探与开发、海洋智能装备制造、海洋信息智能感知、海洋水下自主无人系统研发、深远海养殖、海洋文旅等垂直领域,梳理出近百个应用场景,为各类创新创业主体在青岛抢滩登陆海洋人工智能领域提供了“导航地图”,为大模型领域和海洋领域头部企业精准供需对接提供了路径。
体系化推进,形成产业集聚
人工智能与应用场景结合才能发挥最大效能。海洋人工智能大模型的建设,同样必须遵循场景驱动的原则,不断深入挖掘、分析、筛选模型的应用场景需求,确定场景突破的优先级顺序,继而先行先试开展模型的构建、训练、优化与应用。
但是,没有一个人工智能大模型是完美无缺的。当前,几乎所有的大模型都无法对极端气候事件展开精准预测,因为极端天气事件非常少,数据量太少,无法训练大模型。与之相矛盾的是,恰恰是那些极端气候事件更需要被提前预测。“所以,青岛致力于打造海洋基础大模型矩阵,体系化建设海洋人工智能大模型,非常科学。”中国科学院院士吴立新表示。
眼下,发力海洋人工智能大模型的青岛,正在加快构建一个包含“瀚海星云”大模型在内的基础大模型矩阵、以“问海”大模型和港口大模型为代表的N个行业大模型和X个重点应用场景的“1+N+X”海洋大模型体系,通过成体系推进,并在关键场景应用,找到突破口,彰显展示度,更好发挥标杆示范引领作用。
不仅如此,青岛还坚持政府引导、市场主体、创新驱动、开放合作原则,集聚各类要素资源,聚力打造具有全球竞争力的世界级海洋人工智能大模型产业集聚区。
产业载体就位于青岛市人工智能产业园。目前,该产业园已聚集各类人工智能相关企业200余家,青岛人工智能计算中心、国家高端智能化家用电器创新中心、东华软件副中心产业园已建成;中科曙光全球研发总部基地、一汽解放(青岛)商用车研究院、青岛人工智能科技创新中心、泰科达数据中心、好美智谷人工智能产业园、人工智能创制中心等总投资约145亿元的7个在建项目正在加快建设;人工智能数字创新基地(待定)正在加快前期准备,预计2024年下半年开工建设。园区已逐步建成赋能青岛市产业发展的AI创新高地和算力基础设施支撑高地,成为青岛市人工智能产业发展的核心区、主阵地。在此基础上,推进“人工智能+海洋”深度融合,打造海洋人工智能大模型产业集聚区。
如今,青岛已行动起来。加快建立一个工作专班,加强工作统筹协调推进;组建一批攻坚团队,尽快完成海洋大模型基座研发和建设;设立一支海洋大模型产业基金,加快海洋人工智能大模型发展应用;成立一个产业联盟,强化人工智能领域和海洋领域头部企业产学研合作;建设一个海洋产业大脑,打造国内首个以“数据+算法”驱动的海洋产业大脑平台;建设一个场景展示区,在海洋气象预报、海洋药物研发、智慧港口建设、海洋生态环保等领域开展应用场景展示……通过重点抓好这些扎实有效的工作,提速海洋人工智能大模型产业集聚化、市场化发展。
诸多实践告诉我们,人工智能大模型是绝对不能错过的历史机遇。建好、用好海洋人工智能大模型和产业集聚区,有望成为青岛人工智能产业跨越式发展的突破口。(青岛日报/观海新闻记者 李勋祥)
责任编辑:张慕鑫