图说:位于临港新片区的商汤人工智能计算中心 采访对象供图
(资料图片)
每秒百亿、千亿次的浮点运算能力,千万亿字节(PB)级的数据存储规模……许多人可能对这些指标没有太多概念;但要说起对答如流的大语言模型,自动驾驶中反应神速的汽车,大家应该不会感到陌生了吧。
看得见的应用背后,是看不见的算力在支撑。“大模型时代”谁能占得先机,这个问题谁说了“算”?在2023世界人工智能大会召开之际,记者探访了商汤科技人工智能计算中心(AIDC)。
如今,基于最新人工智能理论、采用领先人工智能计算架构,提供算力服务、数据服务和算法服务的智算中心,在推进大模型能力和数字经济发展中正发挥着越来越重要的作用。
新民晚报记者 陈炅玮 摄(下同)
算力:AIGC时代不可或缺的“血液”
这座位于临港新片区的商汤人工智能计算中心,是目前全亚洲规模最大的人工智能计算中心之一。经过一年半的运营,今天的算力规模已经达到了5000PFLPOS(1PFLPOS相当于每秒可以进行1千万亿次浮点运算)的体量,超过了当时设计的算力规模水平。
“换句话说,商汤智算中心的峰值算力可以达到每秒500亿亿次浮点运算。通过这样的一个超大规模的算力,我们可以支持20个千亿参数超大模型同时进行训练,并提供完整的人工智能基础设施资源的能力。”商汤AI大装置产业赋能中心主任蒋钦告诉记者。
大模型吹响了生成式人工智能(AIGC)的号角,这必然伴随着能源的进一步开发。这样的“能源”,在AIGC时代,正是无数服务器中运转不息的庞大算力。打比方说,大模型若是人工智能抽象化的“身体”,那么海量的算力,则是维系身体运转的“血液”。
蒋钦解释,所谓算力并不是单一概念,它包括通用算力,就是以CPU芯片为主的算力;还包括超算,就是各种超算中心提供的高性能算力,主要服务于科学计算;还有目前非常热门的智能算力,即以GPU为典型代表的,以AI芯片为主的服务于人工智能训练和推理相关需求的计算能力。
其中,以AI芯片为主的人工智能算力近年来呈现快速增长态势。中国信通院统计显示,2016年的算力结构中,国内人工智能算力比例只占3%左右;而截至去年,整个人工智能算力比重已超过半壁江山。
大模型时代到来 算力够用吗?
随着人工智能技术的高速发展,以及大语言模型的出现和应用,各行各业对智能算力的需求也在与日俱增。
按照摩尔定律,算力基本每两年就要翻一番,但这般迅猛的增长速度也无法满足人类对算力的需求。蒋钦介绍,2012年前后是一道分水岭,随着深度学习的兴起,在此之后,最先进人工智能模型的计算量每三四个月就翻一番,也就是每年增长近10倍,比摩尔定律2年增长一倍快得多。尤其是最近几年,在大模型取得突破、应用场景的广泛开拓与深入发展的背景下,对智能算力的需求迎来井喷。
没有人会否认,大模型江湖的混战已然愈演愈烈,“下场”的选手越来越多。由大模型为代表引发的的人工智能新技术热潮,会带动整个算力需求呈现出非常旺盛的态势。
“大模型需要处理海量的数据,并且需要在短时间内完成复杂的计算任务,这就意味着需要更高的计算能力。”蒋钦指出,“大模型也需要访问大量的数据,存储大量的参数和中间结果,因此需要更大的内存容量。”与此同时,大模型需要在多个硬件设备上同时进行计算,因此需要更好的并行计算能力;而在“双碳”背景下,消耗大量的能源的大模型也在呼唤更高能效比的算力。
“虽然纯CPU算力也能用来进行部分人工智能计算,但效率非常低、能耗非常高。我们不会以这样的算力形式去支撑产业的发展。”蒋钦判断,“而搭载以AI芯片为主的新型算力基础设施是未来发展的重要趋势和热潮。”
他告诉记者,在大模型的热潮下,算力服务器目前呈现紧缺状态,“大模型的发展和智能算力底座有着深刻联系,需要在大规模资源汇聚的基础上做好算力、算法、数据三要素的协同实践和联合优化,助力实体经济高质量发展。”
助力临港打造智能算力新高地
作为亚洲已投入使用的、最大规模的单节点智能计算中心,商汤AIDC除了算力规模体量巨大外,与之相配套的人工智能模型开发工具,针对大模型的训练、推理、数据优化服务等,都可以高效率、低成本、规模化地支撑和服务好目前以大模型为代表的整个人工智能产业的高速发展。
今年上半年,人工智能应用向纵深发展:AIGC打造的“数字人”效果媲美真人水平;人工智能预测蛋白质结构给基础研究带来全新的研究手段;人工智能驱动的大语言模型在多轮次对话和长文本理解能力上突飞猛进……这些无不依赖算力提供支撑。
“商汤人工智能计算中心除了为‘日日新’大模型体系提供底层算力基座和AI工具的支撑外,也为其他行业赋能AI相关的基础能力。”蒋钦介绍,“通过云服务的方式,我们已在泛互联网、泛娱乐、自动驾驶、科研院所等多个领域里支持了十余家大模型客户的开发工作。”
记者了解到,商汤人工智能计算中心之后会依托临港,进一步夯实算力底座,扩大算力规模。在算力软件平台相关技术领域,持续对集群架构、集群网络、存储性能、能源管理等多方面开展技术攻关,对于大模型训练与推理定向支持等开展技术迭代更新,以支撑更大规模的算力集群落地,助力临港打造智能算力新高地。
“临港本身具有非常强大的区域产业优势,集聚了集成电路、人工智能、生物医药、高端装备制造、新能源汽车等核心优势产业。这也要求我们围绕这些优势产业去打造人工智能基础设施行业解决方案与丰富的产业上下游生态,做好产业智能化升级的算力底座。”蒋钦表示。
新民晚报记者 郜阳
【延伸阅读】2023年是属于“大模型”的一年 “百模大战”抢滩智慧未来
关键词: