分享到:

浙江旭鑫信息系统有限公司杭州浪潮服务器、GPU、工作站、存储,找正规代理商

联系资料

浙江旭鑫信息系统有限公司
所在地区:
浙江省 杭州市
公司主页:
暂无
电话号码:
131 *******
传真号码:
暂无
联 系 人:
暂无
移动电话:
151 *******
电子邮箱:
暂无

浪潮GPU的AIStation组合拳,助力企业AI开发加速

发布于:2020年06月30日 来源:www.fuhai360.com
[摘要]杭州浪潮服务器供应商带您看浪潮AIStation人工智能开发平台用“组合拳”打破计算力壁垒,加速企业AI开发进程。


对于AI企业来说,GPU等计算资源昂贵,如何提高资源利用率,保护计算力投资?如何解决资源抢占,保证资源使用公平合理?如何减少等待时间,提高模型训练效率……这些问题都关系着研发创新的进度。供应商带您看浪潮AIStation人工智能开发平台用“组合拳”打破计算力壁垒,加速企业AI开发进程。

AIStation是浪潮面向AI企业开发场景的人工智能资源平台,可通过资源配额、GPU共享、排队托管三招“组合拳”,智能化分配GPU计算资源,提高资源利用率,帮助用户提高开发效率。

首先,AIStation收拢分散的计算资源,提供集群式的池化管理,并设置资源配额策略,实现多用户公平均衡使用资源。

供应商指出,AIStation将开发用户划分为5个用户组,每个用户组10人,并根据业务需求设置每组和每个用户的使用配额,如可设置每组使用6张GPU卡、40个CPU核。并对每个用户的开发环境使用时长、同时提交任务数量进行限制。

其次,AIStation通过GPU共享策略,可以让多人共用一张GPU卡且互不影响。

AIStation统一管理4台GPU节点,将其中2个节点的16张GPU卡设置为开发资源组,用于开发环境创建,剩下16张GPU卡为训练资源组,用于模型训练。杭州浪潮服务器供应商表示,通过共享策略,AIStation可将开发资源组的每张GPU卡切分为8份,每份使用4G显存。这样原来的16张GPU卡相当于变为了128张卡。并且通过设置CPU超线程策略扩展CPU核数,满足50个用户同时创建开发环境的需求。用户也可以根据自己的模型设置batchsize和显存使用的大小。

最后,AIStation通过任务排队托管、定义任务优先级,充分利用空闲时间训练任务,并且可根据优先级调度任务排队运行。

告诉我们,浪潮AIStation通过对计算资源的有效管理、调度,在GPU使用时间、利用率和训练任务数量上,相比原方案均实现了大幅提升,最大化地优化了资源使用。