美国IBM研究院实现深度学习性能突破
美国IBM研究院近日宣布,通过全新的分布式深度学习软件,实现了接近理想的扩展能力,该软件在64台IBM Power系统服务器中的256个GPU上并行运行深度学习框架,实现了95%的扩展效率,并使运算速度与准确率得到了显著提升。此前最佳的系统扩展能力是Facebook人工智能研究院所取得的89%。 深度学习是一种广泛使用的人工智能方法,可以帮助计算机通过大量数据理解真实世界的图像和声音,并提取其中的含义。到目前为止,深度学习主要是在单一服务器上运行的,在不同计算机之间高速移动大量数据的协调过程太过复杂,因此大规模运行深度学习模型在技术上面临着困难,训练时间通常要持续数天甚至数周。 IBM研究团队编写了软件和算法,能够对在数十台服务器中的数百个GPU加速器间并行运行非常庞大且复杂的计算任务和自动优化。在使用ImageNet-22k数据集的750万张图像训练模型时,图像识别准确率史无前例地达到了33.8%,而微软此前发布的最好结果为29.8%。IBM的分布式深度学习技术不仅提高了准确率,还能大幅缩短运算时间,可在7小时内训练一个ResNet-101神经网络模型,而微软训练同一个模型需要花费10天时间。(责任编辑:韩佳欣) |
(本网站所发布文章只作为信息传播使用,不代表本网观点)
相关阅读:
- 统筹国内国际资源 服务教育改革发展 12-21
- 2014年中国参与第四代核能系统国际论坛工作研讨会在合肥召开 03-21
- 教育部提醒家长确认学校已为学生建立电子学籍 03-17
- 太行山下听心声--革命老区西柏坡镇人民的喜与盼 10-15
- 科技部与白俄罗斯国家科学技术委员会关于在智能物流监控技术领域 01-30
- AI你好 你要的人才,在路上 07-14
- 2017年天津市创新创业大赛初赛成功举办 07-18
- 2014年度创新型产业集群试点(培育)工作座谈会在北京召开 11-26
- 流感肆虐,成都儿科门诊爆满!医生的提醒要注意 01-11
- 教育部:真改实改彻底改确保深化整改任务落实处 05-10
资讯排行榜