第7章 人工智能(9)
4)GPU在四年时间里提速65倍 我们先从训练开始。全新PascalGPU的项目投资约20亿美元,是数千名工程师花费三年多时间的工作成果。作为首款经深度学习优化的图形处理器,Pascal的网络处理速度比Kepler图形处理器要快65倍。如果一台计算机配备八台通过NVIDIANVLink连接的Pascal图形处理器,即可创建有史以来最高吞吐量的互连结构,其网络处理速度比250台传统服务器还要快。” ‘’每天数百亿次互联网查询很快将需要人工智能,这意味着每次查询将需要进行数十亿次的数学运算。云服务的总负载将很庞大,以确保实时响应。为了得到更快速的数据中心推理性能,我们公布了TeslaP40和P4GPU。P40使数据中心推理吞吐量加速40倍。这是超大规模数据中心的典型。” ”软件是VIDA深度学习平台的重要组成部分。在训练方面,我们有CUDA和cuDNN。在推理方面,我们公布了一款优化推理引擎TensorRT。TensorRT通过融合一个层级和多个层级内的cao作,简化低贡献权重,将精确度降至FP16或INT8,以及采用许多其他技术,从而改善性能,同时不损害准确度。”