第7章人工智能（9）

    4）GPU在四年时间里提速65倍

    我们先从训练开始。全新PascalGPU的项目投资约20亿美元，是数千名工程师花费三年多时间的工作成果。作为首款经深度学习优化的图形处理器，Pascal的网络处理速度比Kepler图形处理器要快65倍。如果一台计算机配备八台通过NVIDIANVLink连接的Pascal图形处理器，即可创建有史以来最高吞吐量的互连结构，其网络处理速度比250台传统服务器还要快。”

    ‘’每天数百亿次互联网查询很快将需要人工智能，这意味着每次查询将需要进行数十亿次的数学运算。云服务的总负载将很庞大，以确保实时响应。为了得到更快速的数据中心推理性能，我们公布了TeslaP40和P4GPU。P40使数据中心推理吞吐量加速40倍。这是超大规模数据中心的典型。”

    ”软件是VIDA深度学习平台的重要组成部分。在训练方面，我们有CUDA和cuDNN。在推理方面，我们公布了一款优化推理引擎TensorRT。TensorRT通过融合一个层级和多个层级内的cao作，简化低贡献权重，将精确度降至FP16或INT8，以及采用许多其他技术，从而改善性能，同时不损害准确度。”

第7章 人工智能（9）

第7章人工智能（9）