近日,金山云正式推出GPU云辦事器實例P3I實例,目前已在金山云官網上線。P3I實例是業內首款采用英偉達高性能計算卡Tesla P4 的云辦事器產品,單實例負載能力是傳統CPU的 30 倍以上,具有訪存性能高、聯網增強、配備新一代網卡三大特點,性價比更高,為包孕語音識別、語義識別、語音合成、人臉識別、圖像識別、場景識別、廣告保舉、智能游戲和無人駕駛等在內的多種人工智能應用場景提供基礎設施支撐,滿足企業級客戶對于計算的高尺度需求。
P3I實例的推出,將加速人工智能技術應用的普及,通過優質的產品和體驗,讓人工智能的潛力得以全面釋放。
率先采用Tesla P4計算卡,提供澎湃動力
當下,人工智能可謂熱度空前,上至科技巨擘,下至創業新秀,紛紛將人工智能技術當作開掘市場金礦的利器,例如智能音箱、智能電視、刷臉支付、無人超市、智能保舉、無人駕駛等等,大量的商業應用場景被一一建構,這對計算量、數據量、深度學習等能力提出了更高的要求。如何為人工智能提供充沛動力,加速相關應用的開發,降低計算成本壓力,成為擺在很多企業面前的現實問題。
在金山云看來,作為深度學習的重要支撐,近年來GPU在很大程度上提高了辦事器的運算能力,大幅度提升訓練速度,由此產生的云端計算集群,已成為人工智能的重要引擎。此次推出的P3I實例,是業內首款采用英偉達高性能計算卡Tesla P4 的云辦事器實例產品,將為人工智能的應用提供澎湃動力。
Tesla P4 專為處理深度學習工作負載,可提升辦事器的工作效率,在任意超大規模神經網絡上的推理延遲,較CPU降低 15 倍以上,推理吞吐效率較CPU提高 60 倍以上,,比擬英偉達上一代計算卡M4 有更低的延遲和更大的吞吐。因此,P3I實例有著更好的性價比和效率,單實例負載能力是配備傳統CPU辦事器的 30 倍以上,適用于深度神經網絡模型的推理預測等場景。
P3I實例提供兩種配置,第一種配置一顆Tesla P4 GPU搭載8GB DDR5 顯存、 14 核vCPU、120GB內存和500GB SSD硬盤,計算能力5.5TFlops;第二種配置兩顆Tesla P4 GPU搭載16GB DDR顯存、 28 核vCPU、240GB內存和1000GB SSD硬盤,計算能力11TFlops。客戶在使用該產品建設深度學習平臺時,可按照業務負載選擇差別配置,從而滿足客戶的定制化需要。
三大特點配合Tesla P4,助人工智能多點開花
為更好地發揮Tesla P4 的作用,P3I實例具有三大特點。首先,P3I實例提高了Tesla P4 的訪存性能,進行了延時優化,性能提升22%,接近物理機水平。通過優化云辦事器Hypervisor層性能,降低Tesla P4 拜候內存開銷,優化了GPU DMA訪存性能,加快HOST內存到數據交換速率,將充分發揮Tesla P4 的運算能力。
第二,全線支持聯網增強。P3I實例的聯網增強大幅提高實例發包速率,能夠降低60%以上的網絡延遲。在刷臉認證、刷臉支付、刷臉門禁、語音識別等應用場景中,客戶對時間延遲的敏感度最高,聯網增強可大幅降低預測請求到預測系統(運行于P3I實例上)的時間延遲,加上Tesla P4 低延遲的特點,P3I實例能為客戶帶來更優質的體驗。
第三,P3I實例配備新一代智能網絡適配器,帶寬得到進一步提升。在人工智能的推理預測應用中,客戶除了對時間延遲敏感,對于系統吞吐也有較高要求,P3I實例配備的新一代網絡適配器,可幫手客戶提升網絡吞吐一倍以上,能夠更好適配Tesla P4 的吞吐能力。
人工智能需要找到應用場景,發展才有意義。P3I實例的推出,將幫手人工智能應用在各個行業不停落地,讓客戶更好發揮自身的優勢和資源。目前,P3I實例已開放購買,已有多家知名人工智能廠商的數十個應用正在適配。在人工智能產業從技術厘革行進到應用落地的重要階段時,P3I實例將成為金山云鞭策產業發展進步的新引擎。