欧美日韩视频在线,日韩av在线精品,亚洲专区欧美专区

主頁 > 知識庫 > 解決Pytorch半精度浮點型網絡訓練的問題

解決Pytorch半精度浮點型網絡訓練的問題

用Pytorch1.0進行半精度浮點型網絡訓練需要注意下問題：

1、網絡要在GPU上跑，模型和輸入樣本數據都要cuda().half()

2、模型參數轉換為half型，不必索引到每層，直接model.cuda().half()即可

3、對于半精度模型，優化算法，Adam我在使用過程中，在某些參數的梯度為0的時候，更新權重后，梯度為零的權重變成了NAN，這非常奇怪，但是Adam算法對于全精度數據類型卻沒有這個問題。

另外，SGD算法對于半精度和全精度計算均沒有問題。

還有一個問題是不知道是不是網絡結構比較小的原因，使用半精度的訓練速度還沒有全精度快。這個值得后續進一步探索。

對于上面的這個問題，的確是網絡很小的情況下，在1080Ti上半精度浮點型沒有很明顯的優勢，但是當網絡變大之后，半精度浮點型要比全精度浮點型要快。

但具體快多少和模型的大小以及輸入樣本大小有關系，我測試的是要快1/6，同時，半精度浮點型在占用內存上比較有優勢，對于精度的影響尚未探究。

將網絡再變大些，epoch的次數也增大，半精度和全精度的時間差就表現出來了，在訓練的時候。

補充：pytorch半精度，混合精度，單精度訓練的區別amp.initialize

看代碼吧~

mixed_precision = True
try:  # Mixed precision training https://github.com/NVIDIA/apex
    from apex import amp
except:
    mixed_precision = False  # not installed

 model, optimizer = amp.initialize(model, optimizer, opt_level='O1', verbosity=1)

為了幫助提高Pytorch的訓練效率，英偉達提供了混合精度訓練工具Apex。號稱能夠在不降低性能的情況下，將模型訓練的速度提升2-4倍，訓練顯存消耗減少為之前的一半。

文檔地址是：https://nvidia.github.io/apex/index.html

該工具提供了三個功能，amp、parallel和normalization。由于目前該工具還是0.1版本，功能還是很基礎的，在最后一個normalization功能中只提供了LayerNorm層的復現，實際上在后續的使用過程中會發現，出現問題最多的是pytorch的BN層。

第二個工具是pytorch的分布式訓練的復現，在文檔中描述的是和pytorch中的實現等價，在代碼中可以選擇任意一個使用，實際使用過程中發現，在使用混合精度訓練時，使用Apex復現的parallel工具，能避免一些bug。

默認訓練方式是單精度float32

import torch
model = torch.nn.Linear(D_in, D_out)
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)
for img, label in dataloader:
 out = model(img)
 loss = LOSS(out, label)
 loss.backward()
 optimizer.step()
 optimizer.zero_grad()

半精度 model(img.half())

import torch
model = torch.nn.Linear(D_in, D_out).half()
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)
for img, label in dataloader:
 out = model(img.half())
 loss = LOSS(out, label)
 loss.backward()
 optimizer.step()
 optimizer.zero_grad()

接下來是混合精度的實現，這里主要用到Apex的amp工具。

代碼修改為：

加上這一句封裝，

model, optimizer = amp.initialize(model, optimizer, opt_level=“O1”)

import torch
model = torch.nn.Linear(D_in, D_out).cuda()
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)
model, optimizer = amp.initialize(model, optimizer, opt_level="O1")

for img, label in dataloader:
 out = model(img)
 loss = LOSS(out, label)
 # loss.backward()
 with amp.scale_loss(loss, optimizer) as scaled_loss:
     scaled_loss.backward()

 optimizer.step()
 optimizer.zero_grad()

實際流程為：調用amp.initialize按照預定的opt_level對model和optimizer進行設置。在計算loss時使用amp.scale_loss進行回傳。

需要注意以下幾點：

在調用amp.initialize之前，模型需要放在GPU上，也就是需要調用cuda()或者to()。

在調用amp.initialize之前，模型不能調用任何分布式設置函數。

此時輸入數據不需要在轉換為半精度。

在使用混合精度進行計算時，最關鍵的參數是opt_level。他一共含有四種設置值：‘00'，‘01'，‘02'，‘03'。實際上整個amp.initialize的輸入參數很多：

但是在實際使用過程中發現，設置opt_level即可，這也是文檔中例子的使用方法，甚至在不同的opt_level設置條件下，其他的參數會變成無效。（已知BUG：使用‘01'時設置keep_batchnorm_fp32的值會報錯）

概括起來：

00相當于原始的單精度訓練。01在大部分計算時采用半精度，但是所有的模型參數依然保持單精度，對于少數單精度較好的計算（如softmax）依然保持單精度。02相比于01，將模型參數也變為半精度。

03基本等于最開始實驗的全半精度的運算。值得一提的是，不論在優化過程中，模型是否采用半精度，保存下來的模型均為單精度模型，能夠保證模型在其他應用中的正常使用。這也是Apex的一大賣點。

在Pytorch中，BN層分為train和eval兩種操作。

實現時若為單精度網絡，會調用CUDNN進行計算加速。常規訓練過程中BN層會被設為train。Apex優化了這種情況，通過設置keep_batchnorm_fp32參數，能夠保證此時BN層使用CUDNN進行計算，達到最好的計算速度。

但是在一些fine tunning場景下，BN層會被設為eval（我的模型就是這種情況）。此時keep_batchnorm_fp32的設置并不起作用，訓練會產生數據類型不正確的bug。此時需要人為的將所有BN層設置為半精度，這樣將不能使用CUDNN加速。

一個設置的參考代碼如下：

def fix_bn(m):
 classname = m.__class__.__name__
    if classname.find('BatchNorm') != -1:
     m.eval().half()

model.apply(fix_bn)

實際測試下來，最后的模型準確度上感覺差別不大，可能有輕微下降；時間上變化不大，這可能會因不同的模型有差別；顯存開銷上確實有很大的降低。

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

PyTorch梯度裁剪避免訓練loss nan的操作
pytorch訓練神經網絡爆內存的解決方案
Pytorch訓練模型得到輸出后計算F1-Score 和AUC的操作
pytorch加載預訓練模型與自己模型不匹配的解決方案
Pytorch訓練網絡過程中loss突然變為0的解決方案
pytorch 如何使用float64訓練

標簽：常德黑龍江潛江銅川呂梁通遼阿里株洲

巨人網絡通訊聲明：本文標題《解決Pytorch半精度浮點型網絡訓練的問題》，本文關鍵詞解決,Pytorch,半,精度,浮點型,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《解決Pytorch半精度浮點型網絡訓練的問題》相關的同類信息！

解決Pytorch半精度浮點型網絡訓練的問題

用Pytorch1.0進行半精度浮點型網絡訓練需要注意下問題： 1、網絡要在GPU上跑，模型和輸入樣本數據都要cuda().half() 2、模型參數轉換為half型，不必索引到每層，直接model.cuda().half()即可...

10-18

小a智能電話機器人（智能ai電話機器人怎么用）

本文目錄一覽：1、AI智能語音機器人有什么功能?2、小a是干什么的?3、你那么努力,憑什么不加薪4、AI智能外呼機器人是什么鬼...

08-10

ofo活躍用戶數環比增速第一活躍滲透率再創行業新高

近日，易不雅觀國際發布了共享單車行業 5 月的最新數據“移動APP排行榜“顯示，ofo以 2537 萬的活躍用戶數排名總榜單的第...

10-16

400電話有可以按區域轉接的方法嗎？

可以，400電話可以設置按區域轉接。...

12-22

商標過期了怎么辦

根據商標法第 37 條規定注冊商標以后，商標專用權為 10 年，自核準之日起開始。經常有朋友遇到這樣的問題，因為 10 年時間...

10-23

安徽人工外呼系統（人工外呼系統排行）

本篇文章給大家談談安徽人工外呼系統，以及人工外呼系統排行對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。...

11-06

邯鄲財稅呼叫中心軟件公司,外呼系統-品質保障

邯鄲財稅呼叫中心軟件公司,外呼系統就是通過式模擬銷售或客服，和客戶進行多輪互動率溝通交流，迅速完成ABC類意向客戶...

12-17

泰州智能電話外呼系統（泰州呼叫）

本篇文章給大家談談泰州智能電話外呼系統，以及泰州呼叫對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。本...

05-17

400電話代理哪家好北京400電話申請代理商

其實在400電話申請過程中，也是會有多方面的差異的，那么在這種電話的申請中，會有哪些方面的不一樣呢？首先也就是在申...

01-13

AI智能營銷系統切詞分詞功能上線，讓判斷意向度

AI智能營銷系統切詞分詞功能上線，讓判斷意向度更精準。深圳市數心科技有限公司歷經多年的技術積累和研發實踐，融合互...

10-24

包含西安公司外呼系統平臺的詞條

本文目錄一覽： 1、西安有哪家公司做主動外呼體系,是有職業資質的?2、西安睿婕集團自銷貓外呼體系怎么樣3、西安外呼電話...

04-22

電銷機器人電話費（電銷機器人價格多少錢）

本文目錄一覽： 1、智能電話發售板滯人幾何錢 2、電銷板滯人話費若何算？ 3、電銷板滯人幾何錢一臺，粗疏是若何收費的？...

11-25

電話機器人的常見問題（老是接到機器人電話怎

本文目錄一覽：1、挑選電銷機器人需求逃避哪些危險2、智能電銷機器人,怎樣正確的運用?3、第一次去了解電銷機器人，要...

11-29

迪士尼百度地圖怎么標注的門票價格

上海迪士尼樂園門票已于28日凌晨正式開售，希望一睹迪士尼風采的游客，現可以直接通過百度地圖預購門票。今年2月初，...

04-13

SEO新手必須具備的20條小常識小結

1、問： Title 應該怎么做呢？答：頭部建議取3 個關鍵詞，字數為 30 個中文字或者 60 個英文字母。 2、問：為什么詞排百度第...

10-19

(400電話申請原來還有這些小技巧)400電話應用原來有這些提示

400 呼叫請求的重要性和好處是根深蒂固的，因此 400 呼叫請求也是企業必須的。 400電話請求非常講究，正確理解處理流程可...

07-21

sql 時間函數整理的比較全了

1. 當前系統日期、時間 select getdate() 2. dateadd 在向指定日期加上一段時間的基礎上，返回新的 datetime 值例如：向日期加上2天...

10-18

win10中怎么修改IP地址？win10重新設置IP

玩電腦的人們，應該都聽說過IP地址。IP其實就跟我們用的身份證一樣，只要連接有網絡的電腦，都有一個唯一的IP地址，獨一...

10-20

臨汾小型外呼系統軟件（機器人外呼系統軟件）

本文目錄一覽： 1、外呼軟件有哪些？2、手機外呼軟件有哪些？哪個好？3、咱們是個電銷團隊，最近想找一款主動外呼功用...

11-28

php面試實現反射注入的詳細方法

PHP具有完整的反射API，提供了對類、接口、函數、方法和擴展進行逆向工程的能力。通過類的反射提供的能力我們能夠知道類...

10-18

400電話辦理的套餐費包括哪些費用?400電話辦理怎樣選擇套餐？怎樣選擇號碼？

400電話在現在市場中使用的非常火爆，企業之所以會放心的辦理400電話，是因為收費非常合理，在使用過程中也非常方便，我...

01-13

Al Rayan銀行使用Vonage聯絡中心來避免業務中斷

老秦夜譯 CTI論壇(ctiforum.com)5月12日消息（編譯/老秦）:全球商業云通信提供商Vonage（Nasdaq：VG）宣布，符合英國伊斯蘭教法的...

10-19

外呼系統登入（外呼系統搭建）

本文目錄一覽： 1、電腦外呼怎樣運用2、外呼體系怎樣處理？3、外呼體系登錄失利電腦外呼怎樣運用電話外呼體系裝置方法...

11-28

樂創外呼系統（外呼系統怎么安裝）

本篇文章給咱們談談樂創外呼體系，以及外呼體系怎樣裝置對應的知識點，期望對各位有所協助，不要忘了保藏本站喔。本...

05-17

電話機器人是干啥的（電話機器人的號碼從哪來?）

本篇文章給大家談談電話機器人是干啥的，以及電話機器人的號碼從哪來?對應的知識點，希望對各位有所幫助，不要忘了收...

05-16

哈爾濱電銷機器人軟件（企業電銷機器人）

本文目錄一覽： 1、好用一點的電話銷售軟件有哪些? 求推薦!!! 2、2020年，電銷公司用什么電銷軟件比較好？ 3、有什么好用的...

11-25

商標身份建立在商標專長上

除了商標起源之外,商標身份主要建立在商標管理機構專長之上,這種專長源于商標起源,是路徑依賴積累過程的結果,它們展示...

10-23

濟南語音電銷機器人價格（濟南語音電銷機器人價格多少錢）

本篇文章給我們談談濟南語音電銷機器人價格，以及濟南語音電銷機器人價格多少錢對應的知識點，期望對各位有所協助，不...

11-07

北海呼叫中心廠家電銷系統匯港通科技

匯港通科技有限公司移動crm通過大數據、云計算整合云通信，為企業提供整合“員工管理、客戶管理、電話營銷、AI機器人、...

10-31

駐馬店外呼系統企業（企業外呼通話系統）

本文目錄一覽： 1、外呼系統哪家公司做的好？2、現在外呼系統哪家公司做的比較好？3、外呼系統哪家好？4、外呼系統哪家...

11-27

溫州LMS平臺外呼系統

云呼叫中心對銷售和客服助益良多，不僅可以改善售前溝通提升銷售成功率，而且對提高售后服務體驗并促成二次銷售方面也...

11-27

寧波不標記電話群呼系統在哪可以辦理-誠信服務

寧波不標記電話群呼系統在哪可以辦理電銷機器人有電就行了。費用不到人工的一半，也不需要訓練，很快就可以上手，引進...

01-16

工信部通報58款侵害用戶隱私的app，涉及十余家美股、港股、A股上市公司

日前，工信部通報了58款侵害用戶權益行為的APP，其中包括58同城、巨人網絡、迅雷、交通銀行、房多多等十余家上市公司。...

10-13

4G執法記錄儀|執法記錄儀里面的流量卡哪里可以辦理-【51物聯卡】

物聯卡是工業智能設備聯網的首選產品，目前也漸漸被大家所喜歡，不過，對于關注物聯卡的朋友相信也發現了，物聯卡代理...

10-13

奧運會和知識產權（是否允許模仿？）

如果沒有COVID19的傳播，那么到現在在整個日本舉行的奧林匹克運動會以及與奧林匹克有關的銷售和活動中，這將是激動人心...

10-23

谷歌官方應用商店調整算法打擊低質量應用

新浪科技訊北京時間 8 月 4 日早間消息，Google Play應用商店每天都會新增數千款應用，其中許多質量低劣。為了將這些應用清...

10-16

迎賓酒商標保衛戰拉開序幕

來源：新浪網近日，貴州茅臺鎮國威酒業（集團）有限責任公司就“迎賓”酒商標侵權事件提起訴訟，起訴以“貴州省仁懷...

10-23

嬰兒智能電話機器人怎么用（嬰兒智能電話機器人怎么用視頻）

本文目錄一覽：1、人工電話機器人哪家好？2、電話機器人怎么操作?操作難嗎?3、小笨智能機器人怎么用啊?怎么指揮它4、億...

06-20

重慶不標記電話外呼線路便宜-哪家強

重慶不標記電話外呼線路便宜多樣功能。智能機器人有著多樣的功能設置，能帶給大家滿意的體驗。因為智能機器人實現了自...

01-15

外呼系統電銷315（外呼系統電銷下載）

今日給各位共享外呼體系電銷315的常識，其間也會對外呼體系電銷下載進行解說，假如能可巧處理你現在面對的問題，別忘了...

11-07

400開頭的電話號碼怎么收費啊400開頭的電話是全國免費的嗎

(400開頭的電話號碼怎么收費啊)(400開頭的電話是全國免費的嗎)以下內容由巨人小編整理發布。 400電話是企業的熱線電話,40...

01-12

win10創意者更新到底有什么新變化呢?創意者更新變化全部在此

發布獨立安裝的ISO鏡像之后，微軟今天官方宣布，Windows 10 Creators Update創意者更新已經開始通過Windows Update，逐步向全球Wind...

10-19

中國移動啟動100G現網測試上海貝爾率先入場開通

中國移動省際骨干傳送網100G DWDM測試日前拉開帷幕，上海貝爾率先入場并于6月26日正式開通。中國移動此次測試是國內第一個...

01-16

云南日報：騷擾讓“天使”很受傷

今年以來，在中國電信云南百事通信息分公司、被人們譽為“耳麥天使”的114和118114呼叫中心，每天均有1000余個，1至7月共有...

10-19

唐山自動外呼系統（唐山呼叫中心）

本篇文章給大家談談唐山自動外呼系統，以及唐山呼叫中心對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔。本...

02-07

服務外包投資滿意度中國城市成都排第一

記者從昨日舉行的第二屆中印商務論壇上獲悉，全國首個針對服務外包城市舉行的評估活動2012年度中國服務外包城市投資吸...

10-22

虛擬化可為聯絡中心用戶帶來好處

云計算指的是把虛擬服務按需傳輸給客戶；客戶按使用率付費，不必負責購買和維護設備。云服務的供應商可以利用同一臺...

10-20

400開頭的電話在哪里辦理400開頭的電話都是免費的嗎

400開頭的電話在哪里辦理400開頭的電話都是免費的嗎以下內容由巨人小編整理發布。 400電話在哪里辦理都可以。在運營商辦...

02-24

廈門電銷電話機器人穩定嗎（智能電銷機器人可靠嗎）

本文目錄一覽： 1、#電話銷售#現在電話銷售還有前景嗎？2、電話機器人多少錢？貴嘛？3、電銷機器人識別人工語音能力強嗎...

11-27

成都電信AI線路特價-漫談

成都電信AI線路特價因為它是沒有情感的永遠只知道不停地工作，從不會因為受到客戶的拒絕而影響到心情。人工電話銷售每...

01-15

400電話申請，各大企業的選擇

當今社會上，以400為開頭的電話似乎在企業間已經成為了一股熱潮。基本上，所能夠叫得上名字的企業和公司，都有這種電話...

05-16

解決Pytorch半精度浮點型網絡訓練的問題

10-18

本頁收集關于解決Pytorch半精度浮點型網絡訓練的問題的相關信息資訊供網民參考！

推薦文章

上一篇：Python辦公自動化之Excel（中）

下一篇：pytorch 使用半精度模型部署的操作

一起分享吧

婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

解決Pytorch半精度浮點型網絡訓練的問題

用Pytorch1.0進行半精度浮點型網絡訓練需要注意下問題：

看代碼吧~

默認訓練方式是 單精度float32

半精度 model(img.half())

需要注意以下幾點：

默認訓練方式是單精度float32