OneFlow v0.9.0正式發(fā)布

來源：CSDN博客 | 2023-01-30 08:46:59 |

今天是 OneFlow 開源的第 903 天，OneFlow v0.9.0 正式發(fā)布。本次更新包含 640 個 commit，完整更新列表請查看鏈接：https://github.com/Oneflow-Inc/oneflow/releases/tag/v0.9.0，歡迎下載體驗新版本，期待你的反饋。

OneFlow v0.9.0?主要包括以下新增亮點功能和優(yōu)化：

1. PyTorch 兼容性

(相關(guān)資料圖)

OneFlow 對 PyTorch API 和模型的兼容性進一步提升。新增與 PyTorch 對齊的 86 個 API 接口和算子，修復(fù)了 104 個算子兼容性相關(guān)的 bug。支持更多的 PyTorch 模型一鍵遷移成 OneFlow 模型，并獲得性能加速。

支持 Stable Diffusion、GLM、YOLOv5等模型一鍵遷移為 OneFlow 模型

oneflow.load?支持直接加載?torch.save?的模型，模型遷移更方便

新增?oneflow.mock_torch?模塊與?mock?方法（https://docs.oneflow.org/master/cookies/oneflow_torch.html），可以在不改變 PyTorch 的原始腳本的情況下，一鍵遷移包含多個腳本的復(fù)雜 PyTorch 模型。

2. 分布式編程易用性

Global Tensor 新增一系列方便分布式編程的接口與方法，并且修復(fù)了已知的相關(guān) bug。

3. 支持自動并行

Graph 發(fā)布自動并行新特性（version 1）， 支持在指定 Placement 下自動搜索速度最快的 SBP 組合，使用 Global Tensor 編寫分布式模型無需糾結(jié)是數(shù)據(jù)并行、模型并行還是混合并行。

文檔參見：https://oneflow.readthedocs.io/en/master/auto_parallel.html

4. 性能優(yōu)化

Graph 新增一系列與內(nèi)存、執(zhí)行速度、流水掩蓋、編譯速度相關(guān)的優(yōu)化，提升性能，降低顯存開銷。

新增一系列算子優(yōu)化與系統(tǒng)優(yōu)化，包括 Eager 的指令調(diào)度、高性能 CUDA kernel 、多內(nèi)存池打通等。

相比原始的基于 PyTorch、DeepSpeed、Apex 的 GLM 實現(xiàn)，基于OneFlow v0.9.0 訓(xùn)練GLM-large（335M）?預(yù)訓(xùn)練模型，在簡單調(diào)優(yōu)后性能最高提升 3 倍，顯存節(jié)省 1/3。

而在 Stable Diffusion 推理的性能表現(xiàn)上，在 A100 顯卡，無論是 PCIe 40GB 還是 SXM 80GB 的配置，相比其他深度學(xué)習(xí)框架或編譯器，OneFlow?的性能都是最快的。

5. 調(diào)試功能

Graph 提供一系列輔助調(diào)試的功能，包括：內(nèi)存分析日志、編譯階段進度顯示、計算圖展示等。

6. IR

OneFlow IR 支持 JIT 編譯 LR 代碼、分布式描述 SBP signature 以及新增 OKL Dialect 等更多編譯優(yōu)化功能。

7. OneFlow-ONNX 工具

OneFlow-ONNX?v0.6.0 版本發(fā)布，提升了轉(zhuǎn)換接口的易用性，開發(fā)了多個新的特性，并新增支持?6 種模型以及 20 余種 Op，以及修復(fù) 6 個轉(zhuǎn)換過程中的 bug。pip install oneflow-onnx==0.6.0?一鍵安裝使用?。

倉庫地址：https://github.com/Oneflow-Inc/oneflow_convert

8. 報錯信息提示

報錯信息提示更加友好，支持高亮顯示報錯內(nèi)容，簡化大量系統(tǒng)內(nèi)部信息細(xì)節(jié)，可以直觀地了解出錯的位置和類型。

完整版 OneFlow v0.9.0 更新內(nèi)容請查看：https://github.com/Oneflow-Inc/oneflow/releases/tag/v0.9.0

感謝以下貢獻者：

liujuncheng, BBuf, wyg1997, jackalcooper, Flowingsun007, clackhan, daquexian, marigoold, lixinqi, guo-ran, hjchen2, strint, ouyangyu, MARD1NO, small1945, reygu, Ldpe2G, leaves-zwx, Yipeng1994, zhongshsh, lixiang007666, mosout, chengtbf, hhhfccz, doombeaker, howin98, xiacijie, farmerzhang1, shangguanshiyuan, JasonChen9, liufengwei0103, youxiudeshouyeren, laoliu97, EsdeathYZH, rejoicesyc, AsakusaRinne, LijunZhang01, Chenqll, xiezipeng-ML, simonJJJ, ShawnXuan ?

其他人都在看

2023年AI十大展望：GPT-4領(lǐng)銜大模型變革

李白：你的模型權(quán)重很不錯，可惜被我沒收了

OpenAI掌門Sam Altman：AI下一個發(fā)展階段

比快更快，開源Stable Diffusion刷新作圖速度

OneEmbedding:單卡訓(xùn)練TB級推薦模型不是夢

GLM訓(xùn)練加速：性能最高提升3倍，顯存節(jié)省1/3

“零”代碼改動，靜態(tài)編譯讓太乙Stable Diffusion推理速度翻倍

歡迎Star、試用OneFlow最新版本：https://github.com/Oneflow-Inc/oneflow/https://github.com/Oneflow-Inc/oneflow/

關(guān)鍵詞：正式發(fā)布 OneFlow

OneFlow v0.9.0正式發(fā)布

歡迎Star、試用OneFlow最新版本：https://github.com/Oneflow-Inc/oneflow/https://github.com/Oneflow-Inc/oneflow/

本周資訊推薦

2020上半年全球企業(yè)區(qū)塊鏈發(fā)明專利排行榜：阿里巴巴以1457件位列第一

數(shù)據(jù)：區(qū)塊鏈相關(guān)企業(yè)目前共有4.56萬家在業(yè)存續(xù)的超過4萬家

2020年區(qū)塊鏈領(lǐng)域全球授權(quán)專利報告：支付寶以212件專利數(shù)位列全球第一

米粉節(jié)神秘大獎：小米3萬元全屋智能產(chǎn)品僅需1元

考拉海購宣布升級商品全鏈路溯源系統(tǒng) 引入?yún)^(qū)塊鏈溯源技術(shù)

熱點資訊

公牛wifi智能插座2代怎么樣公牛wifi智能插座2代選擇

evd支持什么格式一文帶你詳細(xì)了解-前沿?zé)狳c

三星藍調(diào)NV10鏡頭蓋開啟是怎么回事解決方法教給你-世界熱訊

三星galaxynote1平板電腦怎么樣？配置方面介紹-世界快看

47寸液晶電視尺寸多大 47寸液晶電視尺寸價格值得購買嗎-天天百事通

OneFlow v0.9.0正式發(fā)布

歡迎Star、試用OneFlow最新版本：https://github.com/Oneflow-Inc/oneflow/https://github.com/Oneflow-Inc/oneflow/

圖片推薦

要聞

本周資訊推薦

熱點資訊

歡迎Star、試用OneFlow最新版本：https://github.com/Oneflow-Inc/oneflow/https://github.com/Oneflow-Inc/oneflow/