資料介紹
軟件簡介
TNN是一個移動端高性能、輕量級推理框架,同時擁有跨平臺、高性能、模型壓縮、代碼裁剪等眾多突出優(yōu)勢。TNN框架在原有Rapidnet、ncnn框架的基礎上進一步加強了移動端設備的支持以及性能優(yōu)化,同時也借鑒了業(yè)界主流開源框架高性能和良好拓展性的優(yōu)點。目前TNN已經在手Q、微視、P圖等應用中落地,歡迎大家參與協(xié)同共建,促進TNN推理框架進一步完善。
快速開始
使用 TNN 非常簡單,如果你有一個已經訓練好的模型, 那么一般而言通過以下三個步驟就能完成模型在目標平臺上的部署。
-
第一步是把訓練好的模型轉換成TNN的模型,為此我們提供了豐富的工具來幫助你完成這一步,無論你使用的是 TensorFlow、PyTorch、或者 Caffe,都可以輕松完成轉換。
-
當你完成了模型的轉換,第二步就是編譯目標平臺的 TNN 引擎了,你可以根據自己的目標平臺的硬件支持情況,選擇 CPU/ARM/OpenCL/Metal 等加速方案。 對于這些平臺,TNN 都提供了一鍵編譯的腳本,使用非常方便。
-
最后一步就是使用編譯好的 TNN 引擎進行推理,你可以在自己的應用程序中嵌入對 TNN 的調用,這方面我們提供了豐富而詳實的 demo 來幫助你完成。
技術方案
目前TNN已經在手Q、微視、P圖等應用中落地:
-
計算優(yōu)化
-
低精度優(yōu)化
- 支持 INT8, FP16 低精度計算,減少模型大小、內存消耗,同時利用硬件低精度計算指令加速計算
- 支持 INT8 Winograd 算法,(輸入6bit), 在精度滿足要求的情況下,進一步降低模型計算復雜度
- 支持單模型多種精度混合計算,加速計算同時保證模型精度
-
內存優(yōu)化
- 高效”內存池”實現:通過 DAG 網絡計算圖分析,實現無計算依賴的節(jié)點間復用內存,降低 90% 內存資源消耗
- 跨模型內存復用:支持外部實時指定用于網絡內存,實現“多個模型,單份內存”。
-
主流模型實測性能:v0.1 2020.05.29
-
model cpu time(單線程,ms) gpu time(ms) Mobilenet_v1 88 12 Mobilenet_v1_int8 55 ? Mobilenet_v2 58 11 Mobilenet_v2_int8 41 ? squeezenet_v1.0 127 20 squeezenet_v1.0_int8 82 ? -
驍龍835:
model cpu time(單線程,ms) gpu time(ms) Mobilenet_v1 94 16 Mobilenet_v1_int8 62 ? Mobilenet_v2 61 14 Mobilenet_v2_int8 47 ? squeezenet_v1.0 122 28 squeezenet_v1.0_int8 93 ? -
model cpu time(單線程,ms) gpu time(ms) Mobilenet_v1 60 10 Mobilenet_v1_int8 37 ? Mobilenet_v2 39 8 Mobilenet_v2_int8 28 ? squeezenet_v1.0 74 14 squeezenet_v1.0_int8 56 ?
-
-
TNN架構圖:
?
-
通過 ONNX 支持 TensorFlow, PyTorch, MXNet, Caffe 等多種訓練框架,充分利用和融入不斷完善的 ONNX 開源生態(tài)。當前支持 ONNX 算子55個,近期會完善到約80個,覆蓋主流CNN網絡
-
支持主流安卓、iOS、Embedded Linux 操作系統(tǒng),支持 ARM CPU, GPU 硬件平臺(近期還會加入達芬奇 NPU 支持)
-
模塊化設計,將模型解析、計算圖構建、優(yōu)化、底層硬件適配、高性能 kernel 實現各部分抽象隔離,通過 Factory Mode 注冊、構建設備,方便接入更多的底層硬件、加速方案。
-
Runtime 無任何第三方庫依賴,CPU 動態(tài)庫尺寸僅約 400KB,并提供基礎圖像變換操作,調用簡單便捷??缙脚_模型統(tǒng)一、調用接口統(tǒng)一,通過單個配置參數快速切換。
- 納米框架Esp32開源分享
- 開源霧計算軟件框架FogLAMP介紹(二):FogLAMP介紹
- 開源霧計算軟件框架FogLAMP介紹(三):FogLAMP架構分析
- 移動端基于GPU推理的神經網絡推理框架
- 端側softmax推理的數學等價優(yōu)化
- 開源網絡協(xié)議分析器WireShark軟件下載 15次下載
- 跨媒體數據分析與推理技術綜述 15次下載
- 一種基于框架特征的共指消解方法 7次下載
- 如何使用物聯(lián)網操作系統(tǒng)Zephyr實現“連續(xù)集成”開源軟件的詳細說明
- 基于改進模糊熵和證據推理的多屬性決策方法 1次下載
- 網絡資源分配框架的軟件設計和應用 10次下載
- 移動機器人軟件框架構思詳細資料免費下載 11次下載
- AN1292與電機控制應用程序框架對比 2次下載
- 達芬奇軟件框架技術融入共享內存技術進行數據交換的改進中文概述 4次下載
- 從ResearchKit應用探討移動醫(yī)療的發(fā)展 0次下載
- 用于SLAM中點云地圖綜合評估的開源框架 294次閱讀
- 使用OpenVINO C++在哪吒開發(fā)板上推理Transformer模型 384次閱讀
- 澎峰科技高性能大模型推理引擎PerfXLM解析 522次閱讀
- SemiDrive X9 AI 開發(fā)環(huán)境搭建 420次閱讀
- Torch TensorRT是一個優(yōu)化PyTorch模型推理性能的工具 1871次閱讀
- 全平臺系統(tǒng)開源免費抓包軟件ProxyPin概述 2039次閱讀
- 三種主流模型部署框架YOLOv8推理演示 2786次閱讀
- 騰訊開源的前端框架介紹 2196次閱讀
- PyTorch開源深度學習框架簡介 4503次閱讀
- 移植開源Gui框架GuiLite到STM32F4OLED屏幕 3622次閱讀
- 谷歌重新定義開源軟件漏洞治理框架 2765次閱讀
- Facebook與CMU聯(lián)手打造開源框架PyRobot 3875次閱讀
- NASA的開源軟件是什么?NASA的開源軟件的詳細分析 7444次閱讀
- 將TVM用于移動端常見的ARM GPU,提高移動設備對深度學習的支持能力 1w次閱讀
- 紅帽推出Ansible 2.2 :為開源自動化框架奠定牢靠的基礎 1022次閱讀
下載排行
本周
- 1DD3118電路圖紙資料
- 0.08 MB | 1次下載 | 免費
- 2AD庫封裝庫安裝教程
- 0.49 MB | 1次下載 | 免費
- 3PC6206 300mA低功耗低壓差線性穩(wěn)壓器中文資料
- 1.12 MB | 1次下載 | 免費
- 4網絡安全從業(yè)者入門指南
- 2.91 MB | 1次下載 | 免費
- 5DS-CS3A P00-CN-V3
- 618.05 KB | 1次下載 | 免費
- 6海川SM5701規(guī)格書
- 1.48 MB | 次下載 | 免費
- 7H20PR5電磁爐IGBT功率管規(guī)格書
- 1.68 MB | 次下載 | 1 積分
- 8IP防護等級說明
- 0.08 MB | 次下載 | 免費
本月
- 1貼片三極管上的印字與真實名稱的對照表詳細說明
- 0.50 MB | 103次下載 | 1 積分
- 2涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 89次下載 | 1 積分
- 3錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 43次下載 | 1 積分
- 4錦銳CA51F005 SDK開發(fā)包
- 19.47 MB | 19次下載 | 1 積分
- 5PCB的EMC設計指南
- 2.47 MB | 16次下載 | 1 積分
- 6HC05藍牙原理圖加PCB
- 15.76 MB | 13次下載 | 1 積分
- 7802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費
- 8蘋果iphone 11電路原理圖
- 4.98 MB | 6次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關降壓/升壓雙向直流/直流轉換器 PCB layout 設計
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191390次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81588次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65989次下載 | 10 積分
評論