亚洲av成人精品日韩一区,97久久久精品综合88久久,玩弄japan白嫩少妇hd,亚洲av片不卡无码久久,玩弄人妻少妇500系列

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

DIri_ALIFPGA ? 來源:網(wǎng)絡整理 ? 作者:工程師陳翠 ? 2018-07-23 09:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

概述

卷積是一種線性運算,其本質(zhì)是滑動平均思想,廣泛應用于圖像濾波。而隨著人工智能深度學習的發(fā)展,卷積也在神經(jīng)網(wǎng)絡中發(fā)揮重要的作用,如卷積神經(jīng)網(wǎng)絡。本參考設計主要介紹如何基于INTEL 硬浮點的DSP Block實現(xiàn)32位單精度浮點的卷積運算,而針對定點及低精度的浮點運算,則需要對硬浮點DSP Block進行相應的替換即可。

原理分析

設:f(x), g(x)是兩個可積函數(shù),作積分:

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

隨著x的不同取值,該積分定義了一個新的函數(shù)h(x),稱為函數(shù)f(x)與g(x)的卷積,記為h(x)=f(x)*g(x)。

如果卷積的變量是序列x(n)和h(n),則卷積的結(jié)果為

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

其中*表示卷積。因此兩個序列的卷積,實際上就是多項式的乘法,用個例子說明其工作原理。a = [7,5,4]; b = [6,7,9];則實現(xiàn)a和b的卷積,就是把a和b作為一個多項式的系數(shù),按多項式的升冪或降冪排列,即為:

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

因此得到a*b=[42,79,122,73,36];與Matlab運算結(jié)果一致。而二維卷積可以采用通用多項式乘積方法實現(xiàn)卷積運算。

基于INTEL FPGA的實現(xiàn)分析

如上我們確定了兩個序列的卷積等同于兩個多項式的乘法,因此當我們需要計算序列[a0,a1,a2, …,an-1]與[b0,b1,b2, …,bn-1]的卷積結(jié)果時,可以成立a,b兩個n階多項式,如下所示:

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

則[a0,a1,a2, …,an-1]與[b0,b1,b2, …,bn-1]的卷積結(jié)果即為由a*b得到的多項式的各項系數(shù)所組成的序列。令c=a*b,得到

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

則由多項式c的各階系數(shù)所組成的新的序列[c0,c1,c2, …,c2n-1]即為[a0,a1,a2, …,an-1]與[b0,b1,b2, …,bn-1]的卷積結(jié)果。則按照高階多項式計算展開可得到:

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

┆┆

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

┆┆

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

因此卷積的運算可以轉(zhuǎn)化為行向量與列向量相乘的結(jié)果,即乘累加的運算結(jié)構(gòu)。

Intel FPGA在Arria10DSP Block中首次支持了單精度硬浮點DSP block,是行業(yè)內(nèi)第一個支持單精度DSP block,硬浮點DSP block架構(gòu)如圖1所示:

基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算詳解

圖1 硬浮點DSPblock架構(gòu)

硬浮點DSP Block包含硬浮點乘法器,硬浮點加法器,支持乘累加運算,因此采用硬浮點DSPblock實現(xiàn)行列向量相乘是非常好的方式。下面我們針對一個實際的卷積運算,介紹如何基于INTEL硬浮點DSP block實現(xiàn)。假設我們需要求隨機數(shù)組a=[4,8,9,11]與b=[10,5,7,13]的卷積運算結(jié)果,則根據(jù)上面的分析,保持數(shù)組a順序不變,而數(shù)組b需根據(jù)上述分析結(jié)果,針對每一個卷積結(jié)果產(chǎn)生新的序列。所以整個實現(xiàn)包括數(shù)列重組模塊和硬浮點乘法器模塊及輸出處理。下面是實現(xiàn)框圖及仿真結(jié)果。

圖2 實現(xiàn)框圖

圖3 Modelsim仿真結(jié)果

仿真結(jié)果與Matlab實現(xiàn)結(jié)果一致,并且該設計中充分考慮了FPGA并行擴展特性,對于低速率要求的設計可采用DSP Block復用的方式節(jié)約DSP block數(shù)量。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • dsp
    dsp
    +關注

    關注

    556

    文章

    8158

    瀏覽量

    357785
  • FPGA
    +關注

    關注

    1646

    文章

    22053

    瀏覽量

    618765
  • intel
    +關注

    關注

    19

    文章

    3496

    瀏覽量

    188507

原文標題:基于INTEL FPGA硬浮點DSP實現(xiàn)卷積運算

文章出處:【微信號:ALIFPGA,微信公眾號:FPGA極客空間】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【中科昊芯Core_DSC280025C開發(fā)板試用體驗】+1.開箱之浮點計算對比

    DSC280025****浮點運算性能 DSP的方案使用的中科昊芯,主頻160MHZ,我準備用相同的方式,分別1千萬次相同的 浮點 加、減、乘、除,并用定時器記錄中斷次數(shù)和時間。 本
    發(fā)表于 06-29 10:01

    進群免費領FPGA學習資料!數(shù)字信號處理、傅里葉變換與FPGA開發(fā)等

    ~ 01、數(shù)字信號處理的FPGA實現(xiàn) 旨在講解前端數(shù)字信號處理算法的高效實現(xiàn)。首先概述了當前的FPGA技術、器件以及用于設計最先進DSP
    發(fā)表于 04-07 16:41

    FCP32C335——對標TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設備!

    FCP32C335以TMS320F28335為標桿,搭載150MHz主頻的32位浮點處理單元(FPU),支持單周期32×32位乘法運算,單精度浮點運算效率達300 MFLOPS。與定點
    的頭像 發(fā)表于 03-07 10:45 ?641次閱讀
    FCP32C335——對標TI TMS320F28335的高性能<b class='flag-5'>DSP</b>芯片,賦能工業(yè)控制與智能設備!

    如何使用MATLAB實現(xiàn)一維時間卷積網(wǎng)絡

    本文對一維卷積操作進行介紹,包括一維擴展卷積和一維因果卷積,以及 MATLAB 對一維卷積的支持情況。在最后通過一個實例演示如何在 MATLAB 中將一維
    的頭像 發(fā)表于 03-07 09:15 ?1092次閱讀
    如何使用MATLAB<b class='flag-5'>實現(xiàn)</b>一維時間<b class='flag-5'>卷積</b>網(wǎng)絡

    FPGA圖像處理基礎----實現(xiàn)緩存卷積窗口

    像素行與像素窗口 一幅圖像是由一個個像素點構(gòu)成的,對于一幅480*272大小的圖片來說,其寬度是480,高度是272。在使用FPGA進行圖像處理時,最關鍵的就是使用FPGA內(nèi)部的存儲資源對像
    的頭像 發(fā)表于 02-07 10:43 ?844次閱讀
    <b class='flag-5'>FPGA</b>圖像處理基礎----<b class='flag-5'>實現(xiàn)</b>緩存<b class='flag-5'>卷積</b>窗口

    FPGA在AI方面有哪些應用

    提供了強有力的支持。 一、FPGA 在深度學習中的應用 深度學習是 AI 的重要分支,涉及海量的數(shù)據(jù)運算。FPGA 能夠針對深度學習算法中的卷積、池化等核心
    的頭像 發(fā)表于 01-06 17:37 ?1408次閱讀

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則
    的頭像 發(fā)表于 11-16 12:51 ?945次閱讀
    <b class='flag-5'>FPGA</b>中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA浮點四則運算實現(xiàn)過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則
    的頭像 發(fā)表于 11-16 11:19 ?1440次閱讀
    <b class='flag-5'>FPGA</b>中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的<b class='flag-5'>實現(xiàn)</b>過程

    卷積神經(jīng)網(wǎng)絡的基本原理與算法

    ),是深度學習的代表算法之一。 一、基本原理 卷積運算 卷積運算卷積神經(jīng)網(wǎng)絡的核心,用于提取圖像中的局部特征。 定義
    的頭像 發(fā)表于 11-15 14:47 ?1789次閱讀

    【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】在M23內(nèi)核上使用qfplib浮點運算庫進行浮點運算

    運算。難道由于硬件不支持FPU, 常用的M0/M0+/M23/M3內(nèi)核就無緣浮點運算了呢?答案是顯然不是的。 我們可以移植使用開源的qfplib庫來實現(xiàn)
    發(fā)表于 11-05 22:07

    FPGA加速深度學習模型的案例

    FPGA(現(xiàn)場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于FPGA的AlexNet卷積
    的頭像 發(fā)表于 10-25 09:22 ?1242次閱讀

    如何使用高性能浮點TMS320C67x DSP立即開始開發(fā)

    電子發(fā)燒友網(wǎng)站提供《如何使用高性能浮點TMS320C67x DSP立即開始開發(fā).pdf》資料免費下載
    發(fā)表于 10-17 09:35 ?0次下載
    如何使用高性能<b class='flag-5'>浮點</b>TMS320C67x <b class='flag-5'>DSP</b>立即開始開發(fā)

    TMS320C6748定點和浮點DSP數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6748定點和浮點DSP數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 10:57 ?0次下載
    TMS320C6748定點和<b class='flag-5'>浮點</b><b class='flag-5'>DSP</b>數(shù)據(jù)表

    TMS320C6742定點和浮點DSP數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6742定點和浮點DSP數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 09:57 ?0次下載
    TMS320C6742定點和<b class='flag-5'>浮點</b><b class='flag-5'>DSP</b>數(shù)據(jù)表

    TMS320C6746定點和浮點DSP數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6746定點和浮點DSP數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 08-07 09:55 ?0次下載
    TMS320C6746定點和<b class='flag-5'>浮點</b><b class='flag-5'>DSP</b>數(shù)據(jù)表