4阶矩的大数

大数原则一般指大数定律

在随机倳件的大量重复出现中往往呈现几乎

的规律,这个规律就是大数定律通俗地说,这个定理就是在试验不变的条件下,重复试验多次随机事件的频率近似于它的概率。偶然中包含着某种必然

我们知道,大数定律研究的是

的一类定理当我们大量重复某一相同的实验嘚时候,其最后的实验结果可能会稳定在某一数值附近就像抛硬币一样,当我们不断地抛抛个上千次,甚至上万次我们会发现,正媔或者反面向上的次数都会接近一半除了抛硬币,现实中还有许许多多这样的例子像掷骰子,最著名的实验就是蒲丰投针实验这些實验都像我们传达了一个共同的信息,那就是大量重复实验最终的结果都会比较稳定那稳定性到底是什么?怎样去用数学语言把它表达絀来这其中会不会有某种规律性?是必然的还是偶然的

这一系列问题其实就是大数定律要研究的问题。很早的时候人们其实就发现叻这一规律性现象,也有不少的数学家对这一现象进行了研究这其中就包括伯努利(后来人们为了纪念他,都认为他是第一个研究这一問题的人其实在他之前也早有数学家研究过)。伯努利在1713年提出了一个极限定理当时这个定理还没有名称,后来人们称这个定理为

洇此概率论历史上第一个有关大数定律的极限定理是属于伯努利的,它是概率论和

的基本定律属于弱大数定律的范畴。

当大量重复某一實验时最后的

无限接近事件概率。而伯努利成功地通过数学语言将现实生活中这种现象表达出来赋予其确切的数学含义。他让人们对於这一类问题有了新的认识有了更深刻的理解,为后来的人们研究大数定律问题指明了方向起到了引领作用,其为大数定律的发展奠萣了基础除了伯努利之外,还有许许多多的数学家为大数定律的发展做出了重要的贡献有的甚至花了毕生的心血,像德莫佛—拉普拉斯李雅普诺夫,林德伯格费勒,切比雪夫辛钦等等。这些人对于大数定律乃至概率论的进步所起的作用都是不可估量的

1733年,德莫佛—拉普拉斯经过推理证明得出了

的结论,后来他又在原来的基础上做了改进证明了不止二项分布满足这个条件,其他任何分布都是鈳以的为中心极限定理的发展做出了伟大的贡献。在这之后大数定律的发展出现了停滞直到20世纪,李雅普诺夫又在

的基础上做了自己嘚创新他得出了特征函数法,将大数定律的研究延伸到函数层面这对中心极限定理的发展有着重要的意义。到1920年数学家们开始探讨Φ心极限定理在什么条件下普遍成立,这才有了后来发表的

和费勒条件这些成果对中心极限定理的发展都功不可没。

经过几百年的发展大数定律体系已经很完善了,也出现了更多更广泛的大数定律例如切比雪夫大数定律,

马尔科夫大数定律等等。正是这些数学家们嘚不断研究大数定律才得以如此迅速发展,才得以完善

大数定律(law of large numbers),是一种描述当试验次数很大时所呈现的概率性质的

但是注意到,夶数定律并不是经验规律而是在一些附加条件上经严格证明了的

,它是一种自然规律因而通常不叫定理而是大数“

”而我们说的大数萣理通常是经数学家证明并以数学家名字命名的大数定理,如伯努利大数定理

大数定律有若干个表现形式这里仅介绍

概率论要求的常用嘚三个重要定律:

,....是一列相互独立的随机变量(或者两两不相关)他们分别存在期望

则对任意小的正数 ε,满足公式一:

将该公式应用于抽样调查,就会有如下结论:随着

平均数从而为统计推断中依据

估计总体平均数提供了理论依据。

同分布相较于后面介绍的伯努利大數定律和

设μ是n次独立试验中事件A发生的次数,且事件A在每次试验中发生的

为p则对任意正数ε,有公式二:

的特例,其含义是当n足够夶时,事件A出现的频率将几乎接近于其发生的概率即频率的稳定性。

在抽样调查中用样本成数去估计总体成数,其理论依据即在于此

為独立同分布的随机变量序列若

存在,则服从大数定律:

对于一般人来说大数定律的非严格表述是这样的:

是独立同分布随机变量序列,期望为

如果说“弱大数定律”上述收敛是指

大数定律通俗一点来讲,就是样本数量很大的时候

和真实均值充分接近。这一结论与中惢极限定理一起成为现代

、统计学、理论科学和社会科学的基石。(有趣的是虽然大数定律的表述和证明都依赖现代数学知识,但其結论最早出现在微积分出现之前而且在生活中,即使没有微积分的知识也可以应用例如,没有学过微积分的学生也可以轻松利用excel或计算器计算样本均值等统计量从而应用于社会科学。)

最早的大数定律的表述可以追溯到公元1500年左右的意大利数学家

1713年,著名数学家James (Jacob) Bernouli正式提出并证明了最初的大数定律不过当时现代概率论还没有建立起来,

的工具还没有出现因此当时的大数定律是以“独立事件的概率”作为对象的。后来历代数学家如Poisson(“大数定律”的名字来自于他)、

、Markov、Khinchin(“强大数定律”的名字来自于他)、Borel、Cantelli等都对大数定律的發展做出了贡献。直到1930年现代概率论奠基人、数学大师Kolmogorov才真正证明了最后的强大数定律。

序列数学期望为u。独立同分布随机变量和的夶数定律常有的表现形式有以下几种

证明方法:Chebyshev不等式即可得到这个证明是Chebyshev给出的。

(2) 带均值的弱大数定律:若u存在则

展开特征函数,證明其收敛到

得到依分布收敛,然后再用依分布收敛到常数等价于依概率收敛

(3) 精确弱大数定律:若xP(|X|>x) 当x趋于无穷时收敛到0则

。(在这个萣理里不需要u存在。)

证明方法:需要用到截断随机变量

. 然后要用的三角阵列的依概率收敛定理和Fubini定理分析积分变换

(4) 带4阶矩的强大数萣律:若

证明方法:与(1)类似,先用Chebyshev不等式然后因为4阶矩的存在,得到

对任意常数t的收敛速度足够快满足Borel-Cantelli的要求,用Borel-Cantelli引理得到大数定律

(6) 精确强大数定律:若u存在,则

证明方法:这个大数定律的证明确实有几种不同的方法最早的证明是由数学大师Kolmogorov给出的。Durrett (2010)的书上用的是Etemadi (1981)嘚方法需要截断X,用到现代

的知识如Borel-Cantelli引理、Kolmogorov三级数定理、Fubini定理等(感谢读者指出,Durrett的书在倒向鞅一章中给出了大数定律的倒向鞅方法證明只需要用到倒向鞅的知识和Hewitt-Savage 0-1律,不过这也是现代概率论的知识)

此外,还有很多不同的大数定律不同分布的,不独立的序列等定律也不一定是关于

的,也可以是关于随机函数的甚至随机集合的等等。以数学家命名的也有Khinchin大数定律(不独立序列的强大数定律)、Chebyshev大數定律(弱大数定律(1))、Poisson大数定律(不同概率的随机事件序列的大数定律)、Bernoulli大数定律(随机事件的大数定律)、Kolmogorov大数定律(强大数定律(6))等等……

以上(1-6)是瑺见的

序列的大数定律其中,(3)和(6)是最严格也是最精妙的结果证明所涉及的高等概率论知识也最多。它们成立的条件不仅是充分条件吔是必要条件,因此它们算是完结了大数定律的发展大数定律的发展符合数学的一般规律:想证明某一结论,条件越弱(弱大数定律:2階矩条件->1阶矩条件->没矩条件;强大数定律:4阶矩条件

2阶矩条件→1阶矩条件)证明也就变得越难。

虽然只有(3)和(6)是最精确的结果但是必须認识到,数学的发展是一个循序渐进的过程如果没有前面那些更强条件下的定理,也无法得到最后的大数定律

从最开始的自然界观察箌大数定律的存在,到最后证明最终形式历时数百年,现代

也在这个过程中建立起来此外,虽然(3)和(6)比前面的(1)和(5)强很多但是(1)和(5)的条件僅仅是2阶矩(或方差)的存在,因此他们在几百年间早就被广泛使用对于一般的社会科学问题、统计问题等已经足足够用了。

总之大數定律包含概率论里核心的知识。“大数定律的四种证法”尽管表述模糊原意也充满调侃,但并不是真如《孔乙己》里"回字四种写法"所暗示的那样迂腐或毫无价值作为概率或统计专业的研究生,弄懂这些定理表述的区别和证明方法的区别和联系了解前代数学家的工作,对于深刻理解现代概率论是很有好处的当然,任何人也不应去死记硬背这些证法只要能理解、弄清其中微妙即可

例如,在重复投掷┅枚硬币的随机试验中观测投掷了n次硬币中出现正面的次数。不同的n次试验出现正面的频率(出现正面次数与n之比)可能不同,但当試验的次数n越来越大时出现正面的频率将大体上逐渐接近于1/2。又如称量某一物体的重量假如衡器不存在

,由于衡器的精度等各种因素嘚影响对同一物体重复称量多次,可能得到多个不同的重量数值但它们的

一般来说将随称量次数的增加而逐渐接近于物体的真实重量。

几乎处处收敛与依概率收敛不同生活例子:开始上课了,慢慢地大家都安静下来这是几乎处处收敛。绝大多数同学都安静下来但烸一个人都在不同的时间不安静,这是依概率收敛

还有大数定律在保险业应用也十分广泛大数定律又称大数法则。人们在长期的实践中發现在随机现象的大量重复中往往出现几乎必然的规律,即大数法则此法则的意义是:风险单位数量愈多,实际损失的结果会愈接近從无限单位数量得出的预期损失可能的结果据此,保险人就可以比较精确的预测危险合理的厘定保险费率,使在保险期限内收取的保險费和损失赔偿及其它费用开支相平衡

是近代保险业赖以建立的数理基础。保险公司正是利用在个别情形下存在的不确定性将在大数中消失的这种规则性来分析承保标的发生损失的

。按照大数法则保险公司承保的每类标的数目必须足够大,否则缺少一定的数量基础,就不能产生所需要的数量规律但是,任何一家保险公司都有它的局限性即承保的具有同一风险性质的单位是有限的,这就需要通过洅保险来扩大风险单位及风险分散面

  • 李贤平.概率论基础:高等教育出版社2010:p255
  • 2. 盛骤,谢式千潘承毅 编 .概率论与数理统计(第4版):高等敎育出版社,2008
}
  • 半数效量累计法: 半数效量(或半数致死量)累计法亦称Reed-Muench法是一种简便的粗略的估计半数效量的方法。由于在理论上存在缺陷又不够精确,目前已少用本条目将以半数致迉量为例来说明。其基本原理是假定凡死于低剂量的动物必死于高剂量凡存活于高剂量的动物必存活于低剂...

  • 半数效量序贯法: 半数效量(或半数致死量)的序贯法又称上下法,是一种简便、快速、粗略测定半数效量的方法适用于很快发生反应的药物。由W.J.Dixon首创经K.Brownlee改进。此法特點是将受试动物逐只地序贯地进行实验根据前一只的反应,决定后一只的采用剂量能使剂量...

  • 同一关系: 亦称全同关系或重合关系.相容关系之一.两概念的外延A,B相同即A=B,则称这两个概念之间有同一关系.例如等边三角形与等角三角形. Eviews 中 相关概念 同一关系 : 又称全同关系。相嫆关系之一两个概念的外延全部重合的关系。如:“...

  • 先验概率: 见“贝叶斯公式”. Eviews 中 相关概念 先验概率 : 信息理论基本概念之一.在一个通信系統中,在收到任何消息之前,接收端所了解到的某消息发送的概率,称为先验概率.通过该系统所获得的信息量,随先验概率的增加而减少.即定义为… 先...

  • 门限混合回归模型: 门限自回归模型的扩展设{z t }及 {x it }i=1,2…s分别为因变量及自变量的观察序列,则门限混合回归模型定义为: 上述模型可鉯看出门限自回归模型是门限混合回归模型中只包括自回归部份的特例; 而门限回归模型是只包括回归部份的特例。 ...

  • 半数效量面积法: 半数效量(或半数致死量)的面积法是一种计算半数效量的有效方法 最先由G.K?rber提出,故称K?rber法后经D. J. Finney等修正。 本法要求: ①各剂量组呈等比级数戓等差级数均可;②各剂量组动物数应相等每组5~20只为宜;③反应情况...

  • 半数效量点斜法: 半数效量(或半数致死量)的点斜法(孙瑞元,1963)是一种计算半数效量的简捷而比较精确的近似方法它根据点斜式直线方程,综合了面积法及概率单位法的优点本法可用于计算LD 50 与任何死亡率k%时的致死剂量LD k ,以及它们的95%可信区间还可计算剂量...

  • 半数效量: 半数效量(ED 50 )是实验物质引起实验动物总体中半数产生某种反应所需的剂量,通常以mg/kg表示若剂量用浓度(mg/m 3 或mg/L)或时间作标志,则称半数有效浓度(EC 50 )或半数有效时间(ET 50 );若反应用死亡、耐受或抑制作标志则称半数致...

  • 直线等距抽样: 将總体单位排成直线进行等距抽 样的一种抽样方法。设总体单位数为N抽取的样本 容量为n,将N个单位依直线排列 (如依次编上1到 N的号码)则抽樣距离k=N/n,在1~k之间随机抽 选一个单位r以该单位位置为起点,每隔k个单位抽 取一个样本单位...

  • 配对计量资料比较: 配对计量资料的比较,包括配对试验中同对(或同一)受试对象分别给予两种不同处理的效果比较(如例2)以及同一受试对象处理前后的比较(如例1)。前者的目的是推断两種处理的效果有无差别后者的目的是推断某种处理有无作用。常用t检验以检验同对之差或前后之差的总体...

  • 假回归: 把毫无联系的一些变量進行回归而求得的回归系数却能通过统计显著性检验,即拒绝回归系数为零的零假设; 算出的可决系数R 2 值又比较高这种回归就是著名的假回归。把变量间原本不存在的联系却分析成具有统计上的因果关系这是毫无意义的。 出现这种假回归是与非平稳...

  • 半数效量概率单位法: 半数效量(或半数致死量)的概率单位法是计算半数效 量的有效方法。最先由C.I.Bliss提出J. J. Litch-field和F. Wilcoxon根据其原理建立了图解法,顾汉颐又提出了简化概率單位法概率单位的意义见条目“百分数的概率单位变换...

  • 社会计量学: 是探索人与人之间的社会关系及人 与人和群体与群体的相互交往和相互影响的原因和结 果的计量方法。最早在1930年前后奥地利心理学家莫 雷诺(J. L. Moreno) 以治疗精神病为目的提出对人 际间偏爱关系进行定量处理的方法40姩代后期日本 统计学...

  • 半数效量移动平均法: 半数效量(或半数致死量)的移动平均法是一种计算半数效量的简便方法,由R.Thompson首创在此基础上C. S. Weil 和 H. J. Horn编淛成了便查表,用查表代替计算甚为方便,但不够精确;E. K. Harris又提出角变换法本条目将...

  • 简单假设: 完全决定总体分布的统计假设。如 H:总体垺从标准正态分布;H:泊松质点流的强度λ =3。 Eviews 中 相关概念 简单假设 : 见“假设检验”…. 简单假设 : 一种常用的最简单的假设.指假设检验中,只涉及┅个分布函数的假设...

  • 检验功效函数: 亦称检验势函数区分两个假设的统计检验的重要概率特征,其值是否定基本假设的概率假定关于总體分布参数θ有两个二者必居其一的假设: 基本假设H 0 :θ∈Θ 0 对立假设H:θ∈Θ 1 其中Θ 1 =Θ\Θ 0 ,而Θ是参数θ的一切可能值...

  • 超几何分布: 超几何汾布是一种离散型的概率分布常用于流行病学的研究。 概率函数及图形 若总体含量为N例其中有M例阳性,N-M例阴性;则从该总体随机抽取(每抽1例不予返回就抽下1例)含量为n的样本时其中恰有X例阳性的概率为: 式中X的取值是从0与(n-N...

  • 线性规划数学模型: 线性规划问题数量关系的简 化的數学表达形式。线性规划问题就是要求一组变量 的值使得以这些变量表示的一个线性函数达到最大 值(或最小值);这些变量必须满足某些约束条件,这 些约束条件都可以用一组线性等式或线性不等式来表 达; 所有这些变量都受非...

  • 多阶段抽样: 亦称多级抽样分两个或两个以上 阶段實现的抽样。第一阶段将总体分成若干一级抽样 单位,抽选若干一级抽样单位入样;第二阶段将入样 的每个一级单位分成若干二级抽样單位,从入样的每 个一级单位中各抽选若干二级单位入样……依此类 推直到获得最终样本。例...

  • 一元曲线回归: 即“一元非线性回归”. Eviews 中 相關概念 回归 : ?是指某种偶然数的平均值同其他某种数值或几个数值之间的依存关系这种依存关系的紧密程度,在直线联系的情况下,可用相關系数来测定,而在曲线联系的情况下,可用相关比来测定(参阅相...

  • Zoutendijk可行方向法: 适用于线性约束和非线性不等式约束的非线性规划的两种算法。 1. 線性约束的情形: minf(X) 满足 其中A和E分别是m×n和l×n阶矩阵b和e分别是m和l维列向量。Zoutendijk可行方向法的迭代步骤: ...

  • 原始对偶单纯形法: 由丹捷格 (Dantzig)、福特(Ford)和鍢菜克森(Fulekerson)于1956年提出它在应用一般线性规划时,是以松弛这理为理论依据把两阶段法中的两个阶段结合起来,包含原始单纯形法和对偶單纯形法两者的思想故称“原始对偶单纯形法”。它能同时...

  • 样本均方连续差: 样本的散本特征总体方差的一种估计量。设X 1 X 2 ,…X n 是简單随机样本,称 为样本均方连续差对于正态总体N(μ,σ 2 ),δ 2 /2是σ 2 的无偏估计量 Eviews 中 相关概念 样本均方连续差 : 样...

  • 离散型随机变量: 见“离散型分布”. Eviews 中 相关概念 离散型分布 : 随机变量的两个常用的分布类型之一.可用分布列去描述它所可能取的值及取这些值的概率.1.只取有限或可列個值x1,x2,…,xn或x1,x2,…,xn,…的随机变量ξ,其概率...

  • 背包问题: 一个旅行者,有n种物品供他选择装入背包中已知物品j的重量为a j ,使用价值(表示物品对旅行者嘚有用程度)为c j 又知该背包能承受的重量不超过b,问他应选择哪几种物品使得使用价值最大。 设变量 则上述背包问题的数学模型为 这...

  • 有任何数据分析服务需求, 请联系我: 服务介绍: 客户评价: 工作人员很有耐心我要做的实证数据不好找,后来修改了模型换了几个老师,态度吔都不错虽然没有按照约定的时间完成,但最后也做出来了大体满意 [2018...

}

  在科学计算中需要大量的矩阵运算,而矩阵运算中乘法运算是其他运算的基础如能提高嵌入式系统中浮点矩阵乘法运算的速度,则可加快其他类型的矩阵运算速喥

  目前实现浮点矩阵运算的方法,有直接使用VHDL语言编写的浮点矩阵相乘处理单元[1]关键技术是乘累加单元的设计,通常依据设计者嘚编程水平决定硬件性能同样,FPGA厂商也推出了一定规模的浮点矩阵运算IP核[2]其应用针对本厂家器件,且经过专业调试和硬件实测性能穩定且优于手写代码,但还有一些可改进的地方

  本文基于Altera的算法IP核,采用数选方式对矩阵运算中的单精度浮点进行改进可推广到階数更高的矩阵运算和双精度浮点、复数单精度浮点运算中。

  1 浮点矩阵相乘的IP核原理

  Altera公司推出的浮点矩阵相乘IP核ALTFP_MATRIX_MULT适用于Quartus10.1版本以仩的软件环境,能够进行一定规模的浮点矩阵计算原理图如图1所示。

  图1的矩阵相乘结合流水线方式控制数据流动关键部分为核心PE(Processing Element)單元实现两浮点数的相乘。输入数据在控制器的引导下分为AA矩阵和BB矩阵分别存于M144K或M9K存储器中,在计算指令的控制下做浮点相乘运算接著并行地浮点相加完成输出。分析整个计算结构要达到较好的性能就需要耗费多个存储器和多个浮点相乘单元。列出矩阵相乘的基本时序图如图2所示

  从时序图可见,整个IP核有7个输入、4个输出分为数据加载、数据处理、数据输出三个阶段。在系统同步时钟sysclk的驱动下loadaa、loadbb对数据loaddata进行乘数矩阵、被乘数矩阵使能,将数据加载到存储器中当calcimatrix上升沿到来时,进行矩阵乘法运算并输出数据outdata且在outvalid为高电平时囿效。在整个数据输出有效阶段完成信号done处于低电平,其余阶段为高电平

  浮点矩阵运算IP核的运算方式分为单精度、双精度、复数單精度三种方式,矩阵运算阶数有8、16、32、64、96、128阶6种并不能实现任意阶矩阵的相乘,随着矩阵阶数的增大最高时钟频率在下降,同时占鼡器件资源在增加耗用最多的是存储器资源,呈几何倍数增长

  2 数选实矩阵相乘设计

  在矩阵相乘运算中最基础的是2阶矩阵的相塖,核心部分为乘累加器[3]通过适当数选控制,可使整个矩阵运算具有高时钟频率如图3为2阶矩阵相乘电路。

  整个矩阵相乘模块的设計结合数据选择的控制方式,分为流水线数据输入、数据相乘、数据输出三部分在流水线数据输入模块,采用流水线的方式输入乘矩陣数据KA、KB被乘数矩阵数据A、B,以同步系统时钟启动两个数据选择器由cntr0控制两个数选器选择数据输出到乘法器两端;将乘法器的输入数据楿乘并存于寄存器中;最后在数据输出部分cntr1模块的控制下,累加输出矩阵数据X、Y完成矩阵运算。以Altera器件EP2C35F672C6为映射器件其时钟频率为250 MHz。在Quartus7.2软件编程下运行此2阶乘法器,可获得248.69 MHz的最高时钟频率占用资源为172个逻辑单元、152个寄存器、2个9位乘法器,且在输入数据之后2个时钟输出运算结果如图4所示。设计具有较高的计算性能关键点在于数据选择器在电路运算过程中的作用,取代了存储器单一存储的目的可进行乒乓式实时数据流动,提高系统运算效率节省了一半存储器。

  3 浮点矩阵相乘运算的改进

  本文以16×16阶浮点矩阵相乘为例采用单精度浮点计算方式,结合2阶高速矩阵运算电路对16阶矩阵运算进行改进其他高阶矩阵运算可采用类推的方式完成。

  3.1 高阶矩阵运算分解

  高阶矩阵分解运算是通过分解大规模矩阵为许多子矩阵进行计算的方式所以可将16×16阶矩阵划分为4个8×8阶矩阵,实现2阶矩阵相乘16×16階矩阵相乘运算,可表达为式(1):

  从式(1)的16阶矩阵相乘运算可知其需要8次8阶浮点矩阵相乘和4次8阶浮点矩阵相加运算。分析可得在数据並行输入输出的情况下,相比较于16阶矩阵IP核的运行方式此种分解方式性能要高。主要由于IP核运行方式跨度长在数据输入时,需要经过16×16级存储器而本文设计的方式只需要8×8级存储和4次并行的浮点相加运算,同时相比较于16阶IP耗用存储资源和浮点乘法单元数较少

  3.2 矩陣相乘硬件实现

  采用Quartus10.1软件设计16阶单精度浮点矩阵相乘电路,使用VHDL语言[4]编写模块由流水线数据输入、矩阵相乘、锁存器、浮点加法数選模块4部分组成,设计框图如图5所示

  在流水线数据输入部分,对数据data进行分割当信号load为高电平时使能,同时进行数据的缓存和生荿控制位输出的三位控制位(calcimatrix、loadaa、loadbb)控制着下一步矩阵相乘的运算,在loadaa与loadbb高电平交互之间的数据值取0具有数据缓存和分割的作用。最后一個模块需要进行8×8阶矩阵的32位浮点加法运算同时输出数据有效电平,使用Altera altfp_add_sub IP 核实现单精度浮点加法器可根据用户的定制完成。对图5的模塊加入几个输出结果使用modelsim6.5进行仿真,可得16阶矩阵运算仿真结果如图6所示

  从图6可见loadaa、loadbb、calcimatrix三者的时序满足浮点矩阵运算的时序图,在湔两者数据加载后即可获得calcimatrix上升沿,进行矩阵相乘输出结果分为4个大组,各大组有8小组每一小组由8个数据组成,具有较好的计算结果

  将第3节设计的16阶矩阵相乘电路与Altera自身提供的IP核进行比较。同时以8阶矩阵相乘为基以第2节的方式设计4×4阶数选实矩阵电路,套用於32×32阶矩阵运算中与Altera的IP核比较。IP核使用最高性能运行同时以资源消耗、浮点操作数[5]、最高时钟频率、吞吐量作为比较准则,其中浮点操作数的计算表达式为:

  依据以上浮点操作数计算方式使用Quartus10.1软件进行编程,映射到Stratix III系列的器件中可获得相应的对比表如表1所示。

  从表1结果可见改进的浮点运算电路在ALM的资源占用减少了许多原因为在矩阵规模增大时,只使用了8阶浮点矩阵运算浮点IP核中的乘加核数量不变,所以消耗的浮点相乘单元不变同样增添的浮点加法器也只消耗了不多的ALM资源。而对于改进的两类矩阵相乘都只使用8阶矩阵塖法所以在乘法器和M9K存储器这两类逻辑单元的消耗不变。为了达到较好的性能需要少量外围存储器处理数据的流动和浮点相加运算,泹整体存储器消耗降低观察吞吐量可知,套用的数选式矩阵相乘模块当阶数增大时吞吐量降低,幅度明显而选择2阶数选矩阵具有乒乓结构,性能有所提升同理适用于浮点操作数的情况。最后整个运算电路的最高时钟频率始终是提升的与Altera公司的IP核比较,改进的16阶浮點矩阵运算电路性能较好而32阶运算电路性能却未达到要求。

  对高阶矩阵进一步分析在32阶运算电路的设计中,使用16阶浮点矩阵为乘法运算部分以2×2实矩阵运算电路为核心,能够提升32阶电路的运算性能

  以16阶矩阵的运算进行精度分析,取乘矩阵与被乘矩阵各16个数據进行计算分析列出表2数据,其中B矩阵为现有数据的转置以Matlab和FPGA运算结果进行对比。

  从Matlab与FPGA计算结果可见计算输出近乎完全相同,楿差的数据值也是由于Matlab在计算中需要先转化为双精度运算后才转化为单精度数从而得出FPGA计算具有较高的精度。

  本设计降低存储器和計算资源消耗提升了系统吞吐量、浮点运算性能和运行最高时钟频率。这种改进的浮点矩阵乘法器对降低资源消耗、提升系统性能具有偅大意义同时,利用VHDL语言编写具有模块化设计思想,使得本设计可移植性强、通用性好只需要在现有IP核的基础上进行小规模改进,即可拥有较高性能具有一定的工程实际意义和应用前景。

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信