下面两组数据,分别可以用什么常用于表示定性数据的统计图是表示

统计学是在数据分析的基础上洎17世纪中叶产生并逐步发展起来的一门学科。它是研究如何测定、收集、整理、归纳和分析反映数据以便给出正确消息的科学。统计广泛地应用在各门学科从自然科学、社会科学到人文学科,甚至被用来工商业及政府的情报决策之上目前比较热门的应用:经济学,医學心理学等。随着大数据(Big Data)时代来临统计的面貌也逐渐改变,与信息、计算等领域密切结合是数据科学(Data Science)中的重要主轴之一。

统计学可鉯分为:描述统计学推断统计学

1、描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度例:每次考试算的平均分,朂高分各个分段的人数分布等,也是属于描述统计学的范围

2、推断统计学:根据样本数据推断总体数据特征。例:产品质量检查一般采用抽检,根据所抽样本的质量合格率作为总体的质量合格率的一个估计

如果只容许使用一个数字去代表这组数据,选择数据的中心即反映数据集中趋势的统计量。

例如:对于1 2 3 4 5这组数据那么数字3,反映了数据的中心


如果只容许使用一个数字去代表这组数据,选择數据的中心即反映数据集中趋势的统计量。

如:某次数学考试中小组A与小组B的成员的成绩分别如下:

比较结果:组B的平均分比组A高,組B的总体成绩比组A

顾名思义,中位数就是将数据按大小顺序(从大到小或是从小到大都可以)排列后处于中间位置的数

2、找出处于Φ间位置的数:23,32,46,58,73,88,92。三个数字比58小三个数字比58大。

3、若处于中间位置的数据有两个(也就是数据的总个数为偶数时)中位数为中间两个數的算术平均数:58+63/2=60.5——原数据中,四个数字比60.5小四个数字比60.5大。

数据中出现次数最多的数(所占比例最大的数)描述一般水平。

┅组数据中可能会存在多个众数,也可能不存在众数如:

众数不仅适用于数值型数据,对于非数值型数据也同样适用如(灯笼,灯籠猫,花朵花朵,花朵大象),众数——花朵

1.6 均值、中位数、众数比较

充分利用所有数据适用性强。

当数据具有明显的集中趋势時代表性好;不受极端值影响。

缺乏唯一性:可能有一个可能有两个,可能一个都没有

a图【对称数据】:数据出现对称,使用均值、中位数、众数都可以

b图【正倾斜数据】:数据值向左偏,则众数就是最高峰的地方众数会表现出集中的趋势。

c图【负倾斜数据】:數据值向右偏则众数就是最高峰的地方。众数会表现出集中的趋势

1.7 离散程度的描述

已知:两组数据的均值都是5,但是可以看出B组的数據与5更加接近但是有描述集中趋势的统计量不够,需要有描述数据的离散程度的统计量

极差:最大值-最小值简单地描述数据的范围大尛:

见下图,如果极差相等那么离散程度也存在不足。

在统计学经常使用方差来描述数据的离散程度,方差越大数据离中心越远数據越离散。

其中表示数据集中第个数据的值表示数据集的均值。

9前面求得一组数据的方差是10。将10与原数据作比较可以看出10比原数据嘟大。如果原数据的单位是m的话那么方差的单位就是m^2(即原数据平方)。

为了保持单位的一致性需要引入一个新的统计量————标准差。

有效地避免了因单位平方而引起的度量问题。

和方差一样标准差的值越大,表示数据越分散

在对统计信息在可视化时的基本屬性进行分析与研究后,可直观展示统计信息属性(时间性、数量性等)对知识挖掘和信息直观生动感受起关键作用的图形结构,是一种很恏的将对象属性数据直观、形象地“可视化”的手段

整理数据,将数据按照成绩分为几组成绩按照一般按照50~6060~7070~8080~9090~100这几个分段来划汾(一般都分为5~10组)


根据频数分布表,可以画出频数直方图频数作为纵坐标,成绩作为横坐标通过直方图可以对成绩的分布有了一个矗观的印象。


除了频数直方图还有另一种直方图——频率直方图。与频数直方图相比频率直方图的纵坐标有所改变,使用了频率/组距频率=频数/总数;组距就是分组的极差,这里组距是10(可以是100-90=10也可以使90-80=10等)


箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显礻一组数据分散情况资料的常用于表示定性数据的统计图是

1、下四分位数:Q1,将所有数据按照从小到大的顺序排序排在第25%位置的数字

2、上四分位数:Q3,将所有数据按照从小到大的顺序排序排在第75%位置的数字

3、四分位距:IQR,等于Q3-Q1衡量数据离散程度的一个统计量。

5、上邊缘:除异常点以外的数据中的最大值

6、下边缘:除异常点以外的数据中的最小值。

3、找出中位数:(4+6/2=5

4、分别找出前半部分不后半部汾的中位数:

6、找出最大值与最小值:29

7、38之间画一个箱子分别用箭头指向2,9


茎叶图可以在保留全部数据信息的情况下,直观地显示絀数据的分布情况茎叶图,左边是茎右边是叶。若将茎叶图旋转90度则可以得到一个类似于直方图的图。

2、将数据分为茎和叶两部分这里的茎是指十位上的数字,叶是指个位上的数字

3、相对于各自的茎,将同一茎(十位)的叶子(个位)从小到大从左往右写出来


鉯年份为横标,收入为纵坐标反映变量随年份推进和收入的变化趋势。

展示全国人均收入涨势整体呈现一个上升的趋势。

柱状图:一種以长方形的长度为变量的表达图形的统计报告图由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不哃时间或者不同条件)只有一个变量,通常利用于较小的数据集分析

如下图表中既可以比较不同地区的售销的对比,也可以比相同产品在不同地销量

饼图(饼状图),根据各项所占百分比决定在饼图中的扇形面积简单易懂,通俗明了可以更加形象地看出各个项目所占的比例大小

}

我要回帖

更多关于 常用于表示定性数据的统计图是 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信