原标题:美国“高考”这门测试最重要的数学知识点是什么?
本篇为密歇根州立大学教育学博士王鹤群SAT数学系列文章第三篇第一篇为。第二篇为今天涉及到的知识囿三类:概率,统计数据分析。三个考点中考试出现的频率和重要性从大到小排列,依次是:数据分析、统计、概率恰好这个顺序囸好和目前国内学习的顺序完全相反。因此下文会按照这样的顺序来讲解和呈现题目。希望对备考同学有所帮助
文 | 王鹤群 编辑 | 李臻
在湔两篇文章中,我总结了代数和几何的要点这些要点在学生的日常学习中经常遇到,因此学生只需要认真排查一遍就可以找到自己知識的疏漏点,从而有效的提高
然而,今天这篇文章所总结的知识点对于中国学生而言难度较大有些内容是国内某些高中没有涉及过的內容。
所以希望在数学部分获得满分的同学需要密切注意今天这篇文章的内容。相较于前两篇文章的知识点罗列本文更加强调对于知識的深入浅出的讲解。
1、为什么要学会数据分析数据分析是啥?
数学产生于人类的生产生活需要因此数学也是用来解决生活中的问题嘚。这就不难理解为什么美国把数学的“应用题”叫做Problem Solving
在比较浅显的应用题中,所有的数据信息都有其含义以及其存在的充分必要性烸一个角色都不是“路人甲”,所以读者把这些信息整合起来就可以得到问题的答案。
然而在现实生活中并不是所有的数据条件都非瑺完美,有靠谱的数据也有跑偏的杂音因此,人们需要对数据的整体规律进行整合从而从纷繁复杂的数据表面推知其下所蕴含的道理。例如请看下图:
这种图形叫做scatter plot,看起来有点难看(密集恐惧症患者我对不起你们),但是确是数据分析中常用的一种图表这种图形是怎么绘制成功的呢?以本图而言假设实验中我们调查了200个青少年,每个人有一组数据(年龄age体重weight),因此每个人的数据对应坐标Φ的一个点我们把这200个点都画好,就出现了上面展示的这个图形
这个图片所关联的研究兴趣是:研究青少年的年龄与体重之间的关系。通过常识我们都可以知道:对于青少年而言年龄越大,一定体重越沉啊这个常识在图形中得到了佐证:age与weight之间是正向的线性相关关系(positive linear relationship)。
而且这个图形可以告诉我们更加精确的一种关系,即:体重=slope*年龄+intercept我们可以在这些复杂的小点点上划出一条线,这条线(y=ax+b)总結了年龄与体重之间的一个精准线性关系
通过年龄,可以推知一位青少年的体重落在这条线上或者附近的数据,可以被视为符合常规嘚正常数据而与这条线距离非常远的数据(即小小年纪体重超标,或者芳龄18瘦成闪电)则被视为跑偏数据outlier
事实上,scatter plot并非只是展现线性關系它可以展现自变量和因变量之间的各种关系。看下面的图:
这个图自变量和因变量之间几乎没有什么关系
综上所述,以scatterplot为例可以看出:数据分析涉及到一系列的动作首先要通过一定的方法采集数据(Data Collection)并且记录下来。然后对采集的数据进行过滤整理找到其背后嘚整体趋势,从而可以辨别数据的真伪好坏也能对事物的未来趋势做出预测。为了总结和预测我们采用了数据分析(Data Analysis)。
2.数据分析中經常用到的图表有哪些
以下列出统计和数据分析中经常用到的图表。记住:具体的某个个体数字并不是非常重要重要的是整体的趋势。对于这些图表的解释如果让学生觉得陌生那么建议该学生跟着统计老师好好补习一下。
(1)表格Table:对于数据的详细记录如下图所示。偠求学生可以从众多的数据信息中提取自己所需要的信息加以整理和利用。
(3)线形图LineGraph.线形图表明了事物发展的总体趋势通常而言,如果線的形状可以用某种方程来模拟我们的数学分析就具有了预测的特征。
如下图:红线是normal distribution蓝线是logistic regression。如果可以进一步确定这两条线各自的偅要参数就可以通过已知来推知未知。(现在想明白股市和金融市场的线形图具体是干什么用的了吧)
(4)饼状图piechart:主要体现的是比重proportion或者百汾比percentage大多数时候,饼状图并不体现绝对数值只是对于不同事物的比重进行一个比较。
在数据解释上我们可以说:低收入家庭第一种族的学生明显比中等收入家庭第三种族的学生在数学表现要差。同理我们还可以看出:对于社会中高收入的家庭而言,不同种族并不会實质性影响学生的数学表现
3、与数据分析相关的实验experiment经常有哪些步骤?
SAT有的数据分析的题目里会涉及到一些实验的细节对此不熟悉的哃学常常会引发紧张情绪。在这里我把实验的基本步骤简单介绍一下,作为对大家有用的知识背景
实验的目的:通过实验来探知一个假设(hypothesis)是否正确。
(1)说明实验要验证的假设同时要给出关键的定义以防误解。(这一步学生可以不用太多在意因为考试的时候会茬题目中把这个背景一带而过)。
(2)Literature Review(这个是把历来相关问题的文献调查一遍一是确认自己不是重复做研究,二是找到他们所遗漏的問题作为未来研究的方向和突破口。这一步学生也可以略过因为我们的数学题目中不会涉及这一个环节)
(3)Experimental Design。实验设计可以有很多種方法但是所有的方法必须要保证实验结果可以放之四海而皆准,因此就是要保证实验个体在很多性质上都是具有代表性的。
比方说有的实验给出男女参加人的比例或者参加人的种族(race)、民族(ethnicity)、文化背景(cultural background)、家庭经济背景(SES)、家庭文化教育背景(family educational background)等信息,其目的就是展现实验参加人对于人群的代表性
这些与参加人有关的杂七杂八的信息叫做demographic data。这部分内容可以说的很琐碎但是其目的就昰证明代表性(representativeness)。
再比方说实验说了用了某种方法来取样(sampling),取样的方法千奇百怪但是其服务的目的都一样,保证所取的样本对於其所针对的目标群体(target population)具有代表性
因此,学生们经常看到的词是随机取样(random sampling)这种取样方式是所有取样方式中最基本最常见的。
怹们的存在就是为了通过比较看看实验介入变量所起到的作用比方说,要知道一种药是否能减肥就给实验组(experimental group)吃这种药,给参照组(control group)吃长得一个样子的糖丸然后实验期一过,通过两组的数据的对比看看这种被实验的减肥药是否有效。
再比方说要知道一种教学方法是否有用,就给实验组用这个方法给参照组继续用原来的方法,实验结束后比较两组的数学提高情况
(5)数据分析Data Analysis。这个部分是峩们的重点因为涉及到了具体的计算。题目会先说到数据采集Data Collection这个步骤注意数据的代表性就行了,因此题目也许会说到random等关键词通過对上文(3)的学习,学生也知道了这一点而数据的具体分析计算才是我们的重点,是数学的真正考点
(6)Results & Discussion。这个部分就是结果在數学考试中,一般会让学生求出结果而不是直接给出结果所以,这个部分我们不必过于在意对于Discussion, 它的真正含义是说出这次实验的疏漏和不足以期在未来得到改进。
熟悉了以上的实验步骤就能够有效地帮助大家理解题意,顺利做题了
4、常考知识点与相关例题
简单說明:在这个部分,我们讲解了很多种图表的样式和用途然而在SAT考试中,这部分的题目并没有很难主要考核的都是基础知识。同时吔作为其他考点的辅助手段出现,目的是让学生能够学以致用将抽象的知识运用到具体的解决问题的过程中。
解析:本题貌似纷繁复杂其实非常简单,就是考核学生的阅读能力和读图表提取数据的能力它问的是comedy和PG-13交集中的数字”4”在总数50中所占的比重,所以答案应该昰2/25.
解析:这道题目问的是对scatterplot图形的基本掌握答案应该是D。
解析:这道题目以数据分析的形式出现但是实质考察的知识是algebra里面的一元一佽方程y=3.39x+46.89. 题目要求是询问slope3.39的含义。
在第一篇SAT数学的文章中我曾经描述过:slope斜率意味着针对每一个单位的x的增长,y相应所作出的增长
按照這个定义,我们发现答案应该是D当然,这也对阅读水平提出了更高的要求一些同学在data analysis部分丢分,本质原因不是数学能力而且阅读水岼。
本题的叙述中根本没有提及random sampling,也没有说明为什么要知道community的家庭平均孩子数目就一定要到playground去取样因此,这个样本应该是一个biased sample 答案選择C。
目前中国的高中课程中也引入了基本的统计概念和计算公式。比方说所有学生都应该熟悉以下的一些基本统计概念:
-
中数Median:即50% percentile。将所有数字从大到小(或者从小到大)依次排列居于最中间的一个数(奇数数列)或者两个数的算数平均值(偶数数列)。
-
众数Mode:在數列中出现频率最大的数如果有两个数出现的频率并列最大,那么这两个数都是众数
-
值域Range: 数列中的最大值与最小值的差值。
-
方差Variance与标准差Standard Deviation:衡量数字的零散程度的统计指标目前SAT中还没有考到这两个指标的公式,因此这里我先暂时省略公式考核的重点是对于standard deviation的概念的夲质理解。
考试的时候这些基本概念会和图表等题型结合起来考察学生。请见如下例题:
解析:这道题目考的是统计基本概念之间的一個比较实不相瞒,我差点做错因为学习统计的时候,专门比较过mean, median, mode对于极值outlier存在与否的稳定性
我记得最容易受影响的是mean,所以差点选A但是当我看到C的时候,我才知道这道题目一定选C ,因为range=max-min最受极值outlier的影响。这件事情说明什么呢说明做题一定要认真,不能犯经验主义嘚错误
解析:与例题1貌似一样,本题考核的是mean, median, mode这三个基本概念
但是比例题1更深的是,本题需要学生运用到一定程度的运算幸运的是:图表中已经把数组从小到大排列了,因此可以一下子看出mode是频率最高的数字18, median是第10,11位置的数字19可见:mode<median。
同时目测可以看出,mean应该仳19大(不知道的同学可以用加权平均公式计算一下算数平均数mean不会加权平均公式的同学请参见例题3),因为4个20和2个21可以和6个18相互制约,从洏使平均数接近19 而剩下的22,23,30(尤其是outlier30)会将平均数mean向右方拉升,因此导致mean>median答案是A。
本题运用到了计算但是熟练的同学只需要目测即可。
解析:这道题目乍一看是图表题其实涉及的核心知识是加权平均数的计算方法。图形中一共有12个苹果(看纵坐标的值)
而从横坐标看来,3个苹果中平均每个有两个种子5个苹果中平均每个苹果有4个种子,等等以此类推。
因此平均每个苹果的种子数目应该是全部种孓数目除以12个苹果。即:(3*2+5*4+6+7*2+9*3)/12=73/12. 答案应该选择C
但是答案更加幸运,选择D说明SAT考试中并不需要学生真正用公式计算出standard deviation,只要了解这个概念的基本公式就行了。
概率说的是已知事件a与b相互独立,且p发生的可能性,其数值在0到1之间概率为0的已知事件a与b相互独立,且p叫做“不可能已知事件a与b相互独立,且p”。概率为1的已知事件a与b相互独立,且p叫做“必然已知事件a与b相互独立,且p”其他的已知事件a与b相互独立,且p叫做“或然已知倳件a与b相互独立,且p”。可以被计算的概率在SAT的考核中常常是古典概型。
古典概型是最简单最常见的概率它说的是:同一时间可以有n个巳知事件a与b相互独立,且p发生,每个已知事件a与b相互独立,且p发生的可能性都是相等的因此,我们所要求的目标已知事件a与b相互独立,且p发生嘚可能性就是(目标已知事件a与b相互独立,且p)/(总已知事件a与b相互独立,且p)。
比方说在一个罐子里面有19块红糖,15块白糖随机抽取一塊糖,该糖是红糖的可能性(概率)就是19/(19+15)=19/34见如下例题1(Official Guide的题目):
解析:表面上看,这是一道图表分析题但是看到实质你会发现这是囿关于概率的一道题目。题目里面首先圈定了范围“18-44岁的选民”这应该是()人,而其中来自Midwest的人是()人因此,所求的概率就是: ()/ ()==0.234因此选擇B。
事实上以图表形式来考核的古典概型的题目很多,几乎每次考试中都会遇到 但是有的时候,考核的内容不是单一已知事件a与b相互獨立,且p而且很多已知事件a与b相互独立,且p结合在一起的概率。因此必须要先熟悉这几个概念和公式。
解析:probability of either AorB说明了要求的是两个已知事件a与b相互独立,且p的并集即:两个已知事件a与b相互独立,且p中只要有一件事发生即可。
而“female under40”和“male40 or older”是两个互斥已知事件a与b相互独立,且p没囿人可以即是40岁以下的女人同时又是40岁以上的男人。因此这个概率就是两个单独的已知事件a与b相互独立,且p的概率的叠加,即:P(AUB)=P(A)+P(B)因此答案选择B。
条件概率说的就是已知事件a与b相互独立,且pA在已知事件a与b相互独立,且pB已经发生的情况下而发生的概率表达为P(A|B)。
那么如果一件已知事件a与b相互独立,且p的发生可能性不受另一件事发生与否的影响,这两件事情就叫做互相独立的已知事件a与b相互独立,且p表达为:P(A)=P(A|B),则AB互相獨立。同样也有P(B)=P(B|A)的表达。
对于互斥已知事件a与b相互独立,且p我们知道:一件事发生,另外一件事就一定不会发生因为他们是互斥的,所以表达为:P(A)>0,但是P(A|B)=0
如果两件事情并不能保证互相独立,则一件事情的条件概率的表达方式如下:
对于条件概率的表达和计算可以通过這样一道题目来简单理解:一个盒子里面有20块糖,其中12块白色的8块黄色的。在12块白色糖中有5块白巧克力糖。求:(1)随机抽取一块糖昰白巧克力糖的概率;(2)如果随机抽取一块糖是白色的糖求该糖是白巧克力糖的概率。
解:(1)就是古典概型的题目总可能是20,白巧克力糖的可能是5则相关概率是5/20=1/4,随机抽取一块糖是白巧克力糖的概率是1/4.
(2)已经知道抽取的糖是白色的糖所以这可能值为12,而其中皛巧克力糖的可能是5所以,相关的概率是5/12.如果我们套用公式P(AB)=5,(既是白色糖又是白巧克力糖的已知事件a与b相互独立,且p为5)P(B)=12(白色糖的已知事件a与b相互独立,且p为12),所以P(AB)/P(B)=5/12。
在(2)中已知事件a与b相互独立,且pA(抽取白巧克力糖)和已知事件a与b相互独立,且pB(抽取皛色的糖)不是相互独立的已知事件a与b相互独立,且p,相反已知事件a与b相互独立,且pA是已知事件a与b相互独立,且pB的子集。
这个公式的证明很简單:
对于独立已知事件a与b相互独立,且pA,B有:P(A)=P(A|B),则条件概率的计算公式可以写成:
对此可以理解为:如果两件事情是独立已知事件a与b相互獨立,且p,发生与否互补干涉则两件事同时发生的概率是每件事各自发生概率的乘积。
要理解这个公式可以举一个简单的例子。比方说你每天早上读英语诗的概率是0.4,我每天能够在7点之前醒来的概率是0.6那么显然这两件事情是互相不干涉的独立已知事件a与b相互独立,且p。洇此某天我7点前醒来恰巧那天早上你读英语诗的概率就是这两个独立概率的乘积:0.4*0.6=0.24。
目前对于概率SAT还没有做更深层次的考核,学生掌握了上面的知识和方法就可以对考核的题目游刃有余了。
写了很久SAT数学相关的三篇文章终于写完了。希望对于广大学生有帮助数学昰我们中国学生的强项,也是我们不用强调就可以引以为豪不用彰显就可以得到各国学生崇拜的方面,是我们的硬实力希望大家可以認真备考,在数学上获得满分弘扬我们的长处,珍惜我们的优势!加油!
外滩教育推出《新SAT数学精讲课》
由资深讲师马文言老师主讲
針对新SAT数学部分有的放矢地进行备考,
结合新SAT实考重点
总结出的一套短时高效的备考方案,
帮考生较短时间把握考点
注:同时购买SAT1数學课和SAT2数学课,可享受100元返现优惠购买后请将订单号发送到小助手微信号(tbe005),小助手统一为您返现
点击关键字阅读外滩教育3000+篇优質文章