Open chenghong-lin-nu opened 6 years ago
讲解了一下对于 Google 表格的用法。 如果你要将一个公式应用到这个列的所有行里面的话,有一个快捷键很好用 : ctrl+c 选中当前的那个,然后移动到左边那一格,然后 ctrl+ 向下键 , 然后再移动到右边那一格,再摁一下 shift+ctrl+ 向上键,选中当前列,然后 ctrl+v 就可以了。
全选中数据: shift + 向左移 / 向右移 ,选中我们需要的几列,然后摁 shift+ctrl+向下键,然后就可以选中所有的数据了。 这个功能是在 L3 的第 28 个 quiz 中出现的。
Mode (众数) : 出现次数最多 / 频率最多的一个数。 Median (中位数) : 在中间的那个数。 Average (平均数)
可以出现 more than one mode 的情况 - 双峰分布。 Mode 是出现在 x 轴上的,所以你只要看 x 轴上的哪个有最大的频率就好了。 Mode 可以去描述任何形式的我们拥有的数据,无论是 numerical / categorical 。
Mean (平均数)
Median (中位数) 将数据分成了两部分,左边和右边两部分有相同的数量。 它是一个很好的 measure center 的方法。
SumUp (总结)
https://docs.google.com/document/d/1ZGXA1LPK9hhW8ZCRv2KENpJBDvr9EoBOaIlXgYkubS4/edit
Normal Distribution (正态分布) 和 Uniform Distribution (均匀分布) 区别???
Constructs 很难被检测 (measure) 但是能够让我们去检测 Constructs 的一些行为则叫 Operational Definition. 在有了 Operational Definition 之后,我们就可以 measure Constructs。
Extraneous Factor (外来因素) : 它通常会对结果产生影响。
Population Parameters : 它是一个参数用来描述全体的平均数。用数学符号 μ 来表示。 Sample statistics : 它则是用来描述样本的平均数。 用数学符号 x-bar 来表示 (就是数学老师常说的 x 一把) 我们可以通过样本的平均值来估计整体的。
Correlation does not imply causation. 意思是说有相关性并不代表有因果关系。 比如说 A 和 B 是好朋友,但是你总不能说 A 产生了 B 对吧?(⊙o⊙)
Casual Inference (因果推断) 是否有关系的话,那么就只要进行调查就好了,其中人是主体。 是否有因果关系的话,那么要进行控制变量的测试才行!
Blinding : 就是不告诉那些实验者自己是对照组还是实验组的人员。 Placebo Effect : “安慰剂效应”,如果一个人知道自己是在普通的对照组里面,那么它肯定会认为这个组里面做的东西都是无效的,那么就会影响实验的结果。 Double Blind : 单个 blind 是指只有样本本身不知道自己是否是对照组还是实验组。 而 double blind 是指 单个 blind + 观察结果的 researcher 也不知道这些实验者被采取的是什么措施(是没有施加药物呢,还是加了)。见下图。
PS 1a : Intro to Research Methods
Sampling Error : 就是我们在 sample 中得到的 average 不一定等于 population 中的 average。
通过题目来注意一下相关术语:
L2: Visualizing Data
Histogram : 直方图 Bin Size : 组距大小 - It's the interval which you count the frequency. Percentage : 百分比 / Propotion : 比例 (这两个是有区别的,注意!) Relative Frequency : 就是 frequency / 总共的数量 的百分比 Absolute Frequency : 就是每一个数在总体中出现的次数。 如下图所示:
Histogram : 直方图。它的 X 轴的变量都是数量的,量化的。并且 X 的变量都是有关联的。同时我们也可以改变 histogram 的 interval 的大小。 Bar Graph : 条状图。它的 X 轴的变量则是类别化的 / 定性的。并且 X 的变量都是没有关联的。我们不能改变 bar graph 的 interval 的大小。
Bin Size : 就是在直方图中每个直方图的间距大小。
正态分布 ( Normal Distribution )
偏态分布 ( Skewed Distribution ) 偏态分布又分为 : 1)左偏态 ( Left Skewed Distribution ) ,又叫做负偏态 ( Negative Skewed Distribution ) ,顾名思义就是向左边 / 向 X 轴的负方向偏去的。 2)右偏态 (Right Skewed Distribution ) ,又叫做正偏态 ( Positive Skewed Distribution ) ,顾名思义就是向右边 / 向 X 轴的正方向偏去的。