L2 Summary
Completion requirements
Unit E: Statistics and Probability
Chapter 1: Statistics
Summary
Mean
- To calculate the mean, «math xmlns=¨http://www.w3.org/1998/Math/MathML¨» «mover» «mi»x«/mi» «mo»§#175;«/mo» «/mover» «/math»,
- add all the values
- divide by the number of values
- The mean formula is
«math xmlns=¨http://www.w3.org/1998/Math/MathML¨» «mtable columnspacing=¨0px¨ columnalign=¨right center left¨» «mtr» «mtd» «mover» «mi»x«/mi» «mo»§#175;«/mo» «/mover» «/mtd» «mtd» «mo»=«/mo» «/mtd» «mtd» «mfrac» «mrow» «mi»sum«/mi» «mo»§#160;«/mo» «mi»of«/mi» «mo»§#160;«/mo» «mi»the«/mi» «mo»§#160;«/mo» «mi»values«/mi» «mo»§#160;«/mo» «mi»in«/mi» «mo»§#160;«/mo» «mi»the«/mi» «mo»§#160;«/mo» «mi»data«/mi» «mo»§#160;«/mo» «mi»set«/mi» «/mrow» «mrow» «mi»total«/mi» «mo»§#160;«/mo» «mi»number«/mi» «mo»§#160;«/mo» «mi»of«/mi» «mo»§#160;«/mo» «mi»values«/mi» «mo»§#160;«/mo» «mi»in«/mi» «mo»§#160;«/mo» «mi»the«/mi» «mo»§#160;«/mo» «mi»data«/mi» «mo»§#160;«/mo» «mi»set«/mi» «/mrow» «/mfrac» «/mtd» «/mtr» «mtr» «mtd»«/mtd» «mtd» «mo»=«/mo» «/mtd» «mtd» «mfrac» «mrow» «msub» «mi»x«/mi» «mn»1«/mn» «/msub» «mo»+«/mo» «msub» «mi»x«/mi» «mn»2«/mn» «/msub» «mo»+«/mo» «msub» «mi»x«/mi» «mn»3«/mn» «/msub» «mo»+«/mo» «mo»§#8230;«/mo» «mo»+«/mo» «msub» «mi»x«/mi» «mi»n«/mi» «/msub» «/mrow» «mi»n«/mi» «/mfrac» «/mtd» «/mtr» «/mtable» «/math»
where
x1 is the first value in the data set
x2 is the second value in the data set
x3 is the third value in the data set
xn is the last value in the data set
n is the number of values in the data set
Median
- To find the median,
- arrange the data in ascending order (from smallest to largest)
- If the number of data values is odd, the median is the middle value.
- If the number of data values is even, the median is the average of the two middle values.
Mode
- The mode is the value(s) that occur(s) most often in a data set.
Outliers
- An outlier is a data point that lies significantly outside the general trend of the data.
- Outliers distort or skew the results when calculating measures of central tendency.
- Outliers have the greatest effect on the mean. If a larger outlier is part of the set of data, the mean increases and no longer represents the typical data. If a smaller outlier is part of the set of data, the mean decreases.
- Median changes slightly if an outlier is included in the data. If an outlier is added above the data values, the median increases. If an outlier is added below the data values, the median decreases.
- Mode is generally not affected by outliers.
Trimmed Mean
- When outliers are present, a trimmed mean is calculated by removing an even number of data values. The same number of values must be removed from the top of the data set as the bottom of the data set.
- Removing outliers can result in a more accurate value for the mean of a set of data.