データの分析-統計学の分野について-
データの分析
以前から数ⅠAに統計学に関する項目がありました。平均値やメジアンやデータの分布等を学んでいました。統計学は、色々なデータの分析や判定をする時の基本となるものですが、以前は、それほど入試にも出題されることはありませんでした。メーカーでは数多くの製品を大量に作りますから、QC(品質管理)の手法が必須になっています。また、東大の心理学科で学んだある方に聞いた話ですが、心理学そのものも学びますが、データを分析する必要ですから、統計学を相当勉強されたと言う事です。通常の2変数のみならず多変量解析もデータ分析には必要で、相当苦労されたという事も聞きました。2変数の統計学はそれ程難しくはありませんが、多変量解析では、重回帰や分散分析などの結構複雑な数学が必要ですから、文系の方にはきついとは思います。自分自身も統計学のうち多変量解析をきちんと学んだのは、大学卒業後でした。それ程難しくは感じませんでしたが、式の展開が相当複雑だとおもいました。
最近は、ビジネスやマーケティングにビッグデータが使われておりその解析には、多変量解析が多用されます。実際の計算は、全てPCやコンピューターがやってくれますから、理論がそれ程わからなくても解析はできるようになっておりますが、やはりきちんとした理解をするためには、特性方程式や重回帰係数、自由度修正の重回帰係数などの基礎事項は理解しておいたほうがいいと思います。
数ⅠAで理解しておくべき事
高校の数学のデータ分析で、理解しておくべきことはそれ程多くはありません。2変数のデータしか扱いません。平均値、メジアン、分散、標準偏差、相関係数の計算程度が、実際のデータで計算できれば十分だと思います。それ以外の事は、大学以降で学べばよいと思います。模擬試験などで、偏差値が出てきますが、これは、平均値を50とした時の標準偏差で規格化したときの値となります。母集団によりますが、偏差値70などであれば、上位2%程度くらいのところに位置する事に相当します。