時系列データの予測について ~ その1

2014年3月3日の投稿では、数値予測を行う上での考え方について触れました。

そして次のデータをご覧いただきました。

時系列データ

時系列データ

過去のデータ、ここでは第一四半期から第四四半期の販売数量を基に、翌年の第一四半期の販売数量を予測しようというものです。

過去の投稿でも申し上げましたが、このときまずグラフを描くことが重要です。

この第一四半期から第四四半期のデータの推移をグラフで表わしてみます。
時間を追って変化するデータのことを時系列データと呼び、時系列データをグラフで表わすには、主に折れ線グラフを使います。

このデータについて折れ線グラフを描くと、次のようになりました。

四半期データ 折れ線グラフ

四半期データ 折れ線グラフ

折れ線グラフの横軸はデータの区間を表わし、等間隔になっている項目を配置します。
左は古い時期、右に行けば行くほど新しい時期であることを表わします。
縦軸は販売数量の多さを表わします。

そしてこの折れ線グラフを見ると、時間が経つに連れて、販売数量が増えていることがわかります。
ここから、翌第一四半期の販売数量はどうなるでしょうか?
上昇するでしょうか、下降するでしょうか、それとも第四四半期と変わらないでしょうか?

外挿:上昇するか?下降するか?

外挿:上昇するか?下降するか?

統計学では、データの範囲外の予測のことを外挿と呼んでいます(データの範囲内の予測のことを内挿と呼び、内挿については、後日の投稿で触れます)。

Webページや書籍などでは、このような事例のときExcelで予測を行う場合、次のような方法で第一四半期の販売数量を予測する方法を説明しています。
操作方法などの詳細の説明は省略しますが、良く目にする方法の1つは関数による方法で、もう1つはグラフの機能を利用するものです。


Excelの関数による方法

例えばこんな方法が採り上げられています。FORECAST関数を使っています。
「第一四半期」「第二四半期」という例以外に、年の「2005」「2006」「2007」……というようになっているデータから、そのままこれらの数字を利用する方法も目にしたことがあります。

FORECAST関数利用の例

外挿:FORECAST関数利用の例


グラフの機能を利用する方法

折れ線グラフ散布図(後日の投稿で詳しく触れます)では、次のようにデータの傾向を示す直線や曲線を追加挿入することができ、そしてその線を表わす数式を求めることができます。
ここでは作業のため、横軸は四半期の代わりに1・2・3・4という値を配置しているので、y = 19.5x + 161.5という数式が求められました。
yは縦軸の値、xは横軸の値を表わします。横軸が5つ目のときに縦軸がいくらになるかをこの式から求めることができます。
この場合5つ目、つまり翌第一四半期は、259と求められます。
ここでは詳しい説明は省きますが、横軸の1・2・3・4の値と販売数量との関連を利用した回帰分析という統計手法によって、FORECAST関数と同様の方法で計算しています(ここではR2=0.9736の説明は省略します)。

近似曲線の追加機能を利用した例

外挿:近似曲線の追加機能により、予測するための式を求める例


「ほらこの方法でできますよ」というところで説明が終わっている記事や本が多いのですが、ここで考慮しなければいけない点があります。

それは……(次回の投稿に続く

気に入った?