XLSTAT によるデータマネジメント機能:スタック機能で縦横データを変換しよう
- データマネジメント機能とは?
- データマネジメント機能でできること
- スタック / アンスタックとは?
- サンプルデータの説明
- XLSTAT でデータをスタックする操作手順
- 出力結果の確認
- 補足:データをアンスタックする
- まとめ
- 参考文献
- XLSTAT の無料トライアル
データマネジメント機能とは?
データ分析を行う際、私たちが手にするデータが常に分析に適した形であるとは限りません。多くの場合、分析を始める前に、データを整理し、使いやすい形に整える「データの前処理」または「データ整形」という作業が必要になります。XLSTAT のデータマネジメント機能は、この面倒なデータの前処理を効率化するために設計されたツールです。エクセルの標準機能だけでは手間がかかる、あるいは実現が難しいデータベースのような高度なデータ操作を、簡単な操作で実行することができます。
データマネジメント機能でできること
データマネジメント機能には、データ整形に役立つ様々なツールが含まれています。
-
重複の削除:テーブル内の重複した行を削除します。
-
グループ化:特定のキーでデータをグループ化し、合計や平均などの集計を行います。
-
結合:2つのテーブルを共通のキーをもとに統合します(内部結合・外部結合)。
-
フィルタリング:条件に合う行だけを残したり(維持)、削除したりします。
-
スタック / アンスタック:データの縦長形式と横長形式を相互に変換します。
今回は、この中からスタック / アンスタック機能に焦点を当てて、その使い方を詳しくご紹介します。
スタック / アンスタックとは?
データの「スタック / アンスタック」とは、一言でいうと、表の「持ち方」を変える操作のことです。 多くのデータは、下図の左側のような「横長形式(ワイド形式)」で作成されます。この形式は人間にとっては見やすいのですが、多くの分析ツールは右側のような「縦長形式(ロング形式)」を前提として設計されています。
-
スタック(Stack):
横長のデータを、分析ツールが扱いやすい縦長のデータに変換します。 - アンスタック(Unstack):
縦長のデータを、人間が見やすい横長のデータに戻します。
手作業でコピー&ペーストを繰り返して形式を変換すると、時間がかかる上にミスも発生しやすくなります。スタック機能を使えば、この変換作業を瞬時に、かつ正確に行うことができます。
サンプルデータの説明
今回は、以下のような店舗別の売上データ(横長形式)を例に操作を進めます。これは、日付ごと、店舗ごとに売上が記録されたデータです。このままでは、「店舗ごとの平均売上」を計算したり、「全店舗の売上推移を一つのグラフ」にしたりするのが少し面倒です。
今回はこのデータをXLSTAT のデータマネジメント機能を使って、分析に適した縦長形式に「スタック」してみましょう。
サンプルデータのダウンロードはこちらから
demo-stack-ja.xlsxXLSTAT でデータをスタックする操作手順
-
XLSTAT を起動し、 [データ準備] > [データ・マネジメント] を選択します。
-
データマネジメントのダイアログ画面で以下の設定を行います。
- 手法:
[スタック] を選択し、[いくつかの列を積み重ねる] にチェックを入れます。 - データ:
スタックしたいデータの範囲を選択します。今回のデータでは、A列からD列までを選択します。 - 列ラベル:
データの1行目が見出し(日付、東京店など)なので、チェックを入れます。
- 手法:
-
[OK] をクリックします。
-
以下の画面が表示されるため、スタックしたい変数を選択し、[OK] をクリックします。
今回は各店舗の売上データでスタックしたいので、店舗の変数を選択します。 -
[OK] をクリックすると、スタックされた結果が別シート(スタック)に出力されます。
出力結果の確認
スタック後のデータ
上記のように、横に並んでいた「東京店」「大阪店」「名古屋店」のデータが、1つの列(グループ列)に積み重ねられました。そして、どのデータがどの店舗のものかを示すための列(データ列)が自動で作成されています。 元のデータは30行でしたが、30日 × 3店舗 = 90行 のデータに変換されていることが確認できます。この形式になれば、ピボットテーブルでの集計やグラフ作成がしやすくなります。
もしスタック前のデータのように日付順で並べ替えたい場合は、エクセルのフィルタ機能を有効にして、昇順にソートしてください。
【注意】
スタック後のデータで数値セルの左上隅に小さな緑色の三角形が表示される場合は、数値が文字列として保存されていることを示します。もしデータを数値として扱いたい場合は、該当セルを選択した状態で、隣に表示されているエラー ボタンをクリックし、[数値に変換する] を選択してください。
補足:データをアンスタックする
今回はデータをスタックする方法をご紹介しましたが、データマネジメント機能のダイアログ画面にて、[アンスタック] の手法を選択すると、「縦長データ」を「横長データ」へ変換することもできます。
アンスタックした結果
まとめ
今回は、XLSTAT のデータマネジメント機能の中から「スタック」機能をご紹介しました。データ分析の効率は、地道な前処理をいかに手早く確実に行うかにかかっています。今回ご紹介したようなデータの変換は手作業でも可能ですが、多くの時間と集中力を奪い、ミスの温床にもなりがちです。XLSTAT の「スタック」機能を利用すると、簡単な操作でデータ形式の変換ができます。信頼性の高いツールを使いこなして、よりスマートで質の高いデータ分析を実現しましょう。
参考文献
- XLSTAT: Stacking / Unstacking Data in Excel
https://community.lumivero.com/s/article/6628-stack-unstack-data-excel?language=en_US
- Preparing Data
https://community.lumivero.com/s/resource/preparing-data-xlstat-MCP24WICBQGBELTI7HOXL2F4ZECM?language=en_US
XLSTAT の無料トライアル
トライアルでは、最上位パッケージ XLSTAT Advanced に加え、3D Plot と LatentClass のオプションもご利用いただけます。本記事で紹介したデータマネジメント機能はすべてのライセンスでご利用いただけます。
無料トライアルを申し込む*トライアルは登録完了日に開始され、有効期間は14日間です。トライアルを更新または延長することはできません。