Google Spreadsheet は無償ツールながらExcel同様にピボットテーブルを扱うことができます。今回は、作成したピボットテーブルのソート方法が少し分かりづらかったので、実例と共に紹介します。
サンプルデータ
今回は、環境庁が公開している花粉飛散量のデータを用いることにします。観測局ごとに、毎時単位での花粉飛散量が記録されています。今回は2021年4月1日〜4月7日までの観測局ごとの花粉飛散量を合計し、どの地域(観測局)だと花粉を避けることができたのか?という調査シナリオで考えます。
Google Spreadsheet でのピボットテーブルの作成方法
今回、 Google Spreadsheet でのピボットテーブルの作成方法は以下の手順で実施しました。
- 環境庁のサイト(はなこさん)からCSVデータの取得
- 取得した CSV データを Google Spreadsheet にインポート
- インポートしたデータにヘッダを追加 ※取得したデータにはヘッダがないため
- ヘッダを追加したデータをピボットテーブルとして作成
行(Rows)に「測定局名」、列(Columns)に「年月日」、値(Value)に「花粉飛散数[個/m3]」を指定します。
以下のようにピボットテーブルが作成されます。パッと見「日光市役所」がずば抜けて値が大きいのがわかりますが、Grand Total列(I列)をソートして、より分かりやすく表現したいと思います。
合計列(Grand Total)でソート
Google Spreadsheet で合計列の値でソートするには、ピボットテーブル内のセルをクリックすることで右側に表示されるピボットテーブルエディタ(Pivot table editor)を使います。
今回は、測定局(行データ)の中で最も合計花粉飛散量の少ないものを見つけたいため、ピボットテーブルエディタのRowsに指定した「測定局名」に付属している2つのプルダウンのうち、右側の”sort by”をクリックします。すると「SUM of 花粉飛散数[個/m3] 」という項目が表示されるので、それを選択します。さらに、「年月日」「Grand Total」「20210401」…という項目がプルダウンに表示されるので、「Grant Total」を選択します。こうすることで、以下のようにGrand Total(I列)の内容でデータが昇順(Ascending)でソートされます
ソートされたピボットテーブルは以下の用になります。
これで、無事「水戸石川一般環境大気測定局」がこの期間の合計花粉飛散量が最も少ないということが一目瞭然で分かるようになりました。2位の「東邦大学」とも僅差であることがわかります。
合計行(Grand Total)でソート
このピボットテーブルでは、行合計も列合計も同じ「Grand Total」という名前なので少し紛らわしいかと思います。試しに同様の手順で列(Columns)でソートした場合の紹介します。
ソートされたピボットテーブルは以下の用になります。
花粉もシーズン後半ということもあり、日毎に飛散量が減っている傾向ですが、4月3日だけは4月4日や5日よりも花粉飛散量が少なかったことがわかります。
まとめ
- ピボットテーブルのソートには、右側に表示されるピボットテーブルエディタを利用する
- プルダウンから、 sort by を選択しソートする
- 列でも行でもソート可能