ここまでのレッスンでは、ある一つのデータファイルからのみ帳票を作成してきた。実際に分析を進めていくと、複数のデータファイルから帳票を作成することが多くなる。最終的には複数のデータファイルを一つにまとめるのであるが、そのまとめ方は大きくわけて2つある。一つは「項目を結合する」処理であり、他方は「レコードを併合する」処理である。前者は項目が増え、後者はレコードが増える。Lesson8では項目の結合について学習する。レコードの併合についてはこのチュートリアルでは行わない。Lesson8からLesson10にかけて、「1998年の年代別平均売上単価」帳票の作成を目指す。これらのレッスンの中では項目の結合に加えて新しいコマンドの利用例についても学習することになる。
大まかな流れは以下の通りである。
「顧客、日付、金額、数量」のファイルを作る(Lesson8) |
顧客の生年月日を結合する(Lesson8) |
年齢を計算する(Lesson9) |
年代別で数量金額を集計する(Lesson9) |
金額÷数量で平均単価を求める(Lesson10) |
見やすい帳表に整形する(Lesson10) |
gunzip -c /home/practice/Mine/Data/StoreMaster1/Dat/dat.gz |\ mdelnul field=8 |\ mselnum field=2 range=19980101_19981231 |\ mcut field=8,2,13,14 >xxtmp |
gunzip -c /home/practice/Mine/Data/StoreMaster1/Dat/dat.gz |\ mdelnul field=8 |\ mselnum field=2 range=19980101_19981231 |\ mcut field=8,2,13,14 |\ sort |\ mjoin key=1 master=/home/practice/Mine/Data/Birthday/Dat/dat field=2 >dat8-1 |