Excelでもプログラミングでもないデータ加工と分析

Web上ですぐ使えるETLツール "HowData"を使ったデータ加工&分析を紹介しています

データ集計テクニック

重複するデータの最初だけを抽出する

下のように月データ(2月、3月、4月、5月、6月、7月)が重複しているとします。 この重複するデータからの重複を削除し、最初の行だけを抽出する場合を考えてみましょう。 データ加工の元データ A B C 1 月 日付 値 2 2月 2/15/84 183.203 3 2月 2/29/84 182.…

生年月日をもとに年齢を求める

業務の中で、CSVやExcelからのデータ加工を行うとき、新たなデータを既存データから作成しなくてはならないことがよくあります。 下のように顧客データ集計で顧客の年齢が必要になったとします。顧客の生年月日のデータはあるので、購入日等の日付データと生…

複数Excelファイルで複数ワークシートのデータを一つにまとめる

Excelでデータではよく、別々のファイルに別々のワークシートにある表(データ)を1つにまとめる必要がでてきます。しかも、ファイル名やワークシート名自体に年や月、地域名などデータ集計に必要な情報が含まれていることも珍しくありません。 例えば、下…

複数ワークシートにまたがるデータを1つにまとめる

Excelでデータではよく、別々のシートにある表(データ)を1つにまとめる必要がでてきます。しかも、ワークシート名自体に年や月、地域名などデータ集計に必要な情報が含まれていることも珍しくありません。 例えば、下のようなワークシート名に地域名が、…

条件を満たす文字列を抽出する

業務の中で、CSVやExcelからのデータ加工を行うことは多い思います。しかしそういったデータの中には不十分であったり、乱れていることはよくあります。 そういった場合に、手作業でデータの書き換えを行うのは膨大な手間と時間が必要になってしまいます。そ…

商品区分別かつ商品ID別で売上金額の多い順に順位を付ける

下のような顧客情報、店舗、商品区分、金額など、多くの要素からなる売上データがあるとします。このデータから、商品区分別かつ商品ID別で売上個数、売上金額を算出し、売上金額の高い順に商品IDに順位を付けていきます。 データ集計の元となるデータ A B C…

複数条件でのカウント:売上データから店舗別かつ商品区分別でのカウントを求める

下のような顧客情報、店舗、商品区分、金額など、多くの要素からなる売上データがあるとします。このデータから、店舗別かつ商品区分別(複数条件)でデータ行をカウントし、取引件数をデータ集計してみます。 データ集計の元となるデータ A B C D E F G H I J…

1つの条件でのカウント:売上データから店舗別でのカウントを求める

下のような顧客情報、店舗、商品区分、金額など、多くの要素からなる売上データがあるとします。このデータから、店舗別(1つの条件)でデータ行をカウントし、取引件数をデータ集計してみます。 A B C D E F G H I J K L M N 1 ID 氏名 氏名(カタカナ) 性別…

複数条件の合計:売上データから店舗別で商品区分別の売上金額の合計を求める

下のような顧客情報、店舗、商品区分、金額など、多くの要素からなる売上データから、店別、商品区分別など複数条件ごとにデータ集計をします。集計は繰り返しになるので、他の人にもわかりやすく、手間がかからないように進めていくようにしましょう。 A B …

1つの条件での合計:売上データから店舗別の売上金額の合計を求める

下のような顧客情報、店舗、商品区分、金額など、多くの要素からなる売上データから、条件ごとにデータ集計をします。集計は繰り返しになるので、他の人にもわかりやすく、手間がかからないように進めていくようにしましょう。 A B C D E F G H I J K L M N …