Excelでもプログラミングでもないデータ加工と分析

Web上ですぐ使えるETLツール "HowData"を使ったデータ加工&分析を紹介しています

複数Excelファイルで複数ワークシートのデータを一つにまとめる

 Excelでデータではよく、別々のファイルに別々のワークシートにある表(データ)を1つにまとめる必要がでてきます。しかも、ファイル名やワークシート名自体に年や月、地域名などデータ集計に必要な情報が含まれていることも珍しくありません。

 例えば、下のように複数Excelファイルのワークシート名に地域名があり、各ワークシート上に必要なデータがある場合を考えてみましょう。

 データ集計の元になるデータ

f:id:howdata:20180409160111p:plain

f:id:howdata:20180409160156p:plain

 

 これを、下のようにファイル名、ワークシート名がわかるよう1つのデータにまとめます。

 データ集計の目的となるデータ
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04_02.xlsx 兵庫県 55386 水口麗華 ミズグチレイカ
sampleData_04_02.xlsx 兵庫県 18464 田辺美姫 タナベミキ
sampleData_04_02.xlsx 兵庫県 45375 須賀由実 スガユミ
sampleData_04_02.xlsx 兵庫県 72309 河口雄一 カワグチユウイチ
sampleData_04_02.xlsx 福岡県 33499 滝本秀実 タキモトヒデミ
sampleData_04_02.xlsx 福岡県 26946 小林公男 コバヤシキミオ
sampleData_04_02.xlsx 福岡県 98843 村瀬金造 ムラセキンゾウ
sampleData_04_02.xlsx 福岡県 18863 鶴田憲司 ツルタケンジ
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ



Excelを使う場合には データ=>統合 の作業を行うのが一般的ですが、処理がもっと簡単にできるインブラウザ型のデータ加工/分析サービス HowDataで行います。

 

howdata.io

 

f:id:howdata:20180409161103p:plain

1. データを取り込む (ファイル)

 

ノードへ入力されるデータ
 
  A B C D
1 ID 氏名 氏名(カタカナ) 性別
2 55386 水口麗華 ミズグチレイカ
3 18464 田辺美姫 タナベミキ
4 45375 須賀由実 スガユミ
5 72309 河口雄一 カワグチユウイチ
ノードから出力されるデータ(20)
 
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04_02.xlsx 兵庫県 55386 水口麗華 ミズグチレイカ
sampleData_04_02.xlsx 兵庫県 18464 田辺美姫 タナベミキ
sampleData_04_02.xlsx 兵庫県 45375 須賀由実 スガユミ
sampleData_04_02.xlsx 兵庫県 72309 河口雄一 カワグチユウイチ
sampleData_04_02.xlsx 福岡県 33499 滝本秀実 タキモトヒデミ
sampleData_04_02.xlsx 福岡県 26946 小林公男 コバヤシキミオ
sampleData_04_02.xlsx 福岡県 98843 村瀬金造 ムラセキンゾウ
sampleData_04_02.xlsx 福岡県 18863 鶴田憲司 ツルタケンジ
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
1.ファイルノードを配置する
ノードパネルからファイルノーをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

3.ファイルを選択する
ファイル選択フォームからsampleData_04_02.xlsx,sampleData_04.xlsxを選択します
4.ワークシートを選択する
sampleData_04_02.xlsxに含まれるワークシート兵庫県,福岡県チェックボックスを選択します
同様に sampleData_04.xlsx東京都,大阪府,京都府を選択します
5.列名となるデータ範囲を指定する
A1~D1の範囲をカーソルで指定後、[列名の範囲にする]ボタンをクリックします
6.メタ情報を追加する
ファイル名やシート名、ヘッダー情報を追加するため、[ファイルメタ情報を追加する]のチェックボックスをクリックします
7.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

2. 列を変更する (列変更)

 

ノードへ入力されるデータ(20)
 
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04_02.xlsx 兵庫県 55386 水口麗華 ミズグチレイカ
sampleData_04_02.xlsx 兵庫県 18464 田辺美姫 タナベミキ
sampleData_04_02.xlsx 兵庫県 45375 須賀由実 スガユミ
sampleData_04_02.xlsx 兵庫県 72309 河口雄一 カワグチユウイチ
sampleData_04_02.xlsx 福岡県 33499 滝本秀実 タキモトヒデミ
sampleData_04_02.xlsx 福岡県 26946 小林公男 コバヤシキミオ
sampleData_04_02.xlsx 福岡県 98843 村瀬金造 ムラセキンゾウ
sampleData_04_02.xlsx 福岡県 18863 鶴田憲司 ツルタケンジ
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
ノードから出力されるデータ(20)
 
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04_02.xlsx 兵庫県 55386 水口麗華 ミズグチレイカ
sampleData_04_02.xlsx 兵庫県 18464 田辺美姫 タナベミキ
sampleData_04_02.xlsx 兵庫県 45375 須賀由実 スガユミ
sampleData_04_02.xlsx 兵庫県 72309 河口雄一 カワグチユウイチ
sampleData_04_02.xlsx 福岡県 33499 滝本秀実 タキモトヒデミ
sampleData_04_02.xlsx 福岡県 26946 小林公男 コバヤシキミオ
sampleData_04_02.xlsx 福岡県 98843 村瀬金造 ムラセキンゾウ
sampleData_04_02.xlsx 福岡県 18863 鶴田憲司 ツルタケンジ
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
1.列変更ノードを配置する
ノードパネルから列変更ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します