Excelでもプログラミングでもないデータ加工と分析

Web上ですぐ使えるETLツール "HowData"を使ったデータ加工&分析を紹介しています

複数ワークシートにまたがるデータを1つにまとめる

 Excelでデータではよく、別々のシートにある表(データ)を1つにまとめる必要がでてきます。しかも、ワークシート名自体に年や月、地域名などデータ集計に必要な情報が含まれていることも珍しくありません。

 例えば、下のようなワークシート名に地域名が、各ワークシート上にはテーブルデータがあります。これを1つにまとめます。

データ集計の元になるExcelファイル

f:id:howdata:20180409152702p:plain

 

 これを、下のようにワークシート名がわかるよう1つのデータにまとめます。

 データ集計の目的となるデータ  
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
sampleData_04.xlsx 大阪府 68812 森田莉緒 モリタリオ
sampleData_04.xlsx 大阪府 88467 横井晴 ヨコイハル
sampleData_04.xlsx 京都府 96649 奥野健一 オクノケンイチ
sampleData_04.xlsx 京都府 39469 大城結依 オシロユイ
sampleData_04.xlsx 京都府 19221 並木敏郎 ナミキトシロウ
sampleData_04.xlsx 京都府 97969 岩崎忠治 イワサキタダハル

 


Excelを使う場合には データ=>統合 の作業を行うのが一般的ですが、処理がもっと簡単にできるインブラウザ型のデータ加工/分析サービス HowDataで行います。

 

howdata.io

 

f:id:howdata:20180409154530p:plain

1. データを取り込む (ファイル)

 

ノードへ入力されるデータ
 
  A B C D
1 ID 氏名 氏名(カタカナ) 性別
2 28290 大野昌之 オオノマサユキ
3 76951 寺崎強 テラサキツヨシ
4 47077 今井孝男 イマイタカオ
5 55689 原幸市 ハラコウイチ
ノードから出力されるデータ(12)
 
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
sampleData_04.xlsx 大阪府 68812 森田莉緒 モリタリオ
sampleData_04.xlsx 大阪府 88467 横井晴 ヨコイハル
sampleData_04.xlsx 京都府 96649 奥野健一 オクノケンイチ
sampleData_04.xlsx 京都府 39469 大城結依 オシロユイ
sampleData_04.xlsx 京都府 19221 並木敏郎 ナミキトシロウ
sampleData_04.xlsx 京都府 97969 岩崎忠治 イワサキタダハル
1.ファイルノードを配置する
ノードパネルからファイルノーをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

3.ファイルを選択する
ファイル選択フォームからsampleData_04.xlsxを選択します
4.ワークシートを選択する
sampleData_04.xlsxに含まれるワークシート東京都,大阪府,京都府チェックボックスを選択します
5.列名となるデータ範囲を指定する
A1~D1の範囲をカーソルで指定後、[列名の範囲にする]ボタンをクリックします
6.メタ情報を追加する
ファイル名やシート名、ヘッダー情報を追加するため、[ファイルメタ情報を追加する]のチェックボックスをクリックします
7.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

2. 列を変更する (列変更)

 

ノードへ入力されるデータ(12)
 
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
sampleData_04.xlsx 大阪府 68812 森田莉緒 モリタリオ
sampleData_04.xlsx 大阪府 88467 横井晴 ヨコイハル
sampleData_04.xlsx 京都府 96649 奥野健一 オクノケンイチ
sampleData_04.xlsx 京都府 39469 大城結依 オシロユイ
sampleData_04.xlsx 京都府 19221 並木敏郎 ナミキトシロウ
sampleData_04.xlsx 京都府 97969 岩崎忠治 イワサキタダハル
ノードから出力されるデータ(12)
 
__FileName__ __SheetName__ ID 氏名 氏名(カタカナ) 性別
sampleData_04.xlsx 東京都 28290 大野昌之 オオノマサユキ
sampleData_04.xlsx 東京都 76951 寺崎強 テラサキツヨシ
sampleData_04.xlsx 東京都 47077 今井孝男 イマイタカオ
sampleData_04.xlsx 東京都 55689 原幸市 ハラコウイチ
sampleData_04.xlsx 大阪府 93115 井村利郎 イムラトシロウ
sampleData_04.xlsx 大阪府 92825 山野昇一 ヤマノショウイチ
sampleData_04.xlsx 大阪府 68812 森田莉緒 モリタリオ
sampleData_04.xlsx 大阪府 88467 横井晴 ヨコイハル
sampleData_04.xlsx 京都府 96649 奥野健一 オクノケンイチ
sampleData_04.xlsx 京都府 39469 大城結依 オシロユイ
sampleData_04.xlsx 京都府 19221 並木敏郎 ナミキトシロウ
sampleData_04.xlsx 京都府 97969 岩崎忠治 イワサキタダハル
1.列変更ノードを配置する
ノードパネルから列変更ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します