Excelでもプログラミングでもないデータ加工と分析

Web上ですぐ使えるETLツール "HowData"を使ったデータ加工&分析を紹介しています

米国と各国との貿易収支はどうなっているのか?

 米国が、対中貿易赤字知的財産権の侵害を理由に1000億ドル(10.7兆円ぐらい)の貿易制裁を検討しているという。これに対して、中国は貿易制裁が実行されれば反撃を行うとの声明をすでに出している。「米中経済戦争が始まった!」、との声も聞かれる。ここでは、まずは1000億ドルが米国の貿易収支に対してどの程度の規模であるかをデータで確認しみる。データ加工の手順は
  1. 米国商務省経済分析局から国別貿易収支データを取得する
  2. データがExcelの表形式なので再集計しやすいようにデータ加工する
  3. データの取捨選択をする
  4. グラフを作成する
以下が作成したグラフです。
 
2017年の米国の貿易収支は5660億ドル(60兆円ぐらい)の赤字です。
対中貿易赤字3371億ドル(36兆円ぐらい)で、このうち10.7兆円に対して関税を強化することを検討していることになります。
 
 一方、日本は688億ドル(7.4兆円ほど)で中国の20%ほどです。また、2017年に大きく変化したのがメキシコで、692億ドル(7.4兆円ほど)で日本とほぼ同じくらいになりました。
f:id:howdata:20180408152834p:plain
 
Excelで今回のデータ加工&分析をする場合、厄介になるのが、表形式をリスト形式へ、横持ちデータを縦持ちデータのデータ加工です。 これらの処理が簡単にできるインブラウザ型のデータ加工/分析サービス HowDataで作成しました
 

howdata.io


f:id:howdata:20180407210106p:plain

1. データを取り込む (米国貿易収支)

アメリカ合衆国商務省経済分析局 米国 - 各国の貿易収支 https://www.bea.gov/international/index.htm#trade https://www.bea.gov/newsreleases/international/trade/trad_geo_time_series.xlsx
ノードへ入力されるデータ
 
  A B C D E F G H I J K L M N O P Q R S T U
1 Last updated March 7, 2018                                        
2 Table 3. U.S. International Trade by Selected Countries and Areas                                        
3 Balance on Goods and Services                                        
4 [Millions of dollars, quarters seasonally adjusted]                                        
5 Quarters may not sum to annual totals due to rounding.                                        
6                                          
7 Period Brazil Canada China France Germany Hong Kong India Italy Japan Korea, South Mexico Saudi Arabia Singapore Taiwan United Kingdom All other countries CAFTA-DR European Union OPEC (1) South/ Central America
8 Annual                                        
9 1999 6,146 -28,131 -67,440 -4,925 -25,712 1,536 -4,722 -12,945 -55,936 -7,402 -19,298 2,179 1,310 -14,373 2,282 -31,185 n.a. -28,499 -13,635 7,449
10 2000 6,474 -47,889 -81,969 -10,070 -29,603 2,042 -6,140 -15,127 -62,966 -11,459 -21,182 -6,505 3,041 -14,382 1,739 -78,523 n.a. -46,997 -41,661 -3,251
11 2001 5,605 -48,285 -81,380 -10,580 -31,279 3,705 -4,668 -15,412 -55,378 -12,363 -25,545 -5,936 6,601 -13,759 2,093 -74,931 n.a. -57,710 -33,870 -3,964
12 2002 101 -44,078 -101,870 -8,844 -40,029 2,687 -6,372 -15,088 -56,862 -11,769 -33,264 -7,491 5,357 -13,045 -2,160 -86,226 n.a. -73,947 -31,465 -15,558
13 2003 -3,584 -46,922 -122,705 -11,613 -43,496 4,517 -6,306 -15,933 -54,002 -11,848 -36,558 -12,976 5,138 -14,085 -4,333 -119,183 n.a. -87,264 -49,804 -29,554
14 2004 -4,236 -61,356 -161,505 -9,631 -49,620 4,873 -7,703 -19,662 -61,420 -18,494 -42,204 -14,218 6,985 -12,659 -875 -158,158 n.a. -95,427 -70,365 -42,541
ノードから出力されるデータ(10,620)
 
Left__0 Top__0 Top__1 Value
1999 Brazil   6,146
1999 Canada   -28,131
1999 China   -67,440
1999 France   -4,925
1999 Germany   -25,712
1999 Hong Kong   1,536
1999 India   -4,722
1999 Italy   -12,945
1999 Japan   -55,936
1999 Korea, South   -7,402
1999 Mexico   -19,298
1999 Saudi Arabia   2,179
1999 Singapore   1,310
1999 Taiwan   -14,373
1.ファイルノードを配置する
ノードパネルからファイルノーをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

3.ファイルを選択する
ファイル選択フォームからtrad_geo_time_series (1).xlsxを選択します
4.ワークシートを選択する
trad_geo_time_series (1).xlsxに含まれるワークシートTable 3 チェックボックスを選択します
5.列名となるデータ範囲を指定する
A7~U8の範囲をカーソルで指定後、[列名の範囲にする]ボタンをクリックします
6.表形式からリスト形式へデータ構成を変更する
A1~A539の範囲をカーソルで指定後、[リスト形式の範囲にする]ボタンをクリックします
7.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

2. 列を変更する (列変更)

 
ノードへ入力されるデータ(10,620)
 
Left__0 Top__0 Top__1 Value
1999 Brazil   6,146
1999 Canada   -28,131
1999 China   -67,440
1999 France   -4,925
1999 Germany   -25,712
1999 Hong Kong   1,536
1999 India   -4,722
1999 Italy   -12,945
1999 Japan   -55,936
1999 Korea, South   -7,402
1999 Mexico   -19,298
1999 Saudi Arabia   2,179
1999 Singapore   1,310
1999 Taiwan   -14,373
ノードから出力されるデータ(10,620)
 
国名 Value
1999 Brazil 6146
1999 Canada -28131
1999 China -67440
1999 France -4925
1999 Germany -25712
1999 Hong Kong 1536
1999 India -4722
1999 Italy -12945
1999 Japan -55936
1999 Korea, South -7402
1999 Mexico -19298
1999 Saudi Arabia 2179
1999 Singapore 1310
1999 Taiwan -14373
1.列変更ノードを配置する
ノードパネルから列変更ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.列を削除する
Top__1のフィルターボタンをクリックして、列を削除します
5.列名を変更する
列名をLeft__0からに変更します。,同様にTop__0から国名に変更します
6.列のデータ型を変更する
Valueのデータ型をtextからfloatに変更します
7.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

3. 条件抽出をする (条件抽出)

 
ノードへ入力されるデータ(10,620)
 
国名 Value
1999 Brazil 6146
1999 Canada -28131
1999 China -67440
1999 France -4925
1999 Germany -25712
1999 Hong Kong 1536
1999 India -4722
1999 Italy -12945
1999 Japan -55936
1999 Korea, South -7402
1999 Mexico -19298
1999 Saudi Arabia 2179
1999 Singapore 1310
1999 Taiwan -14373
ノードから出力されるデータ(1,805)
 
国名 Value
1999 Brazil 6146
1999 Canada -28131
1999 China -67440
1999 France -4925
1999 Germany -25712
1999 Hong Kong 1536
1999 India -4722
1999 Italy -12945
1999 Japan -55936
1999 Korea, South -7402
1999 Mexico -19298
1999 Saudi Arabia 2179
1999 Singapore 1310
1999 Taiwan -14373
1.条件抽出ノードを配置する
ノードパネルから条件抽出ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.抽出条件を書き込む
下記の条件式を書き込みます。列名を引用する場合には [列目] のように列名をで囲みます
5.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

4. 条件抽出をする (条件抽出)

 
ノードへ入力されるデータ(1,805)
 
国名 Value
1999 Brazil 6146
1999 Canada -28131
1999 China -67440
1999 France -4925
1999 Germany -25712
1999 Hong Kong 1536
1999 India -4722
1999 Italy -12945
1999 Japan -55936
1999 Korea, South -7402
1999 Mexico -19298
1999 Saudi Arabia 2179
1999 Singapore 1310
1999 Taiwan -14373
ノードから出力されるデータ(361)
 
国名 Value
1999 Brazil 6146
1999 Canada -28131
1999 China -67440
1999 France -4925
1999 Germany -25712
1999 Hong Kong 1536
1999 India -4722
1999 Italy -12945
1999 Japan -55936
1999 Korea, South -7402
1999 Mexico -19298
1999 Saudi Arabia 2179
1999 Singapore 1310
1999 Taiwan -14373
1.条件抽出ノードを配置する
ノードパネルから条件抽出ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.抽出条件を書き込む
下記の条件式を書き込みます。列名を引用する場合には [列目] のように列名をで囲みます
5.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

5. 列を変更する (列変更)

 
ノードへ入力されるデータ(361)
 
国名 Value
1999 Brazil 6146
1999 Canada -28131
1999 China -67440
1999 France -4925
1999 Germany -25712
1999 Hong Kong 1536
1999 India -4722
1999 Italy -12945
1999 Japan -55936
1999 Korea, South -7402
1999 Mexico -19298
1999 Saudi Arabia 2179
1999 Singapore 1310
1999 Taiwan -14373
ノードから出力されるデータ(361)
 
貿易収支(100万ドル) 国名
1999 6146 Brazil
1999 -28131 Canada
1999 -67440 China
1999 -4925 France
1999 -25712 Germany
1999 1536 Hong Kong
1999 -4722 India
1999 -12945 Italy
1999 -55936 Japan
1999 -7402 Korea, South
1999 -19298 Mexico
1999 2179 Saudi Arabia
1999 1310 Singapore
1999 -14373 Taiwan
1.列変更ノードを配置する
ノードパネルから列変更ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.列名を変更する
列名をValueから貿易収支(100万ドル)に変更します。
5.列のデータ型を変更する
のデータ型をtextからintに変更します
6.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

6. 並び替えする (並べ替え)

 
ノードへ入力されるデータ(361)
 
貿易収支(100万ドル) 国名
1999 6146 Brazil
1999 -28131 Canada
1999 -67440 China
1999 -4925 France
1999 -25712 Germany
1999 1536 Hong Kong
1999 -4722 India
1999 -12945 Italy
1999 -55936 Japan
1999 -7402 Korea, South
1999 -19298 Mexico
1999 2179 Saudi Arabia
1999 1310 Singapore
1999 -14373 Taiwan
ノードから出力されるデータ(361)
 
貿易収支(100万ドル) 国名
1999 -31185 All other countries
2000 -78523 All other countries
2001 -74931 All other countries
2002 -86226 All other countries
2003 -119183 All other countries
2004 -158158 All other countries
2005 -192879 All other countries
2006 -193662 All other countries
2007 -147903 All other countries
2008 -163569 All other countries
2009 -64218 All other countries
2010 -94719 All other countries
2011 -101894 All other countries
2012 -45556 All other countries
1.並べ替えノードを配置する
ノードパネルから並べ替えノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.列名の並べ替え優先順位と昇順/降順を決定する
国名 ( 昇順 ) ,年 ( 昇順 ) の優先順位で並べ替えをします。
5.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

7. 条件抽出をする (条件抽出)

 
ノードへ入力されるデータ(361)
 
貿易収支(100万ドル) 国名
1999 -31185 All other countries
2000 -78523 All other countries
2001 -74931 All other countries
2002 -86226 All other countries
2003 -119183 All other countries
2004 -158158 All other countries
2005 -192879 All other countries
2006 -193662 All other countries
2007 -147903 All other countries
2008 -163569 All other countries
2009 -64218 All other countries
2010 -94719 All other countries
2011 -101894 All other countries
2012 -45556 All other countries
ノードから出力されるデータ(361)
 
貿易収支(100万ドル) 国名
1999 -31185 All other countries
2000 -78523 All other countries
2001 -74931 All other countries
2002 -86226 All other countries
2003 -119183 All other countries
2004 -158158 All other countries
2005 -192879 All other countries
2006 -193662 All other countries
2007 -147903 All other countries
2008 -163569 All other countries
2009 -64218 All other countries
2010 -94719 All other countries
2011 -101894 All other countries
2012 -45556 All other countries
1.条件抽出ノードを配置する
ノードパネルから条件抽出ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

8. グラフを作成する (グラフ)

 
ノードへ入力されるデータ(361)
 
貿易収支(100万ドル) 国名
1999 -31185 All other countries
2000 -78523 All other countries
2001 -74931 All other countries
2002 -86226 All other countries
2003 -119183 All other countries
2004 -158158 All other countries
2005 -192879 All other countries
2006 -193662 All other countries
2007 -147903 All other countries
2008 -163569 All other countries
2009 -64218 All other countries
2010 -94719 All other countries
2011 -101894 All other countries
2012 -45556 All other countries
ノードから出力されるデータ(0)
 
1.グラフノードを配置する
ノードパネルからグラフノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます


4.横軸の列を選択する
を横軸として選択します
5.縦軸の列を選択する
貿易収支(100万ドル)を縦軸として選択します
6.グラフ内で別系列に分けるための列を選択する
国名を同じグラフ内で別の系列に分けるデータとして選択します
7.積み上げグラフにする
グラフの値が積み上げになるようにチェックします。
8.グラフの種類を選択する
グラフの種類を選択していきます。 All other countries棒グラフBrazil棒グラフCanada棒グラフJapan棒グラフChina棒グラフEuropean Union棒グラフFrance棒グラフGermany棒グラフHong Kong棒グラフIndia棒グラフItaly棒グラフKorea, South棒グラフMexico棒グラフOPEC棒グラフSaudi Arabia棒グラフSingapore棒グラフSouth/Central America棒グラフTaiwan棒グラフUnited Kingdom棒グラフ を選択します
9.グラフ全体のサイズを変更する
グラフのサイズとして、480_960 を選択します
10.グラフタイトルを設定する
グラフタイトルに 米国と各国との貿易収支(100万ドル)を入力します。
11.編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します