Excelでもプログラミングでもないデータ加工と分析

Web上ですぐ使えるETLツール "HowData"を使ったデータ加工&分析を紹介しています

日本の医療コストは高いのか?

 日本に医療費は高齢化から年間42兆円に拡大する一方で、医療費削減の議論も始まっている。ここでは、日本に医療費は他の国々に対して、高いのかどうかをデータで確認してみた。比べる指標はGDPの何%を医療費に使っているを用いた。

その結果が下記である。アメリカがダントツで、GDPの17.2%を医療費用に使っていた。次いでスイスが12.4%、ドイツが11.3%、日本が10.9%と続いている。

この指標からだけなら、日本の医療コストは高いと言えるだろう。しかし、単純に高齢化の進んだ国と進んでいない国を比較することはできない。

次は高齢化と併せた分析を行うこととする

f:id:howdata:20180414205039p:plain

 

データ加工フロー

f:id:howdata:20180414204942p:plain

データ加工がもっと簡単にできるインブラウザ型のデータ加工/分析サービス HowDataで行いました

howdata.io

 

1. データを取り込む (ファイル)

 

ノードへ入力されるデータ
 
  A B C D E F G H
1 "LOCATION" INDICATOR SUBJECT MEASURE FREQUENCY TIME Value Flag Codes
2 AUS HEALTHEXP TOT PC_GDP A 1971 4.544  
3 AUS HEALTHEXP TOT PC_GDP A 1972 4.544  
4 AUS HEALTHEXP TOT PC_GDP A 1973 4.507  
5 AUS HEALTHEXP TOT PC_GDP A 1974 5.109  
6 AUS HEALTHEXP TOT PC_GDP A 1975 5.757  
7 AUS HEALTHEXP TOT PC_GDP A 1976 5.773  
8 AUS HEALTHEXP TOT PC_GDP A 1977 6.073  
9 AUS HEALTHEXP TOT PC_GDP A 1978 5.935  
10 AUS HEALTHEXP TOT PC_GDP A 1979 5.824  
11 AUS HEALTHEXP TOT PC_GDP A 1980 5.824  
12 AUS HEALTHEXP TOT PC_GDP A 1981 5.834  
13 AUS HEALTHEXP TOT PC_GDP A 1982 6.101  
14 AUS HEALTHEXP TOT PC_GDP A 1983 6.044  
ノードから出力されるデータ(14,692)
 
"LOCATION" INDICATOR SUBJECT MEASURE FREQUENCY TIME Value Flag Codes
AUS HEALTHEXP TOT PC_GDP A 1971 4.544  
AUS HEALTHEXP TOT PC_GDP A 1972 4.544  
AUS HEALTHEXP TOT PC_GDP A 1973 4.507  
AUS HEALTHEXP TOT PC_GDP A 1974 5.109  
AUS HEALTHEXP TOT PC_GDP A 1975 5.757  
AUS HEALTHEXP TOT PC_GDP A 1976 5.773  
AUS HEALTHEXP TOT PC_GDP A 1977 6.073  
AUS HEALTHEXP TOT PC_GDP A 1978 5.935  
AUS HEALTHEXP TOT PC_GDP A 1979 5.824  
AUS HEALTHEXP TOT PC_GDP A 1980 5.824  
AUS HEALTHEXP TOT PC_GDP A 1981 5.834  
AUS HEALTHEXP TOT PC_GDP A 1982 6.101  
AUS HEALTHEXP TOT PC_GDP A 1983 6.044  
AUS HEALTHEXP TOT PC_GDP A 1984 6.016  

1.1ファイルノードを配置する
ノードパネルからファイルノーをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
1.2ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

1.3ファイルを選択する
ファイル選択フォームからDP_LIVE_14042018100247125.csvを選択します
1.4ワークシートを選択する
DP_LIVE_14042018100247125.csvに含まれるワークシートcsvチェックボックスを選択します
1.5列名となるデータ範囲を指定する
A1~H1の範囲をカーソルで指定後、[列名の範囲にする]ボタンをクリックします
1.6編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

2. 列を変更する (列変更)

 

ノードへ入力されるデータ(14,692)
 
"LOCATION" INDICATOR SUBJECT MEASURE FREQUENCY TIME Value Flag Codes
AUS HEALTHEXP TOT PC_GDP A 1971 4.544  
AUS HEALTHEXP TOT PC_GDP A 1972 4.544  
AUS HEALTHEXP TOT PC_GDP A 1973 4.507  
AUS HEALTHEXP TOT PC_GDP A 1974 5.109  
AUS HEALTHEXP TOT PC_GDP A 1975 5.757  
AUS HEALTHEXP TOT PC_GDP A 1976 5.773  
AUS HEALTHEXP TOT PC_GDP A 1977 6.073  
AUS HEALTHEXP TOT PC_GDP A 1978 5.935  
AUS HEALTHEXP TOT PC_GDP A 1979 5.824  
AUS HEALTHEXP TOT PC_GDP A 1980 5.824  
AUS HEALTHEXP TOT PC_GDP A 1981 5.834  
AUS HEALTHEXP TOT PC_GDP A 1982 6.101  
AUS HEALTHEXP TOT PC_GDP A 1983 6.044  
AUS HEALTHEXP TOT PC_GDP A 1984 6.016  
ノードから出力されるデータ(14,692)
 
国コード INDICATOR SUBJECT MEASURE GDP%
AUS HEALTHEXP TOT PC_GDP 1971 4.544
AUS HEALTHEXP TOT PC_GDP 1972 4.544
AUS HEALTHEXP TOT PC_GDP 1973 4.507
AUS HEALTHEXP TOT PC_GDP 1974 5.109
AUS HEALTHEXP TOT PC_GDP 1975 5.757
AUS HEALTHEXP TOT PC_GDP 1976 5.773
AUS HEALTHEXP TOT PC_GDP 1977 6.073
AUS HEALTHEXP TOT PC_GDP 1978 5.935
AUS HEALTHEXP TOT PC_GDP 1979 5.824
AUS HEALTHEXP TOT PC_GDP 1980 5.824
AUS HEALTHEXP TOT PC_GDP 1981 5.834
AUS HEALTHEXP TOT PC_GDP 1982 6.101
AUS HEALTHEXP TOT PC_GDP 1983 6.044
AUS HEALTHEXP TOT PC_GDP 1984 6.016

2.1列変更ノードを配置する
ノードパネルから列変更ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
2.2ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

2.3ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

2.4列を削除する
FREQUENCY,Flag Codesのフィルターボタンをクリックして、列を削除します
2.5列名を変更する
列名を"LOCATION"から国コードに変更します。,同様にTIMEからに,ValueからGDP%に変更します
2.6編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

3. 条件抽出をする (条件抽出)

 

ノードへ入力されるデータ(14,692)
 
国コード INDICATOR SUBJECT MEASURE GDP%
AUS HEALTHEXP TOT PC_GDP 1971 4.544
AUS HEALTHEXP TOT PC_GDP 1972 4.544
AUS HEALTHEXP TOT PC_GDP 1973 4.507
AUS HEALTHEXP TOT PC_GDP 1974 5.109
AUS HEALTHEXP TOT PC_GDP 1975 5.757
AUS HEALTHEXP TOT PC_GDP 1976 5.773
AUS HEALTHEXP TOT PC_GDP 1977 6.073
AUS HEALTHEXP TOT PC_GDP 1978 5.935
AUS HEALTHEXP TOT PC_GDP 1979 5.824
AUS HEALTHEXP TOT PC_GDP 1980 5.824
AUS HEALTHEXP TOT PC_GDP 1981 5.834
AUS HEALTHEXP TOT PC_GDP 1982 6.101
AUS HEALTHEXP TOT PC_GDP 1983 6.044
AUS HEALTHEXP TOT PC_GDP 1984 6.016
ノードから出力されるデータ(5,302)
 
国コード INDICATOR SUBJECT MEASURE GDP%
AUS HEALTHEXP TOT PC_GDP 1972 4.544
AUS HEALTHEXP TOT PC_GDP 1973 4.507
AUS HEALTHEXP TOT PC_GDP 1974 5.109
AUS HEALTHEXP TOT PC_GDP 1975 5.757
AUS HEALTHEXP TOT PC_GDP 1976 5.773
AUS HEALTHEXP TOT PC_GDP 1977 6.073
AUS HEALTHEXP TOT PC_GDP 1978 5.935
AUS HEALTHEXP TOT PC_GDP 1979 5.824
AUS HEALTHEXP TOT PC_GDP 1980 5.824
AUS HEALTHEXP TOT PC_GDP 1981 5.834
AUS HEALTHEXP TOT PC_GDP 1982 6.101
AUS HEALTHEXP TOT PC_GDP 1983 6.044
AUS HEALTHEXP TOT PC_GDP 1984 6.016
AUS HEALTHEXP TOT PC_GDP 1985 6.067

3.1条件抽出ノードを配置する
ノードパネルから条件抽出ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
3.2ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

3.3ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

3.4指定した値だけ削除する
MEASUREのうちUSD_CAP,PC_HEALTHXPのチェックをはずします。外されたチェックの値だけ削除されます
3.5抽出条件を書き込む
下記の条件式を書き込みます。列名を引用する場合には [列目] のように列名を[]で囲みます
3.6編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

4. 列を変更する (列変更)

 

ノードへ入力されるデータ(5,302)
 
国コード INDICATOR SUBJECT MEASURE GDP%
AUS HEALTHEXP TOT PC_GDP 1972 4.544
AUS HEALTHEXP TOT PC_GDP 1973 4.507
AUS HEALTHEXP TOT PC_GDP 1974 5.109
AUS HEALTHEXP TOT PC_GDP 1975 5.757
AUS HEALTHEXP TOT PC_GDP 1976 5.773
AUS HEALTHEXP TOT PC_GDP 1977 6.073
AUS HEALTHEXP TOT PC_GDP 1978 5.935
AUS HEALTHEXP TOT PC_GDP 1979 5.824
AUS HEALTHEXP TOT PC_GDP 1980 5.824
AUS HEALTHEXP TOT PC_GDP 1981 5.834
AUS HEALTHEXP TOT PC_GDP 1982 6.101
AUS HEALTHEXP TOT PC_GDP 1983 6.044
AUS HEALTHEXP TOT PC_GDP 1984 6.016
AUS HEALTHEXP TOT PC_GDP 1985 6.067
ノードから出力されるデータ(5,302)
 
国コード MEASURE GDP% INDICATOR SUBJECT
AUS PC_GDP 1972 4.544 HEALTHEXP TOT
AUS PC_GDP 1973 4.507 HEALTHEXP TOT
AUS PC_GDP 1974 5.109 HEALTHEXP TOT
AUS PC_GDP 1975 5.757 HEALTHEXP TOT
AUS PC_GDP 1976 5.773 HEALTHEXP TOT
AUS PC_GDP 1977 6.073 HEALTHEXP TOT
AUS PC_GDP 1978 5.935 HEALTHEXP TOT
AUS PC_GDP 1979 5.824 HEALTHEXP TOT
AUS PC_GDP 1980 5.824 HEALTHEXP TOT
AUS PC_GDP 1981 5.834 HEALTHEXP TOT
AUS PC_GDP 1982 6.101 HEALTHEXP TOT
AUS PC_GDP 1983 6.044 HEALTHEXP TOT
AUS PC_GDP 1984 6.016 HEALTHEXP TOT
AUS PC_GDP 1985 6.067 HEALTHEXP TOT

4.1列変更ノードを配置する
ノードパネルから列変更ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
4.2ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

4.3ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

4.4列のデータ型を変更する
GDP%のデータ型をtextからfloatに変更します
4.5編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

5. 条件抽出をする (条件抽出)

 

ノードへ入力されるデータ(5,302)
 
国コード MEASURE GDP% INDICATOR SUBJECT
AUS PC_GDP 1972 4.544 HEALTHEXP TOT
AUS PC_GDP 1973 4.507 HEALTHEXP TOT
AUS PC_GDP 1974 5.109 HEALTHEXP TOT
AUS PC_GDP 1975 5.757 HEALTHEXP TOT
AUS PC_GDP 1976 5.773 HEALTHEXP TOT
AUS PC_GDP 1977 6.073 HEALTHEXP TOT
AUS PC_GDP 1978 5.935 HEALTHEXP TOT
AUS PC_GDP 1979 5.824 HEALTHEXP TOT
AUS PC_GDP 1980 5.824 HEALTHEXP TOT
AUS PC_GDP 1981 5.834 HEALTHEXP TOT
AUS PC_GDP 1982 6.101 HEALTHEXP TOT
AUS PC_GDP 1983 6.044 HEALTHEXP TOT
AUS PC_GDP 1984 6.016 HEALTHEXP TOT
AUS PC_GDP 1985 6.067 HEALTHEXP TOT
ノードから出力されるデータ(1,436)
 
国コード MEASURE GDP% INDICATOR SUBJECT
AUS PC_GDP 1972 4.544 HEALTHEXP TOT
AUS PC_GDP 1973 4.507 HEALTHEXP TOT
AUS PC_GDP 1974 5.109 HEALTHEXP TOT
AUS PC_GDP 1975 5.757 HEALTHEXP TOT
AUS PC_GDP 1976 5.773 HEALTHEXP TOT
AUS PC_GDP 1977 6.073 HEALTHEXP TOT
AUS PC_GDP 1978 5.935 HEALTHEXP TOT
AUS PC_GDP 1979 5.824 HEALTHEXP TOT
AUS PC_GDP 1980 5.824 HEALTHEXP TOT
AUS PC_GDP 1981 5.834 HEALTHEXP TOT
AUS PC_GDP 1982 6.101 HEALTHEXP TOT
AUS PC_GDP 1983 6.044 HEALTHEXP TOT
AUS PC_GDP 1984 6.016 HEALTHEXP TOT
AUS PC_GDP 1985 6.067 HEALTHEXP TOT

5.1条件抽出ノードを配置する
ノードパネルから条件抽出ノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
5.2ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

5.3ノード編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます

5.4指定した値だけ削除する
SUBJECTのうちOOPEXP,COMPULSORY,VOLUNTARYのチェックをはずします。外されたチェックの値だけ削除されます
5.5編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します

6. グラフを作成する (国別 医療費(対GDP%))

 

ノードへ入力されるデータ(1,436)
 
国コード MEASURE GDP% INDICATOR SUBJECT
AUS PC_GDP 1972 4.544 HEALTHEXP TOT
AUS PC_GDP 1973 4.507 HEALTHEXP TOT
AUS PC_GDP 1974 5.109 HEALTHEXP TOT
AUS PC_GDP 1975 5.757 HEALTHEXP TOT
AUS PC_GDP 1976 5.773 HEALTHEXP TOT
AUS PC_GDP 1977 6.073 HEALTHEXP TOT
AUS PC_GDP 1978 5.935 HEALTHEXP TOT
AUS PC_GDP 1979 5.824 HEALTHEXP TOT
AUS PC_GDP 1980 5.824 HEALTHEXP TOT
AUS PC_GDP 1981 5.834 HEALTHEXP TOT
AUS PC_GDP 1982 6.101 HEALTHEXP TOT
AUS PC_GDP 1983 6.044 HEALTHEXP TOT
AUS PC_GDP 1984 6.016 HEALTHEXP TOT
AUS PC_GDP 1985 6.067 HEALTHEXP TOT
ノードから出力されるデータ(0)
 

6.1グラフノードを配置する
ノードパネルからグラフノードをクリックして選択します。クリック後、フローシート上で配置したい場所にカーソルを合わせ、再びクリックします
6.2ノードを接続する
データを処理する順番にノードを接続する必要がありますが、接続方法には2つあります

6.3編集画面を開く
ノードをクリックすると、選択パネルが表示されます、編集するをクリックすると編集画面が表示されます


6.4横軸の列を選択する
を横軸として選択します
6.5縦軸の列を選択する
GDP%を縦軸として選択します
6.6グラフ内で別系列に分けるための列を選択する
国コードを同じグラフ内で別の系列に分けるデータとして選択します
6.7グラフの線サイズを変更する
グラフの線サイズ変更として、JPN6 を選択します
6.8グラフ全体のサイズを変更する
グラフのサイズとして、480_960 を選択します
6.9グラフタイトルを設定する
グラフタイトルに 医療費(対GDP%)を入力します。
6.10凡例を設定する
凡例の表示位置として right を選択します。文字サイズに6を選択します
6.11編集内容を保存する
[保存して閉じる]ボタンをクリックし、ノード編集を終了します