こんにちは、ぱそきいろです。
最近仕事で財務表を見る機会が増えています。
数字が多く、企業を一つずつ見るのは大変なので、クラスター分類してみます。
最後にクラスごとに特徴をみていきます。
昔ポケモンを分類した時の方法を企業に当てはめて、売上高や借金の多さで分類させます。
データ収集
以下のサイトに企業のデータ一覧があったので、ありがたく使わせていただきます。
ここにはBS、CF、PL、配当があるのでこの中から必要なデータだけを抽出して使います。
とりあえず今回は分かりやすい、総資産、売上高、純資産配当率、短期借入金、長期借入金、自己資本比率、ROE、ROA、EPSを正規化して分類します。
コードはここに置いておきます。
基本的にポケモンの時と同じ方法で分類しています。
考察
クラスター分析の結果をグラフにしたものが以下です。
なお、企業名一覧も出力しているのですが、長くなるので割愛します。
githubにコードを上げているので各自で動かして確認してみてください。
出力したクラスターのうち、特徴的なものをピックアップして詳しくみていきます。
クラス23(総資産が多い)
23 |
7182 |
ゆうちょ銀行 |
23 |
8411 |
みずほフィナンシャルグループ |
23 |
8316 |
三井住友フィナンシャルグループ |
23 |
8306 |
三菱UFJフィナンシャル・グループ |
23 |
6178 |
日本郵政 |
見事に銀行関係が集まりました。
事業形態上(お金を集めて貸すのが仕事)なので顕著に出たのかもしれません。
クラス26(ROEが高い)
26 |
1375 |
雪国まいたけ |
通常ROEが高いのは良いことだが、雪国まいたけは120%と異常。
IPOしたてなのが原因?
クラス39(借入金が多い)
39 |
8058 |
三菱商事 |
39 |
4502 |
武田薬品工業 |
短期、長期共に借入金が多いです。
武田薬品工業はシャイヤーを買収するとニュースになっていました。
クラス44(短期借入金が多い)
44 |
8601 |
大和証券グループ本社 |
44 |
9501 |
東京電力ホールディングス |
クラス48(売上高が多い)
48 |
7203 |
トヨタ自動車 |
さすが天下のトヨタと言ったところですかね。
まとめ
企業の財務データをクラスター分析しました。
個人的にはもう少し業種ごとに分かれるかなと思ってたのですが、イマイチ顕著に現れませんでした。
分析に使うデータを変更して再度試してみたいです。