クラスタリングの結果を画で確認

クラスタリングの結果を図で確認しましょう。
RecruitCustomの散布図、ShirtAccessoryの散布図をみてみましょう。
また、各クラスターごとに、各属性の傾向を箱ひげ図でみてみましょう。

# 前回のプログラムの読込
%run 2.ipynb
df0.head()
%matplotlib inline
import matplotlib.pyplot as plt

# RecruitとCustomの散布図
plt.scatter(df0.Recruit, df0.Custom)
plt.scatter(df1.Recruit, df1.Custom)
plt.xlabel('Recruit')
plt.ylabel('Custom');
# ShirtとAccessoryの散布図
plt.scatter(df0.Shirt, df0.Accessory)
plt.scatter(df1.Shirt, df1.Accessory)
plt.xlabel('Shirt')
plt.ylabel('Accessory');

散布図の確認

scatterで散布図を出せます。
xlabelylabelで、X軸やY軸のラベルを指定できます。

Recruit列とCustom列の散布図を見てみると、Recruit列が売れているクラスターとCustom列が売れているクラスターに分かれています。
それぞれのクラスターを、以下のようによぶことにします。

  • Recruit系:ラベルが1であるdf1に対応し、散布図ではオレンジ。
  • Custom系:ラベルが0であるdf0に対応し、散布図では青。

Shirt列とAccessory列の散布図では、綺麗に分かれてはいませんが、Recruit系は小ぢんまりしていて、Custom系はバラついているといえそうです。

# ラベル0の箱ひげ図
plt.ylim(0, 90000)
df0.boxplot();
# ラベル1の箱ひげ図
plt.ylim(0, 90000)
df1.boxplot();

ylimでY軸の値の範囲を指定できます。ここでは、2つのグラフの範囲を揃えて比較しやすいように指定しています。
boxplotで箱ひげ図を表示します。

箱ひげ図でも、Recruit系とCustom系の差異が見てとれます。
ラベル0のCustom系では、Custom列が売れており、ラベル1のRecruit系では、Recruit列が売れています。

このことから、Recruit系とCustom系をターゲットとしたマネキンを考えると、顧客に訴求しそうです。

コメント

タイトルとURLをコピーしました