クラスタリングの結果を図で確認しましょう。Recruit
とCustom
の散布図、Shirt
とAccessory
の散布図をみてみましょう。
また、各クラスターごとに、各属性の傾向を箱ひげ図でみてみましょう。
# 前回のプログラムの読込
%run 2.ipynb
df0.head()
%matplotlib inline
import matplotlib.pyplot as plt
# RecruitとCustomの散布図
plt.scatter(df0.Recruit, df0.Custom)
plt.scatter(df1.Recruit, df1.Custom)
plt.xlabel('Recruit')
plt.ylabel('Custom');
# ShirtとAccessoryの散布図
plt.scatter(df0.Shirt, df0.Accessory)
plt.scatter(df1.Shirt, df1.Accessory)
plt.xlabel('Shirt')
plt.ylabel('Accessory');
散布図の確認
scatter
で散布図を出せます。xlabel
やylabel
で、X軸やY軸のラベルを指定できます。
Recruit
列とCustom
列の散布図を見てみると、Recruit
列が売れているクラスターとCustom
列が売れているクラスターに分かれています。
それぞれのクラスターを、以下のようによぶことにします。
Recruit
系:ラベルが1であるdf1
に対応し、散布図ではオレンジ。Custom
系:ラベルが0であるdf0
に対応し、散布図では青。
Shirt
列とAccessory
列の散布図では、綺麗に分かれてはいませんが、Recruit
系は小ぢんまりしていて、Custom
系はバラついているといえそうです。
# ラベル0の箱ひげ図
plt.ylim(0, 90000)
df0.boxplot();
# ラベル1の箱ひげ図
plt.ylim(0, 90000)
df1.boxplot();
ylim
でY軸の値の範囲を指定できます。ここでは、2つのグラフの範囲を揃えて比較しやすいように指定しています。boxplot
で箱ひげ図を表示します。
箱ひげ図でも、Recruit
系とCustom
系の差異が見てとれます。
ラベル0のCustom
系では、Custom
列が売れており、ラベル1のRecruit
系では、Recruit
列が売れています。
このことから、Recruit
系とCustom
系をターゲットとしたマネキンを考えると、顧客に訴求しそうです。
コメント