2022-03

python code

クロスバリデーション

これまでに2つのハイパーパラメーターが登場しました。LogisticRegressionのCDecisionTreeClassifierのmax_depthクロスバリデーションを使って、最適なハイパーパラメーターを求めましょう(ハイパーパラ...
python code

決定木解析:過学習

ノイズを使ったモデルは、トレーニングデータにはよく当てはまりますが、テストデータにはあまり当てはまりません。この状態が、過学習です。モデルは複雑にするほど、過学習の傾向が出ます。決定木では、max_depthオプションでモデルの複雑さを変更...
日記

効率よく生きることのススメ

最近は筋トレにはまっている。地域の体育館でおじいちゃん、おばあちゃんと一緒に筋トレしていたんだけど、奥さんがジム通いしたそうだったので、夫婦で利用できる安いジムを契約しました。筋トレはモチベーションを保つために、Youtube見たり、筋トレ...
python code

次元削除:主成分分析

自然言語処理で使われる文書や、画像処理で使われる画像などから生成されるデータは、1サンプルが高次元になることが多いです。高次元のデータは、複雑な処理になったり計算時間がかかったりします。全ての情報が必要かというと、重要性の低い情報も多く含ま...
python code

クラスタリングの結果を画で確認

クラスタリングの結果を図で確認しましょう。RecruitとCustomの散布図、ShirtとAccessoryの散布図をみてみましょう。また、各クラスターごとに、各属性の傾向を箱ひげ図でみてみましょう。#前回のプログラムの読込%run2.i...
python code

クラスタリングについて

クラスタリングを学習することによって、顧客を特徴によって分割できます。うまく分割できれば、それぞれ別のモデルを作って精度を上げられます。クラスタリング(clustering)とは、機械学習の1種でデータ間の類似度にもとづいて、データをグルー...