機械学習

機械学習

機械学習実践 次元削除と可視化

特徴量の作成カテゴリカルデータの前処理などを行ったので再度次元削減を行い、結果を確認してみますPCAでデータを2次元に圧縮して可視化pca2=PCA(n_components=2)normalizeData=StandardScaler()...
機械学習

機械学習 データの可視化 python

seabornを使ったデータの可視化sns.countplot()を用いて正解ラベルの割合を確認可視化をすると正解ラベルが不均衡データであることが視覚的にも分かりますsns.countplot(x='default.payment.next...
機械学習

機械学習実践 前処理 python

importnumpyasnpimportpandasaspdimportpandas_profilingaspdpimportmatplotlib.pyplotasplt%matplotlibinlinefrommpl_toolkits....
機械学習

機械学習実践 学習データ 検証データ

【Point】一般的な機械学習のモデルの生成の流れ与えられたデータを学習データ、検証データに分割学習データを使ってモデルのパラメータをチューニング検証データでモデルの精度を測る機械学習タスクの第一歩としてはデータを学習データと検証データに分...
機械学習

機械学習実践 データの初期解析

パッケージのダウンロードとインポートimportnumpyasnp#!pipinstallnumpy#!condainstallnumpyimportpandasaspd#!pipinstallpandas#!condainstallpan...
機械学習

k-meansとk-means++

【k-meansのアルゴリズム】分割するクラスター数Kを決めるクラスターの中心点の初期値をランダムにK個選択する全てのデータ点と各中心点の距離を測るそれぞれのデータ点を最も近い中心点のクラスターに分類する。各クラスターのデータ点の重心を求め...
機械学習

Support Vector Machine 機械学習

ハードマージン#データの設定iris=load_iris()x=iris.data[:,[2,3]]#petal_lengthとpetal_widthy=iris.targetX_train,X_test,Y_train,Y_test=tr...
機械学習

K近傍法 機械学習

#KNNを試しにK=3でやってみるfromsklearn.neighborsimportKNeighborsClassifierkn=KNeighborsClassifier(n_neighbors=3)#ここの数字を変えることでKを変えら...
機械学習

機械学習 ロジスティック回帰

#モジュールimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportwarningswarnings.filterwarnings("ignore")fromskle...
機械学習

評価指標(回帰)

#pandasのインポートimportpandasaspd#データの読み込みboston=pd.read_csv('boston.csv')diabetes=pd.read_csv("diabetes.csv")#予測値のデータ読み込みbo...