博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
scikit-learn 学习笔记-- Generalized Linear Models (二)
阅读量:4952 次
发布时间:2019-06-11

本文共 2583 字,大约阅读时间需要 8 分钟。

Lasso regression

今天介绍另外一种带正则项的线性回归, ridge regression 的正则项是二范数,还有另外一种是一范数的,也就是lasso 回归,lasso 回归的正则项是系数的绝对值之和,这种正则项会让系数最后变得稀疏:

minw12NXwy22+αw1minw12N‖Xw−y‖22+α‖w‖1

其中,NN 是样本的个数。

Elastic Net

Elastic Net 这种线性回归将二范数和一范数的正则都考虑进去了,两种正则项以某种权重的方式组合在一起,所以类似一种弹性的模型,这大概也是其名称的由来吧,elastic net 的目标函数为:

minw12NXwy22+αρw1+α(1ρ)2w22minw12N‖Xw−y‖22+αρ‖w‖1+α(1−ρ)2‖w‖22

elastic net 模型可以让模型像 lasso regression 一样具有一定的稀疏性,同时又保持 ridge regression 的稳定性

import numpy as npimport matplotlib.pyplot as pltfrom sklearn.metrics import r2_scorenp.random.seed(42)n_samples, n_features = 100, 100X = np.random.randn(n_samples, n_features)coef = 3 * np.random.randn(n_features)inds = np.arange(n_features)np.random.shuffle(inds)coef[inds[10:]] = 0  # sparsify coefy = np.dot(X, coef)# add noisey += 0.01 * np.random.normal(size=n_samples)# Split data in train set and test setn_samples = X.shape[0]X_train, y_train = X[:n_samples // 2], y[:n_samples // 2]X_test, y_test = X[n_samples // 2:], y[n_samples // 2:]# ############################################################################## Lassofrom sklearn.linear_model import Lassoalpha = 0.1lasso = Lasso(alpha=alpha)y_pred_lasso = lasso.fit(X_train, y_train).predict(X_test)r2_score_lasso = r2_score(y_test, y_pred_lasso)print(lasso)print("r^2 on test data : %f" % r2_score_lasso)# ############################################################################## ElasticNetfrom sklearn.linear_model import ElasticNetenet = ElasticNet(alpha=alpha, l1_ratio=0.7)y_pred_enet = enet.fit(X_train, y_train).predict(X_test)r2_score_enet = r2_score(y_test, y_pred_enet)print(enet)print("r^2 on test data : %f" % r2_score_enet)plt.plot(enet.coef_, color='lightgreen', linewidth=2,         label='Elastic net coefficients')plt.plot(lasso.coef_, color='gold', linewidth=2,         label='Lasso coefficients')plt.plot(coef, '--', color='navy', label='original coefficients')plt.legend(loc='best')plt.title("Lasso R^2: %f, Elastic Net R^2: %f"          % (r2_score_lasso, r2_score_enet))plt.show()######################### **output**:Lasso(alpha=0.1, copy_X=True, fit_intercept=True, max_iter=1000,   normalize=False, positive=False, precompute=False, random_state=None,   selection='cyclic', tol=0.0001, warm_start=False)r^2 on test data : 0.992118ElasticNet(alpha=0.1, copy_X=True, fit_intercept=True, l1_ratio=0.7,      max_iter=1000, normalize=False, positive=False, precompute=False,      random_state=None, selection='cyclic', tol=0.0001, warm_start=False)r^2 on test data : 0.946100#########################

这里写图片描述

转载于:https://www.cnblogs.com/mtcnn/p/9412112.html

你可能感兴趣的文章
如何让windows版Safari支持H5 audio/video?
查看>>
Android开源项目源码下载(不断更新中)
查看>>
opendove中的odgw所需要的内核模块
查看>>
记录cmder安装和更换背景图
查看>>
PS完美破解安装
查看>>
const函数
查看>>
第一天开通博客园
查看>>
HDU1754(线段树)
查看>>
如何去掉HTML5Viewer中的滚动条
查看>>
并查集 分类: 并查集 2015-07-09 16:...
查看>>
Oracle数据文件迁移
查看>>
ORACLE基本操作
查看>>
KernelZ02_尝试过程
查看>>
NGUIJoysticK
查看>>
JavaScript之DOM转Jquery对象
查看>>
Windows下Redis安装及使用
查看>>
《程序员修炼之道》读后感02
查看>>
[转]虚拟现实和现实增强技术带来的威胁
查看>>
Typecho 新浪登陆插件 Sinauth
查看>>
个人进度(13)
查看>>