在绘制一维回归的图像时,这个小例子采用随机数进行一个简单的操作,一共分为五步:导入用到的库;创建一条含有噪声的曲线;实例化训练模型;将测试集导入模型,预测结果;画图观察哪种模型的效果更好。
1、导入需要用到的库
import numpy as np from sklearn.tree import DecisionTreeRegressor import matplotlib.pyplot as plt2、创建一条含有噪声的正弦曲线
rng = np.random.RandomState(1) # 生成随机数种子,可以输入任意的一个整数,目的是为了生成同一棵树 # x 的生成rng.rand() 用于生成0~1之间的随机数,可以随意指定随机数的个数,维度 # 要将生成的随机数导到回归树中,进行拟合,fit接口不允许导一维数据,所以,应生成二维的矩阵 # 使用np.sort(),默认是升序,进行排序 x = np.sort(5 * rng.rand(80,1),axis = 0) # y即标签列只能是一维的,因为x是二维的,所以用ravel()来降维 y = np.sin(x).ravel() # 添加噪声,通过给某些数字,加上或减去随机数,使用切片,符合现实的数据 # (0.5 - rng.rand(16)) 使得随机数变成(-0.5~0.5),3代表将随机数扩大几倍 y[::5] += 3* (0.5 - rng.rand(16))3、实例化 & 训练模型
regr_1 = DecisionTreeRegressor(max_depth=2) regr_2 = DecisionTreeRegressor(max_depth=5) regr_1.fit(x, y) regr_2.fit(x, y)4、测试集导入模型,预测结果
# np.arrange(开始点,结束点,步长) 取出有顺序的值;[:, np.newaxis] 用来增维的 X_test = np.arange(0.0, 5.0, 0.01)[:, np.newaxis] y_1 = regr_1.predict(X_test) # 导入样本点后,每个数值的回归或分类树的预测结果 y_2 = regr_2.predict(X_test)5、绘制图像
plt.figure() plt.scatter(x, y, s=20, edgecolor="black",c="darkorange", label="data") # s是指图像的大小 plt.plot(X_test, y_1, color="cornflowerblue",label="max_depth=2", linewidth=2) plt.plot(X_test, y_2, color="yellowgreen", label="max_depth=5", linewidth=2) plt.xlabel("data") plt.ylabel("target") plt.title("Decision Tree Regression") plt.legend() plt.show() # 可以发现最大深度等于5的容易受到噪声的影响,远远没有最大深度等于2的对原本的曲线的模拟效果好