2012年国赛A题论文研读

技术2026-03-30 35

前言问题论文思路和方法Wilcoxon 符号秩检验法：两组评价结果的有无显著性差异秩相关分析评价：判断对某种事物的主观评价是否（更）可靠判断正态分布P-P图和Q-Q图：直观判断单样本K-S检验：计算判断多级的评价体系：评分或定级一致化和无量纲化：数据预处理典型相关分析法：两组指标间的关系多元回归及其检验：论证某些指标（多个）能否反映单个指标资料

前言

2012A题是很典型的评价类问题，论文中涉及到许多的常规处理办法。本文以整理这些方法的思路为主，对题目只做简要的分析。有一些方法的资料是原文摘录的，会在段落开头给出来源。

问题

题目主要是对葡萄酒的评价，有4问：

分析附件1中两组评酒员的评价结果有无显著性差异，哪一组结果更可信？根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。分析酿酒葡萄与葡萄酒的理化指标之间的联系。分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响，并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量？

加粗部分就是题目中的要点，下面逐一分析。

论文思路和方法

Wilcoxon 符号秩检验法：两组评价结果的有无显著性差异

Wilcoxon 符号秩检验法用于判断两个样本是否来自相同的或相等的总体。可以用于同一研究对象分别给予两种不同处理的效果比较。在本例中因为两组品酒员分别对同一样本组进行评分，故两组数据为配对数据。对于两组配对数据的检验，需要引入适用于T检验中的成对比较。如果不要求成对数据之差服从正态分布，只要求对称分布，则使用Wilcoxon 符号秩检验法。其检验步骤（以红葡萄为例）如下（来自国赛论文）：

秩相关分析评价：判断对某种事物的主观评价是否（更）可靠

秩相关分析评价模型用肯德尔和谐系数判断对某种事物的主观评价是否可靠。肯德尔和谐系数是指“以等级次序排列或以等级次序表示的变量之间的相关”，它常用来刻画多个评价者对某一事物评判或评分的一致性程度。假设有M人对J个评价对象评分。步骤如下： Step1.将评分表中的数据进行秩变换，即把每个评价人员对各个被评要素的评分按顺序排号，化为等级分。 Step2.计算和谐系数 $r_{mj}$ 是第 $m$ 个人对第 $j$ 个评价对象的评分秩当评价者分歧较大时， $R_j（j∈[1,J]）$ 之间的差别较大，当评价者分歧较小时， $R_j$ 之间的差别较小。 $M\leqslant 20$ ，且 $J\leqslant 7$ ，属小样本，计算除Q后和肯德尔一致性系数临界值表对比，若大于等于临界值，认为意见一直，否则认为不一致。 $M > 20$ ，且 $J > 7$ ，属大样本检验统计量为，服从自由度为 $J - 1$ 的分布，若的计算值大于等于给定显著性水平的临界值，则认为不可靠。如果是比较几组人哪一组的评价更可靠，那么，较小的一个更可靠。下表为肯德尔一致性系数临界值表，其中k是人数，n是评价对象个数。

判断正态分布

对两组评价差异性的假设检验一般要求数据符合正态分布，这里补充了判断正态分布的方法。

P-P图和Q-Q图：直观判断

【摘自https://zhidao.baidu.com/question/182879807.html】 P-P图和Q-Q图主要用来判断正态分布。P-P图和Q-Q图的目的性基本一致，但原理上有着区别。 P-P图，其原理在于如果数据正态，那么数据的累积比例与正态分布累积比例基本保持一致。分别计算出数据累积比例，和假定正态时的数据分布累积比例；并且将实际数据累积比例作为X轴，将对应正态分布累积比例作为Y轴，作散点图。

Q-Q图，其原理在于如果数据正态，那么其假定的正态分位数会与实际数据基本一致。计算出假定正态时的数据分位数；并且将实际数据作为X轴，将假定正态时的数据分位数作为Y轴，作散点图。无论是P-P图，或者Q-Q图；如果说数据呈现出正态性，那么散点图看上去应该近似呈现为一条对角直线，此时说明数据呈现出正态性。如果散点图看上去明显不是一条直线，那么说明数据很可能不具有正态特质。 P-P图和Q-Q图均可使用SPSSAU在线分析软件生成，两者功能一致看使用偏好选择即可。

单样本K-S检验：计算判断

【摘自https://max.book118.com/html/2017/0217/92277468.shtm】单样本K-S检验（用于检验单一样本是否来自某一特定分布的方法）它的检验方法是以样本数据的累计频数分布与特定理论分布比较，若两者间的差距很小，则推论该样本取自某特定分布族。假设检验问题： H0：样本所来自的总体分布服从某特定分布 H1：样本所来自的总体分布不服从某特定分布 $F_0(x)$ 表示理论分布的分布函数， $F_n(x)$ 表示一组随机样本的累计频率函数。D为F0(x)与Fn(x)差距的最大值，即 $D=max|F_n(x)-F_0(x)|$ 当实际观测D>D(n,α)（D(n,α)是显著水平为α，样本容量为n时，D的拒绝临界值），则拒绝H0，反之接受H0。 D(n,α)如下表。

多级的评价体系：评分或定级

如本例：这里是三级，每个指标在对应的一级里用层次分析法AHP计算权重。

一致化和无量纲化：数据预处理

在构建线性评价体系的时候，对数据要进行预处理

典型相关分析法：两组指标间的关系

这里只列一个简单的步骤，详细可以参考（《数学建模算法与应用第2版》司守奎，孙兆亮） Step1.建立原始矩阵（参p273),并求出对应的标准化数据阵 Step2.计算两组变量的协方差矩阵并分块（参p269) Step3.求出多对典型相关系数和典型变量（参p270，通过求M1和M2矩阵的特征根和特征向量）Step4.检验各对典型相关系数的显著性（参p274）

多元回归及其检验：论证某些指标（多个）能否反映单个指标

Step1.从N个样本中随机选择n（n<N）个用于分析。 Step2.如果指标过多，可以通过主成分分析等对指标进行降维。 Step3.应用筛选出来的指标去和单个指标建立多元回归模型。 Step4.用剩下的（N-n）个样本，对多元回归方程进行验证。这里可以使用Wilcoxon 符号秩检验法判断用多元回归方程得到的结果和参考结果是否一致。 Step2.中如果指标不太多，或者这个任务不是建模的主任务，也可以使用逐步回归分析。回归模型的建立方法如下（来自国赛论文）：多元线性回归模型如下（来自国赛论文）:

资料

论文，题目，代码，数据

Processed: 0.010, SQL: 9