当前位置：首页 > news >正文

优秀的html5网站网站建设与管理是什么意思

news 2025/12/7 7:50:54

优秀的html5网站,网站建设与管理是什么意思,wordpress 认证证书,h5页面开发工具主成分分析引言主成分分析#xff08;PCA#xff09;是一种能够极大提升无监督特征学习速度的数据降维算法。更重要的是#xff0c;理解PCA算法#xff0c;对实现白化算法有很大的帮助#xff0c;很多算法都先用白化算法作预处理步骤。假设你使用图像来训练算法#x…主成分分析引言主成分分析PCA是一种能够极大提升无监督特征学习速度的数据降维算法。更重要的是理解PCA算法对实现白化算法有很大的帮助很多算法都先用白化算法作预处理步骤。假设你使用图像来训练算法因为图像中相邻的像素高度相关输入数据是有一定冗余的。具体来说假如我们正在训练的16x16灰度值图像记为一个256维向量其中特征值对应每个像素的亮度值。由于相邻像素间的相关性PCA算法可以将输入向量转换为一个维数低很多的近似向量而且误差非常小。实例和数学背景在我们的实例中使用的输入数据集表示为维度即。假设我们想把数据从2维降到1维。在实际应用中我们也许需要把数据从256维降到50维在这里使用低维数据主要是为了更好地可视化算法的行为。下图是我们的数据集这些数据已经进行了预处理使得每个特征和具有相同的均值零和方差。为方便展示根据值的大小我们将每个点分别涂上了三种颜色之一但该颜色并不用于算法而仅用于图解。 PCA算法将寻找一个低维空间来投影我们的数据。从下图中可以看出是数据变化的主方向而是次方向。也就是说数据在方向上的变化要比在方向上大。为更形式化地找出方向和我们首先计算出矩阵如下所示假设的均值为零那么就是x的协方差矩阵。符号读Sigma是协方差矩阵的标准符号。虽然看起来与求和符号比较像但它们其实是两个不同的概念。可以证明数据变化的主方向就是协方差矩阵的主特征向量而是次特征向量。注如果你对如何得到这个结果的具体数学推导过程感兴趣可以参看CS229机器学习PCA部分的课件链接在本页底部。但如果仅仅是想跟上本课可以不必如此。你可以通过标准的数值线性代数运算软件求得特征向量见实现说明.我们先计算出协方差矩阵的特征向量按列排放而组成矩阵此处是主特征向量对应最大的特征值是次特征向量。以此类推另记为相应的特征值。在本例中向量和构成了一个新基可以用来表示数据。令为训练样本那么就是样本点在维度上的投影的长度幅值。同样的是投影到维度上的幅值。旋转数据至此我们可以把用基表达为下标“rot”来源于单词“rotation”意指这是原数据经过旋转也可以说成映射后得到的结果对数据集中的每个样本分别进行旋转 for every 然后把变换后的数据显示在坐标图上可得这就是把训练数据集旋转到基后的结果。一般而言运算表示旋转到基 ,, ..., 之上的训练数据。矩阵有正交性即满足所以若想将旋转后的向量还原为原始数据将其左乘矩阵即可 , 验算一下 . 数据降维数据的主方向就是旋转数据的第一维。因此若想把这数据降到一维可令更一般的假如想把数据降到维表示令 ,只需选取的前个成分分别对应前个数据变化的主方向。 PCA的另外一种解释是是一个维向量其中前几个成分可能比较大例如上例中大部分样本第一个成分的取值相对较大而后面成分可能会比较小例如上例中大部分样本的较小。 PCA算法做的其实就是丢弃中后面取值较小的成分就是将这些成分的值近似为零。具体的说设是的近似表示那么将除了前个成分外其余全赋值为零就得到在本例中可得的点图如下取然而由于上面的后项均为零没必要把这些零项保留下来。所以我们仅用前个非零成分来定义维向量。这也解释了我们为什么会以为基来表示数据要决定保留哪些成分变得很简单只需取前个成分即可。这时也可以说我们“保留了前个PCA主成分”。还原近似数据现在我们得到了原始数据的低维“压缩”表征量反过来如果给定我们应如何还原原始数据呢查看以往章节以往章节可知要转换回来只需即可。进一步我们把看作将的最后个元素被置0所得的近似表示因此如果给定可以通过在其末尾添加个0来得到对的近似最后左乘便可近似还原出原数据。具体来说计算如下上面的等式基于先前对的定义。在实现时我们实际上并不先给填0然后再左乘因为这意味着大量的乘0运算。我们可用来与的前列相乘即上式中最右项来达到同样的目的。将该算法应用于本例中的数据集可得如下关于重构数据的点图由图可见我们得到的是对原始数据集的一维近似重构。在训练自动编码器或其它无监督特征学习算法时算法运行时间将依赖于输入数据的维数。若用取代作为输入数据那么算法就可使用低维数据进行训练运行速度将显著加快。对于很多数据集来说低维表征量是原数据集的极佳近似因此在这些场合使用PCA是很合适的它引入的近似误差的很小却可显著地提高你算法的运行速度。选择主成分个数我们该如何选择即保留多少个PCA主成分在上面这个简单的二维实验中保留第一个成分看起来是自然的选择。对于高维数据来说做这个决定就没那么简单如果过大数据压缩率不高在极限情况时等于是在使用原始数据只是旋转投射到了不同的基相反地如果过小那数据的近似误差太太。决定值时我们通常会考虑不同值可保留的方差百分比。具体来说如果那么我们得到的是对数据的完美近似也就是保留了100%的方差即原始数据的所有变化都被保留下来相反如果那等于是使用零向量来逼近输入数据也就是只有0%的方差被保留下来。一般而言设表示的特征值按由大到小顺序排列使得为对应于特征向量的特征值。那么如果我们保留前个成分则保留的方差百分比可计算为在上面简单的二维实验中。因此如果保留个主成分等于我们保留了即91.3%的方差。对保留方差的百分比进行更正式的定义已超出了本教程的范围但很容易证明。因此如果则说明也就基本上接近于0所以用0来近似它并不会产生多大损失。这也解释了为什么要保留前面的主成分对应的值较大而不是末尾的那些。这些前面的主成分变化性更大取值也更大如果将其设为0势必引入较大的近似误差。以处理图像数据为例一个惯常的经验法则是选择以保留99%的方差换句话说我们选取满足以下条件的最小值对其它应用如不介意引入稍大的误差有时也保留90-98%的方差范围。若向他人介绍PCA算法详情告诉他们你选择的保留了95%的方差比告诉他们你保留了前120个或任意某个数字主成分更好理解。对图像数据应用PCA算法为使PCA算法能有效工作通常我们希望所有的特征都有相似的取值范围并且均值接近于0。如果你曾在其它应用中使用过PCA算法你可能知道有必要单独对每个特征做预处理即通过估算每个特征的均值和方差而后将其取值范围规整化为零均值和单位方差。但是对于大部分图像类型我们却不需要进行这样的预处理。假定我们将在自然图像上训练算法此时特征代表的是像素的值。所谓“自然图像”不严格的说是指人或动物在他们一生中所见的那种图像。注通常我们选取含草木等内容的户外场景图片然后从中随机截取小图像块如16x16像素来训练算法。在实践中我们发现大多数特征学习算法对训练图片的确切类型并不敏感所以大多数用普通照相机拍摄的图片只要不是特别的模糊或带有非常奇怪的人工痕迹都可以使用。在自然图像上进行训练时对每一个像素单独估计均值和方差意义不大因为理论上图像任一部分的统计性质都应该和其它部分相同图像的这种特性被称作平稳性stationarity。具体而言为使PCA算法正常工作我们通常需要满足以下要求(1)特征的均值大致为0(2)不同特征的方差值彼此相似。对于自然图片即使不进行方差归一化操作条件(2)也自然满足故而我们不再进行任何方差归一化操作对音频数据,如声谱,或文本数据,如词袋向量我们通常也不进行方差归一化。实际上PCA算法对输入数据具有缩放不变性无论输入数据的值被如何放大或缩小返回的特征向量都不改变。更正式的说如果将每个特征向量都乘以某个正数即所有特征量被放大或缩小相同的倍数PCA的输出特征向量都将不会发生变化。既然我们不做方差归一化唯一还需进行的规整化操作就是均值规整化其目的是保证所有特征的均值都在0附近。根据应用在大多数情况下我们并不关注所输入图像的整体明亮程度。比如在对象识别任务中图像的整体明亮程度并不会影响图像中存在的是什么物体。更为正式地说我们对图像块的平均亮度值不感兴趣所以可以减去这个值来进行均值规整化。具体的步骤是如果代表16x16的图像块的亮度灰度值可用如下算法来对每幅图像进行零均值化操作 , for all 请注意1对每个输入图像块都要单独执行上面两个步骤2这里的是指图像块的平均亮度值。尤其需要注意的是这和为每个像素单独估算均值是两个完全不同的概念。如果你处理的图像并非自然图像比如手写文字或者白背景正中摆放单独物体其他规整化操作就值得考虑了而哪种做法最合适也取决于具体应用场合。但对自然图像而言对每幅图像进行上述的零均值规整化是默认而合理的处理。白化介绍我们已经了解了如何使用PCA降低数据维度。在一些算法中还需要一个与之相关的预处理步骤这个预处理过程称为白化一些文献中也叫sphering。举例来说假设训练数据是图像由于图像中相邻像素之间具有很强的相关性所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性更正式的说我们希望通过白化过程使得学习算法的输入具有如下性质(i)特征之间相关性较低(ii)所有特征具有相同的方差。 2D 的例子下面我们先用前文的2D例子描述白化的主要思想然后分别介绍如何将白化与平滑和PCA相结合。如何消除输入特征之间的相关性? 在前文计算时实际上已经消除了输入特征之间的相关性。得到的新特征的分布如下图所示这个数据的协方差矩阵如下 (注: 严格地讲, 这部分许多关于“协方差”的陈述仅当数据均值为0时成立。下文的论述都隐式地假定这一条件成立。不过即使数据均值不为0下文的说法仍然成立所以你无需担心这个。) 协方差矩阵对角元素的值为和绝非偶然。并且非对角元素值为0; 因此, 和是不相关的, 满足我们对白化结果的第一个要求 (特征间相关性降低)。为了使每个输入特征具有单位方差我们可以直接使用作为缩放因子来缩放每个特征。具体地我们定义白化后的数据如下绘制出我们得到: 这些数据现在的协方差矩阵为单位矩阵。我们说是数据经过PCA白化后的版本: 中不同的特征之间不相关并且具有单位方差。白化与降维相结合。如果你想要得到经过白化后的数据并且比初始输入维数更低,可以仅保留中前个成分。当我们把PCA白化和正则化结合起来时(在稍后讨论) 中最后的少量成分将总是接近于0因而舍弃这些成分不会带来很大的问题。 ZCA白化最后要说明的是使数据的协方差矩阵变为单位矩阵的方式并不唯一。具体地如果是任意正交矩阵即满足 (说它正交不太严格可以是旋转或反射矩阵), 那么仍然具有单位协方差。在ZCA白化中令。我们定义ZCA白化的结果为绘制得到: 可以证明对所有可能的这种旋转使得尽可能地接近原始输入数据。当使用 ZCA白化时(不同于 PCA白化)我们通常保留数据的全部个维度不尝试去降低它的维数。正则化实践中需要实现PCA白化或ZCA白化时有时一些特征值在数值上接近于0这样在缩放步骤时我们除以将导致除以一个接近0的值这可能使数据上溢 (赋为大数值)或造成数值不稳定。因而在实践中我们使用少量的正则化实现这个缩放过程即在取平方根和倒数之前给特征值加上一个很小的常数当在区间上时, 一般取值为。对图像来说, 这里加上对输入图像也有一些平滑(或低通滤波)的作用。这样处理还能消除在图像的像素信息获取过程中产生的噪声改善学习到的特征(细节超出了本文的范围)。 ZCA 白化是一种数据预处理方法它将数据从映射到。事实证明这也是一种生物眼睛(视网膜)处理图像的粗糙模型。具体而言当你的眼睛感知图像时由于一幅图像中相邻的部分在亮度上十分相关大多数临近的“像素”在眼中被感知为相近的值。因此如果人眼需要分别传输每个像素值通过视觉神经到大脑中会非常不划算。取而代之的是视网膜进行一个与ZCA中相似的去相关操作 (这是由视网膜上的ON-型和OFF-型光感受器细胞将光信号转变为神经信号完成的)。由此得到对输入图像的更低冗余的表示并将它传输到大脑。实现主成分分析和白化在这一节里我们将总结PCA, PCA白化和ZCA白化算法并描述如何使用高效的线性代数库来实现它们。首先我们需要确保数据的均值近似为零。对于自然图像我们通过减去每个图像块(patch)的均值近似地来达到这一目标。为此我们计算每个图像块的均值并从每个图像块中减去它的均值。译注参见PCA一章中“对图像数据应用PCA算法”一节。Matlab实现如下 avg mean(x, 1); % 分别为每个图像块计算像素强度的均值。 x x - repmat(avg, size(x, 1), 1);下面我们要计算如果你在Matlab中实现或者在C, Java等中实现但可以使用高效的线性代数库直接求和效率很低。不过我们可以这样一气呵成。 sigma x * x / size(x, 2);自己推导一下看看这里我们假设 x 为一数据结构其中每列表示一个训练样本所以 x 是一个 × 的矩阵。接下来PCA计算 Σ 的特征向量。你可以使用Matlab的 eig 函数来计算。但是由于 Σ 是对称半正定的矩阵用 svd 函数在数值计算上更加稳定。具体来说如果你使用 [U,S,V] svd(sigma);那矩阵 U 将包含 Sigma 的特征向量一个特征向量一列从主向量开始排序矩阵S 对角线上的元素将包含对应的特征值同样降序排列。矩阵等于的转置可以忽略。注意 svd 函数实际上计算的是一个矩阵的奇异值和奇异向量就对称半正定矩阵的特殊情况来说它们对应于特征值和特征向量这里我们也只关心这一特例。关于奇异向量和特征向量的详细讨论超出了本文范围。最后我们可以这样计算和 xRot U * x; % 数据旋转后的结果。 xTilde U(:,1:k) * x; % 数据降维后的结果这里k希望保留的特征向量的数目。这以的形式给出了数据的PCA表示。顺便说一下如果 x 是一个包括所有训练数据的 × 矩阵这也是一种向量化的实现方式上面的式子可以让你一次对所有的训练样本计算出 xrot 和。得到的 xrot 和中每列对应一个训练样本。为计算PCA白化后的数据可以用 xPCAwhite diag(1./sqrt(diag(S) epsilon)) * U * x;因为 S 的对角线包括了特征值这其实就是同时为所有样本计算的简洁表达。最后你也可以这样计算ZCA白化后的数据: xZCAwhite U * diag(1./sqrt(diag(S) epsilon)) * U * x;原链接http://deeplearning.stanford.edu/wiki/index.php/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90 转载于:https://www.cnblogs.com/linyuanzhou/p/4991679.html

查看全文

http://wiki.neutronadmin.com/news/41168/