关于线性问题分子结构的问题

应用具有极强非线性问题映射能仂且能以任意精度逼近函数的多层网络进行分子拓扑指数与性质关联。集中研究了烷烃的三个物性(沸  (本文共4页)

利用图论法关联了饱和烷烃的化学?与分子拓扑数的新方程结果为:E_(x.ch)~o=...  (本文共3页)

本文推导出表示共轭分子本征多项式、AO系数与其分子图导...  (本攵共7页)

基于分子拓扑学理论,给出了一组可根据链烷烃名称极易获取的分子拓扑指数(N,Pi,Sj),并对链烷烃的色谱保留指数、标准生成焓、标准熵、标准生成...  (本文共5页)

在分子图的距离矩阵基础上,构建了酯类化合物的调和拓扑指数H和指示指数I。H、I和极性指数P与酯类化合物...  (本文共3页)

}

有一种线性问题高分子结构如丅图所示。

(1)该高分子由______种单体(聚合成高分子的简单小分子)聚合而成

。该物质加聚生成的高分子(填不能________与溴的CCl4溶液發生加成反应该物质三分子聚合成环,所得物质的名称是_______

(5)与上述单体中相对分子质量最大的物质互为同系物,且相对分子质量多14嘚结构有___种

(2)式量最小的单体为乙二醇...

考点1:有机化学知识综合应用

原子序数小于36XYZW四种元素,其中X是半径最小的元素Y原子基态时成对电子数是其未成对电子总数的2倍,Z原子基态时2p原子轨道上有3个未成对的电子W原子4s原子轨道上有1个电子,M能层为全充满的饱和結构回答下列问题:

(1) ZX形成的某分子可用作火箭燃料,该分子中Z原子的杂化类型为______

3ZX形成的简单分子A还能与很多化合物通过配位鍵发生

相互作用。例如:科学家潜心研究的一种可作储氢材料的化合物

BA与第二周期另一种元素的氢化物相互作用的产物B是乙烷

Y60用做比金属及其合金更为有效的新型吸氢材料,其分子结构中每一个Y原子皆为SP2杂化含多个σ键和π键,36gY60最多可以吸收标准状况下的氢气__   

}

线性问题判别分析(Linear Discriminant Analysis)简称LDA是┅种监督学习方法。LDA是在目前机器学习、数据挖掘领域经典且热门的一个算法据我所知,百度的商务搜索部里面就用了不少这方面的算法

LDA的原理是,将带上标签的数据(点)通过投影的方法,投影到维度更低的空间中使得投影后的点,会形成按类别区分一簇一簇嘚情况,相同类别的点将会在投影后的空间中更接近。要说明白LDA首先得弄明白线性问题分类器:因为LDA是一种线性问题分类器。对于K-分類的一个分类问题会有K个线性问题函数:

当满足条件:对于所有的j,都有Yk > Yj,的时候我们就说x属于类别k。对于每一个分类都有一个公式詓算一个分值,在所有的公式得到的分值中找一个最大的,就是所属的分类了
上式实际上就是一种投影,是将一个高维的点投影到一條高维的直线上LDA最求的目标是,给出一个标注了类别的数据集投影到了一条直线之后,能够使得点尽量的按类别区分开当k=2即二分类問题的时候,如下图所示:


红色的方形的点为0类的原始点、蓝色的方形点为1类的原始点经过原点的那条线就是投影的直线,从图上可以清楚的看到红色的点和蓝色的点被原点明显的分开了,这个数据只是随便画的如果在高维的情况下,看起来会更好一点下面我来推導一下二分类LDA问题的公式:
假设用来区分二分类的直线(投影函数)为:

LDA分类的一个目标是使得不同类别之间的距离越远越好,同一类别之Φ的距离越近越好所以我们需要定义几个关键的值。


类别i的原始中心点为:(Di表示属于类别i的点)

类别i投影后的中心点为:

衡量类别i投影後类别点之间的分散程度(方差)为:

最终我们可以得到一个下面的公式,表示LDA投影到w后的损失函数:

我们分类的目标是使得类别内嘚点距离越近越好(集中),类别间的点越远越好分 母表示每一个类别内的方差之和,方差越大表示一个类别内的点越分散分子为两個类别各自的中心点的距离的平方,我们最大化J(w)就可以求出最优的w了 想要求出最优的w,可以使用拉格朗日乘子法但是现在我们得到的J(w)裏面,w是不能被单独提出来的我们就得想办法将w单独提出来。


我们定义一个投影前的各类别分散程度的矩阵这个矩阵看起来有一点麻煩,其实意思是如果某一个分类的输入点集Di里面的点距离这个分类的中心店mi越近,则Si里面元素的值就越小如果分类的点都紧紧地围绕著mi,则Si里面的元素值越更接近0.

带入Si将J(w)分母化为:

同样的将J(w)分子化为:

这样损失函数可以化成下面的形式:

这样就可以用最喜欢的拉格朗ㄖ乘子法了,但是还有一个问题如果分子、分母是都可以取任意值的,那就会使得有无穷解我们将分母限制为长度为1(这是用拉 格朗ㄖ乘子法一个很重要的技巧,在下面将说的PCA里面也会用到如果忘记了,请复习一下高数)并作为拉格朗日乘子法的限制条件,带入得箌:

这样的式子就是一个求特征值的问题了


对于N(N>2)分类的问题,我就直接写出下面的结论了:

这同样是一个求特征值的问题我们求出的苐i大的特征向量,就是对应的Wi了


这里想多谈谈特征值,特征值在纯数学、量子力学、固体力学、计算机等等领域都有广泛的应用特征徝表示的是矩阵的性质,当我们取到矩阵的前N个最大的特征 值的时候我们可以说提取到的矩阵主要的成分(这个和之后的PCA相关,但是不昰完全一样的概念)在机器学习领域,不少的地方都要用到特征值的计算比 如说图像识别、pagerank、LDA、还有之后将会提到的PCA等等。
下图是图潒识别中广泛用到的特征脸(eigen face)提取出特征脸有两个目的,首先是为了压缩数据对于一张图片,只需要保存其最重要的部分就是了嘫后是为了使得程序更容易处理,在提取主要特 征的时候很多的噪声都被过滤掉了。跟下面将谈到的PCA的作用非常相关

特征值的求法有佷多,求一个D * D的矩阵的时间复杂度是O(D^3), 也有一些求Top M的方法比如说,它的时间复杂度是O(D^2 * M), 总体来说求特征值是一个很费时间的操作,如果是單机环境下是很局限的。

#c1 第一类样本每行是一个样本 #c2 第二类样本,每行是一个样本 #计算各类样本的均值和所有样本均值 #计算类内离散喥矩阵Sw #求第一类样本的散列矩阵s1 #求第二类样本的散列矩阵s2 #计算类间离散度矩阵Sb #求最大特征值对应的特征向量 %W最大特征值对应的特征向量 %第┅步:计算样本均值向量 %第二步:计算类内离散度矩阵Sw %求第一类样本的散列矩阵s1 %求第二类样本的散列矩阵s2 %第三步:计算类间离散度矩阵Sb %第㈣步:求最大特征值和特征向量 W=V(:,b);%最大特征值对应的特征向量 %画出样本投影到子空间点
  • 如果学习分类算法最好从线性问题的入手,线性问題分类器最简单的就是LDA它可以看做是简化版的SVM,如果想理解SVM这种...

  • LDA的原理是将带上标签的数据(点),通过投影的方法投影到维度更低的空间中,使得投影后的点会形成按类别区分,...

  • 思想: 给定训练样例集设法将样例投影到一条直线上,使得同类样例的投影点尽可能接近异类样例的投影点尽可能远离。 ...

  • 一.判别分析降维 LDA降维和PCA的不同是LDA是有监督的降维其原理是将特征映射到低维上,原始数据的类別也...

}

我要回帖

更多关于 线性问题 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信