手机看天气

扫码下载app,天气随时看

扫码下载app,天气随时看
收藏网页

您使用的浏览器版本过低!

可能无法正常浏览,您可以选择

完美无疵网 > 直接下载更新IE浏览器 >

扫码码下载APP,天气随时看

安卓下载 App Store

发布

vc维(vc维生素c什么时候吃比较好) - 鸿海伟业生活资讯网

    本文目录一览:

    • 1、如何通俗的理解机器学习中的VC维,shatter和break point
    • 2、提出SVM *** 的学者是
    • 3、VC维的来龙去脉

    如何通俗的理解机器学习中的VC维,shatter和break point

    有可能的话,找一个安静的、舒适的地方学习。选择某个地方作你的学习之处,这一点很重要。它可以是你的单间书房或教室或图书馆,但是它必须是舒适的,安静而没有干扰。当你开始学习时,你应该全神贯注于你的功课,切忌“身在曹营心在汉”。

    提出SVM *** 的学者是

    苏联学者VladimirNVapnik和AlexanderYLerner。SVM是由模式识别中广义肖像算法发展而来的分类器。1964年,Vapnik和AlexeyYChervonenkis对广义肖像算法进行了进一步讨论并建立了硬边距的线性SVM。此后在二十世纪70到80年代,随着模式识别中更大边距决策边界的理论研究、基于松弛变量的规划问题求解技术的出现,和VC维的提出,SVM被逐步理论化并成为统计学习理论的一部分。

    VC维的来龙去脉

    本文转自: VC维的来龙去脉

    VC维在机器学习领域是一个很基础的概念,它给诸多机器学习 *** 的可学习性提供了坚实的理论基础,但有时候,特别是对我们工程师而言,SVM,LR,深度学习等可能都已经用到线上了,但却不理解VC维。

    这里,在台湾大学 机器学习基石 课程的基础上,我们简单聊聊“VC维的来龙去脉”。我们将解决以下问题:为什么某机器学习 *** 是可学习的?为什么会有过拟合?拿什么来衡量机器学习模型的复杂度?深度学习与VC维的关系?

    在讲VC维之前,我们不妨来说说VC维的历史。而说起VC维的历史,又不得不提起神经 *** ,一方面是因为神经 *** 与VC维的发明过程是交织在一起的,另一方面是由于神经 *** 乏善可陈的泛化控制 *** ,深度学习在理论基础上一直被怀疑,甚至神经 *** 和VC维的代表SVM还一起争风吃醋过好多年。

    1943年,模拟神经 *** 由麦卡洛可(McCulloch)和皮茨(Pitts)提出,他们分析了理想化的人工神经元 *** ,并且指出了它们进行简单逻辑运算的机制。

    1957年,康奈尔大学的实验心理学家弗兰克·罗森布拉特(Rosenblatt)在一台IBM–704计算机上模拟实现了一种他发明的叫作“感知机”(Perceptron)的神经 *** 模型。神经 *** 与支持向量机都源自于感知机(Perceptron)。

    1962年,罗森布拉特著作:《神经动力学原理:感知机和大脑机制的理论》(Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechani *** s)。

    1969年,明斯基和麻省理工学院的另一位教授佩普特合作著作:《感知机:计算几何学》(Perceptrons: An Introduction to Computational Geometry)。在书中,明斯基和佩普特证明单层神经 *** 不能解决XOR(异或)问题。

    1971年,V. Vapnik and A. Chervonenkis在论文“On the uniform convergence of relative frequencies of events to their probabilities”中提出VC维的概念。

    1974年,V. Vapnik提出了结构风险最小化原则。

    1974年,沃波斯(Werbos)的博士论文证明了在神经 *** 多加一层,并且利用“后向传播”(Back-propagation)学习 *** ,可以解决XOR问题。那时正是神经 *** 研究的低谷,文章不合时宜。

    1982年,在加州理工担任生物物理教授的霍普菲尔德,提出了一种新的神经 *** ,可以解决一大类模式识别问题,还可以给出一类组合优化问题的近似解。这种神经 *** 模型后被称为霍普菲尔德 *** 。

    1986年,Rummelhart与McClelland发明了神经 *** 的学习算法Back Propagation。

    1993年,Corinna Cortes和Vapnik等人提出了支持向量机(support vector machine)。神经 *** 是多层的非线性模型,支持向量机利用核技巧把非线性问题转换成线性问题。

    1992~2005年,SVM与Neural network之争,但被互联网风潮掩盖住了。

    2006年,Hinton提出神经 *** 的Deep Learning算法。Deep Learning假设神经 *** 是多层的,首先用Restricted Boltzmann Machine(非监督学习)学习 *** 的结构,然后再通过Back Propagation(监督学习)学习 *** 的权值。

    现在,deep learning的应用越来越广泛,甚至已经有超越SVM的趋势。一方面以Hinton,Lecun为首的深度学习派坚信其有效实用性,另一方面Vapnik等统计机器学习理论专家又坚持着理论阵地,怀疑deep learning的泛化界。

    Hoeffding不等式是关于一组随机变量均值的概率不等式。 如果X1,X2,⋯,Xn为一组独立同分布的参数为p的伯努利分布随机变量,n为随机变量的个数。定义这组随机变量的均值为:

    接下来,我们希望可以将机器学习关联到上一节讨论的hoeffding不等式。

    一个基本的机器学习过程如下图所示。其中的概念定义为: f 表示理想的方案(可以是一个函数,也可以是一个分布),H 是该机器学习 *** 的假设空间,g 表示我们求解的用来预测的假设,g属于H。

    机器学习的过程就是:通过算法A,在假设空间H中,根据样本集D,选择更好的假设作为g。选择标准是 g 近似于 f。

    Eout(h),可以理解为在理想情况下(已知f),总体(out-of-sample)的损失(这里是0–1 loss)的期望,称作expected loss。

    根据上面不等式,我们可以推断,当N足够大时,expected loss和expirical loss将非常接近。

    注意在上面推导中,我们是针对某一个特定的解h(x)。在我们的假设空间H中,往往有很多个假设函数(甚至于无穷多个),这里我们先假定H中有M个假设函数。

    上面式子的含义是:在假设空间H中,设定一个较小的ϵ值,任意一个假设h,它的Ein(h)与Eout(h)的差由该值2Mexp(−2ϵ2N)所约束住。注意这个bound值与 “样本数N和假设数M” 密切相关。

    上面这两个核心条件,也正好对应着test和train这两个过程。train过程希望损失期望(即Ein(g) )尽可能小;test过程希望在真实环境中的损失期望也尽可能小,即Ein(g)接近于Eout(g)。

    但往往我们更多在关心,如何基于模型的假设空间,利用更优化算法,找到Ein最小的解g。但容易忽视test这个过程,如果让学习可行,不仅仅是要在训练集表现好,在真实环境里也要表现好。

    M太小,当N足够大时,Ein和Eout比较接近,但如果候选假设集太小,不容易在其中找到一个g,使得Ein(g)约等于0,第二项不能满足。

    而如果M太大,这时候选集多了,相对容易在其中找到一个g,使得Ein(g)约等于0,但之一项就不能满足了。所以假设空间H的大小M很关键。

    虽说假设空间很大,上述推导里,我们用到了P(h1 or h2 … hm) = P(h1) + P(h2) + … + P(hm)。但事实上,多个h之间并不是完全独立的,他们是有很大的重叠的(这里重叠可理解为不同模型可能发生相同的错误,即这些错误重叠),也就是在M个假设中,可能有一些假设可以归为同一类。

    下面我们以二维假设空间为例,来解释一下该空间下各假设在确定的训练样本上的重叠性。

    对于这个有效的假设函数值,我们尝试用一个数学定义来说明:

    从H中任意选择一个方程h,让这个h对样本 *** D进行二元分类,输出一个结果向量。例如在平面里用一条直线对2个点进行二元分类,输出可能为{1,–1},{–1,1},{1,1},{–1,–1},这样每个输出向量我们称为一个dichotomy。

    下面是hypotheses与dichotomies的概念对比:

    注意到,如果对平面上的4个点来分类,根据前面分析,输出的结果向量只有14种可能,即有14个dichotomies。

    如果有N个样本数据,那么有效的假设个数定义为: effective(N) = H作用于样本集D“最多”能产生多少不同的dichotomy。

    H作用于D“最多”能产生多少种不同的dichotomies?这个数量与假设空间H有关,跟数据量N也有关。将H作用于D“最多”能产生的dichotomies数量(即effective(N) )表示为数学符号:max_H(x1,x2,…,xN)

    在进一步推导前,再看两个概念:shatter,break point。

    Shatter的概念:当假设空间H作用于N个input的样本集时,产生的dichotomies数量等于这N个点总的组合数2^N是,就称:这N个inputs被H给shatter掉了。

    对于给定的成长函数m_H(N),从N=1出发,N慢慢变大,当增大到k时,出现mH(N)2k的情形,则我们说k是该成长函数的break point。对于任何N k个inputs而言,H都没有办法再shatter他们了。

    举例来说,对于上面的positive ray的例子,因为m_H(N)=N+1,当N=2时,m_H(2)2^2, 所以它的break point就是2。

    说完break point的概念后,再回到成长函数。

    我们将成长函数的上界,设为B(N,k),意为:maximum possible m_H(N) when break point = k。

    那么我们做一些简单的推导:

    B(2,2)=3。因为break point=2,任意两个点都不能被shatter,m_H(2)肯定小于22,所以B(2,2)=3。

    B(3,2)=4。因为任意两个点都不能被shatter,那么3个点产生的dichotomies不能超过4,所以B(3,2)=4。

    B(N,1)=1。

    B(N,k)=2N for N k;B(N,k)=2N–1 for N=k;

    B(4,3)=?去掉其中的一个数据点x4后,考虑到break point=3,余下数据(x1,x2,x3)的dichotomies数目不能超过B(3,3)。当扩展为(x1,x2,x3,x4)时,(x1,x2,x3)上的dichotomies只有部分被重复复制了,设被复制的dichotomies数量为a,未被复制的数量为b。于是有B(3,3) = a+b; B(4,3) = 2a + b。因为a被复制了,表示x4有两个取值,那么(x1,x2,x3)上的a应该小于等于B(3,2)。所以推导出B(4,3) = 2a + b = B(3,3) + B(3,2)。

    对于任意Nk,类推可以得到,B(N,k) ≤ B(N−1,k)+B(N−1,k−1)

    所以我们得到结论:如果break point存在(有限的正整数),生长函数m(N) 是多项式的。

    再重复一遍,H作用于数据量为N的样本集D,方程的数量看上去是无穷的,但真正有效(effective)的方程的数量却是有限的,这个数量为m_H(N)。H中每一个h作用于D都能算出一个Ein来,一共有m_H(N)个不同的Ein。

    OK,到目前为止,关于m_H(N)的推导结束。回到growth function小节提出的问题,能否用m_H(N)直接替换M?

    关于这个公式的数学推导,我们可以暂且不去深究。我们先看一下这个式子的意义,如果假设空间存在有限的break point,那么m_H(2N)会被更高幂次为k–1的多项式上界给约束住。随着N的逐渐增大,指数式的下降会比多项式的增长更快,所以此时VC Bound是有限的。更深的意义在于,N足够大时,对H中的任意一个假设h,Ein(h)都将接近于Eout(h),这表示学习可行的之一个条件是有可能成立的。

    说了这么多,VC维终于露出庐山真面目了。此概念由Vladimir Vapnik与Alexey Chervonenkis提出。

    一个假设空间H的VC dimension,是这个H最多能够shatter掉的点的数量,记为dvc(H)。如果不管多少个点H都能shatter它们,则dvc(H)=无穷大。还可以理解为:vc-dim就是argmax_n {growth function=power(2,n)}。

    根据定义,可以得到一个明显的结论:

    k = d_vc(H) + 1

    根据前面的推导,我们知道VC维的大小:与学习算法A无关,与输入变量X的分布也无关,与我们求解的目标函数f 无关。它只与模型和假设空间有关。

    总结回顾一下,要想让机器学到东西,并且学得好,有2个条件:

    从上图可以看出,当VC维很小时,条件1容易满足,但因为假设空间较小,可能不容易找到合适的g 使得Ein(g)约等于0。当VC维很大时,条件2容易满足,但条件1不容易满足,因为VC bound很大。

    VC维反映了假设空间H 的强大程度(powerfulness),VC 维越大,H也越强,因为它可以打散(shatter)更多的点。

    注意在前述讨论中,理想的目标函数为f(x),error measure用的是“0–1 loss”。如果在unknown target上引入噪声(+noise),或者用不同的error measure *** ,VC theory还有效吗?这里只给出结论,VC theory对于绝大部分假设空间(or 加入噪声)和error度量 *** ,都是有效的。

    除此外,我们为了避免overfit,一般都会加正则项。那加了正则项后,新的假设空间会得到一些限制,此时新假设空间的VC维将变小,也就是同样训练数据条件下,Ein更有可能等于Eout,所以泛化能力更强。这里从VC维的角度解释了正则项的作用。

    对于神经 *** ,其VC维的公式为:

    举例来说,一个普通的三层全连接神经 *** :input layer是1000维,hidden layer有1000个nodes,output layer为1个node,则它的VC维大约为O(1000 1000 1000)。

    可以看到,神经 *** 的VC维相对较高,因而它的表达能力非常强,可以用来处理任何复杂的分类问题。根据上一节的结论,要充分训练该神经 *** ,所需样本量为10倍的VC维。如此大的训练数据量,是不可能达到的。所以在20世纪,复杂神经 *** 模型在out of sample的表现不是很好,容易overfit。

    但现在为什么深度学习的表现越来越好。原因是多方面的,主要体现在:

    但即便这样,深度学习的VC维和VC Bound依旧很大,其泛化控制 *** 依然没有强理论支撑。但是实践又一次次证明,深度学习是好用的。所以VC维对深度学习的指导意义,目前不好表述,有一种思想建议,深度学习应该抛弃对VC维之类概念的迷信,尝试从其他方面来解释其可学习型,例如使用泛函空间(如 Banach Space )中的概率论。

    上面仔细分析了VC维的来龙去脉,讲述了VC维在机器学习理论中的指导意义。考虑到VC维在机器学习领域虽是基础,却也是大坑,所以难免有理解不深或不当之处,敬请谅解。若希望获得更深理解,请参考下面的参考文献。

    vc维
  • 石坐冰 - 鸿海伟业生活资讯网 石坐冰 - 鸿海伟业生活资讯网
  • 离成都最近的城市(四川离成都最近的城市) - 鸿海伟业生活资讯网 离成都最近的城市(四川离成都最近的城市) - 鸿海伟业生活资讯网
  • 手机品牌排行(手机质量品牌排行榜) - 鸿海伟业生活资讯网 手机品牌排行(手机质量品牌排行榜) - 鸿海伟业生活资讯网
  • 惠普u盘 - 鸿海伟业生活资讯网 惠普u盘 - 鸿海伟业生活资讯网
  • 幼儿园招生方案 - 鸿海伟业生活资讯网 幼儿园招生方案 - 鸿海伟业生活资讯网
  • 退休养老金最新消息(泰安退休养老金最新消息) - 鸿海伟业生活资讯网 退休养老金最新消息(泰安退休养老金最新消息) - 鸿海伟业生活资讯网
  • 世界男模 - 鸿海伟业生活资讯网 世界男模 - 鸿海伟业生活资讯网
  • 身份证丢失怎么挂失(北京身份证丢失怎么挂失) - 鸿海伟业生活资讯网 身份证丢失怎么挂失(北京身份证丢失怎么挂失) - 鸿海伟业生活资讯网
  • 中国电影票房榜(中国电影票房榜首) - 鸿海伟业生活资讯网 中国电影票房榜(中国电影票房榜首) - 鸿海伟业生活资讯网
  • 广州多少人口 - 鸿海伟业生活资讯网 广州多少人口 - 鸿海伟业生活资讯网

城市天气预报

  • 热门
  • ABCD
  • EFGH
  • JKLM
  • NPQR
  • STWX
  • YZ

国际城市天气预报

  • 亚洲
  • 欧洲
  • 美洲
  • 大洋洲
  • 非洲

合作伙伴

天气资讯

富春山居烟(富春山居烟多少钱一包图片) - 鸿海伟业生活资讯网 富春山居烟(富春山居烟多少钱一包图片) - 鸿海伟业生活资讯网 四川宝石花医院 - 鸿海伟业生活资讯网 四川宝石花医院 - 鸿海伟业生活资讯网 幼儿园网上报名 - 鸿海伟业生活资讯网 幼儿园网上报名 - 鸿海伟业生活资讯网 出生医学证明 - 鸿海伟业生活资讯网 出生医学证明 - 鸿海伟业生活资讯网 钦州旅游攻略(钦州旅游攻略大全集) - 鸿海伟业生活资讯网 钦州旅游攻略(钦州旅游攻略大全集) - 鸿海伟业生活资讯网 · 新浪国际学校择校巡展 · 张韶涵穿黑西装炫酷十足 · 广发宏观:为什么不同行业对景气度感受不同? · 马蓉谈离婚:事后王宝强说还爱我 · 朴有天甩锅前女友:因她吸毒 · 詹姆斯尬蹭季后赛热搜还出错 · 中美军费等于全世界一半?环球时报:不要脸的炒作 · 那些梦的代价——伍兹VS李昊桐 · 日本最美女大学生揭晓 · 任正非谈选人用人:耽误员工的几年青春对得起人家吗? · 今日关键数据恐引发市场波动 黄金预期为看涨 · 回顾:平行志愿这样填不浪费分 · 绝地求生冠军联赛春季赛 · 超5成儿童青少年近视! · 小七同款发带拯救发际线 · 网曝疑似某公司离职收费单 · 面对约基奇26分7板!硬汉 · 催泪!感恩生命里每一段相逢 · PUBG下半年大陆赛区电竞赛事计划 · 变形计:杜华儿子人怂话多 · 江苏盐城爆炸已致47死 习近平作指示 · 对话同一地点3次救轻生者司机 · 西山上品湾MOMΛ | 城市浅山区的全龄科技华宅 · 刘亦菲仙女营业似画中人 · 这样的佩莱还需要轮换吗? · 《武装突袭3》即将推出新DLC · 三星电子Q1净利腰斩过半 · 千里共婵娟的苏轼苏辙兄弟 · 女方同时辟谣称:假的 · 国庆北京首贼大兴落网 身藏6部手机数张银行卡 · 在线教育更受西部家庭青睐 · 黑寡妇or龙妈她cos神同步 · 这些植物你没我摆的高级 · 母亲微笑行动拯救唇腭裂儿童 · 离婚后给老公留下1080亿美金 · 高校男生打造古风宿舍 · “五一”假期出游安全提示 · 图说|他发福了吗?她和妈妈年轻时一毛一样! · 盘点体坛金猪宝宝:刘翔林丹闪耀 · 全新宝马3系 竞争力提升明显 · 周冬雨宋茜爱的衬衫裙 · 中国野生鸟类摄影行为规范倡议 · 你好世界:寻找心中的风景 · 高圆圆官宣怀孕后首露面 · 美联社评大师赛|完美风暴酝酿 伍兹让全美民众早起 · 合理用药缓解术后伤口痛 · 《ATLAS》关“帝国模式”服务器 · 程鹤麟:世界都猜不透英国人的心 · 《自然》呼吁:重视脂肪肝病防治 · 国内壮丽风景29条自驾路线

气温排行榜

  • 高温
  • 低温
排名 城市 今天气温
1 高清大图来啦!2019“亚洲文化嘉年华”鸟巢绽放!从T台到机场私服 “大表姐”刘雯的时尚人生 23~26 °
2 巴黎埃菲尔铁塔被闪电击中 摄影师拍下震撼一幕台政客警告美国:别用威胁态度看大陆,中国人性格你不懂 23~25 °
3 资本:多渠道资金加速涌入 力挺投资补短板国家超级计算郑州中心获批筹建 23~25 °
4 杨光斌:国家竞争的制胜之道是什么?马竞前锋格列兹曼赛季后离队 巴萨成最热门下家 23~25 °
5 社评:美方不断嚣张喊话,实为自我打气东南亚电商投资总体乐观 23~25 °
6 社评:美国要摆"鸿门宴",但吓唬不住中国履行好党和人民赋予的新时代职责使命 23~25 °
7 袁姗姗、迪丽热巴都爱的瘦脸神器,就是这款渔夫帽何猷君发文承认将向奚梦瑶求婚:准备了一个多月 20~25 °
8 蓝庆新:在“一带一路”建设中共享发展经验社评:美方不断嚣张喊话,实为自我打气 20~25 °
9 社评:蓬佩奥,史上最欺负欧洲的美国国务卿传统书院连通传统与现代 如何更好地活在当下 17~25 °
10 马竞前锋格列兹曼赛季后离队 巴萨成最热门下家移动支付为何在德国“长不大” 12~25 °
查看更多>
1 江西省加强高等学校本科教学管理中国汽车一季度在俄销售增长25% -24~-12 °
2 经济新亮点:工业经济稳中有进重磅!有驾照的恭喜了,下个月要巨变 ! -24~-9 °
3 特朗普欲签行政令阻止美企与华为往来 外交部:滥用国家力量普京乘专机视察国家试飞中心 6架苏57为其护航 -23~-12 °
4 资本:年内多家上市公司股东换购股票ETF司法所长骚扰女缓刑犯 官方:属实,停职并立案调查 -23~-8 °
5 孟山都除草剂致癌被罚20亿美元日本便利店给食品运送时限松绑 -20~-8 °
6 植保无人机推广背后的产业难题深圳一电机公司多人患白血病:当地卫生部门赴现场调查 -20~-8 °
7 何猷君发文承认将向奚梦瑶求婚:准备了一个多月西甲第37轮:莱加内斯0-2西班牙人 -20~-5 °
8 4个亿的私人飞机,明星大咖们的私生活竟然是这样于镭:“背向亚洲”是澳大利亚的危险歧途 -19~-10 °
9 康美药业事件续:审计机构被立案调查后再被客户“抛弃”乌鲁木齐市工商联与5部门签订工作联动机制协议 -18~-12 °
10 蓬佩奥搬她出来逼英国禁华为,英国人一听更怒了美军最新部署中东B52曝光 刚到就忙着飞行巡逻 -18~-10 °
查看更多>

空气质量排行榜

  • 最优
  • 最差
排名 城市 今天空气
1 全球最有价值零售品牌,阿里超麦当劳黄永富:美日为何极力让中国“提前毕业” 7优
2 何姿新加坡拍夏日写真哈药集团药品不合规被召回 7优
3 重视中葡关系是葡当前的重要国策联手吉利 戴姆勒能否破局网约车市场 7优
4 意甲第36轮:国际米兰2-0切沃羌塘无人区失联小伙:拉肚子被队友扔下,目前已和女友分手 7优
5 美财长姆努钦计划前往中国进行经贸谈判习近平出席亚洲文明对话大会开幕式 7优
6 国家超级计算郑州中心获批筹建没有火箭 我们可以靠这些怪招去太空旅行 7优
7 最“坑”面试题,你敢来挑战吗?履行好党和人民赋予的新时代职责使命 7优
8 人脸识别机、无人机 新职业折射创新驱动热实拍俄胜利日阅兵:普京带领上万士兵高喊"乌拉" 7优
9 IDC:一季度印度智能手机市场同比增长7% 小米第一“人造肉”概念被热炒 素食产业商机来了吗 7优
10 何穗绿色长裙显清冷气质VR黑科技,帮你在家看房源(图) 7优
查看更多>
1 云南省委原书记秦光荣接受审查调查庞大集团被债权人申请重整 381严重
2 王宏伟:应急救援,社会力量需要赋能全国居民购房杠杆率连降八个季度后首次回升 324严重
3 重庆将打造3000亿元超高清视频产业美军最新部署中东B52曝光 刚到就忙着飞行巡逻 273重度
4 郭碧婷梳高马尾气质清新社评:歇斯底里的班农煽动美国陪他发疯 270重度
5 中国驻西班牙大使探班武磊:刻苦训练,为国争光!新机:荣耀20现身跑分平台 关键配置信息均已曝光 269重度
6 高端MPV车型 别克GL8 4座版官图发布中国国际商会与犹他州世贸中心举办经贸投资论坛 257重度
7 保时捷Taycan内饰曝光 于今年9月正式发布中国汽车一季度在俄销售增长25% 256重度
8 山西大同回应"拖欠医保结算费用":1人被免职,3人被停职五月赏花大全:月季花、蔷薇花、油菜花,花开成海,美爆了 229重度
9 犹他州不想改变同中企建的供应链宋国友:“美企回流”难过四道坎 229重度
10 袁咏仪重提与富商风波Get Angelababy同款牛仔外套,开春扮酷就靠它了! 226重度
查看更多>
>

友情链接: