机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式, 并将现有内容进行知识结构划分来有效提高学习效率。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。
根据统计学原理,在大量的统计数据中,如果让无法理解题目的大猩猩纯粹瞎蒙,最终也可以得到33%的正确率,然而人类根据已有的印象答题,反而错的更多,由此也体现了一个问题:相对于事实,人们印象中的这个世界比真实的世界更加可怕、暴力!
大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据本身是基于数据价值化而构建出来的新概念,虽然概念比较新,但是数据却一直都在,所以大数据的核心并不在“大”上,而是基于大数据所构建出的一个新的价值空间。
不知道为什么,自己突然就特别想要学习机器学习方面的知识。这种感觉特别的强烈,或许这就是对新知识的渴望吧。 《统计学习方法》这本书有点偏理论,有很多关于数学和统计学的知识(似然函数、)。此书系统全面的
我不是试图用通俗的语言来解释清楚什么是假设检验,如何去实践。 做到能用理 论化的语言来描述和理解问题是科研工作者应该掌握的能力。其实这个不难,只要 把基本问题吃透了,就可以在基本问题上继续问题。本文中
由于统计学在现实生活和“高端”科学研究中有着很高的地位,时常思考统计相关的问题,加深对它的基础理论的理解应该对我们理解和研究现实世界有帮助。1、样本空间与总体的关系样本空间,在茆诗松等编著的《概率论与