大数据时代,统计学还有用吗

2024-05-11 04:19

1. 大数据时代,统计学还有用吗

统计学能与大数据联系上吗?
已上提问是统计学基本概念不清楚:有的学者认为大数据时代统计学过时了;实际上:这是一种错误学说,就是一个大呼悠。所为的大数据就是数据流大一点而已,从数据扩展到信息,并没有超出统计学描述的范围;也就是互联网、计算机、苹果手机,小朋友手机摇啊摇,小姑娘们聊啊聊,帅哥键盘敲啊敲,这些数据、信息、资料、图片向白云一样飘啊飘,飘到空间瞬间形成庞大的几十万亿的数据云。最后这些数据流我们用计算机通过统计学专家学者加已整理、分析;这就对统计学家提出了新的挑战。
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。

大数据时代,统计学还有用吗

2. 大数据时代,统计学还有用吗

“社会统计学与数理统计学的统一"理论与大数据
统计学能与大数据联系上吗?
已上提问是统计学基本概念不清楚:有的学者认为大数据时代统计学过时了;实际上:这是一种错误学说,就是一个大呼悠。所为的大数据就是数据流大一点而已,从数据扩展到信息,并没有超出统计学描述的范围;也就是互联网、计算机、苹果手机,小朋友手机摇啊摇,小姑娘们聊啊聊,帅哥键盘敲啊敲,这些数据、信息、资料、图片向白云一样飘啊飘,飘到空间瞬间形成庞大的几十万亿的数据云。最后这些数据流我们用计算机通过统计学专家学者加已整理、分析;这就对统计学家提出了新的挑战。
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
统计学统帅一切科学。
“社会统计学与数理统计学的统一理论”作为统计学的最新理论,必将全面提升统计学的分析水平,当然完全达到了挑战大数据的水准。统计学在一切学科中(以社会科学与自然科学一级学科为单位)是地位最高的学科。它的地位的崇高在扵:它是现今世界几乎所有前沿科学进行研究的唯一手段(所谓瞎子摸大象方法),也是西方文明几百年的台柱子

3. 应用统计学是大数据吗

大数据相对来说是一个更为宽泛的概念。大数据相对于统计学来说更加考虑算法的效率以及预测的精确性。而统计可能更侧重于方法是否满足一些统计性质。应用统计学可以为大数据打好一定的理论基础,但是想更好的处理大数据编程是非常重要的。

应用统计学是大数据吗

4. 应用统计学是大数据吗

应用统计学不完全是大数据,大数据是应用统计学下的其中一个方向。
应用统计学专业主要包括一般统计和经济统计两类专业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门化应用型人才。

大数据采集与管理专业是从大数据应用的数据管理、系统开发、海量数据分析与挖掘等层面系统地帮助企业掌握大数据应用中的各种典型问题的解决办法的专业。

5. 现在大数据这么火,为什么身边一些学统计的本科

当我们在谈大数据的时候,我们在谈论什么?大数据产业火爆的背后,有着深厚的利益驱动性,于是各大商家与企业纷纷趋之若鹜,想要窥尽大数据背后被遮掩起来的财富。毫无疑问,变现,是大数据火爆的背后原因。
大数据被潮流所接受,皆因它能够带来进步与利益
纵观古今,博览中西,能够经历历史的洗刷而留存下来的精粹,都是能经得住各种考验的东西,都是能够真实满足人类各种需求的东西。这些“东西”,要么是从物质上说能给人类带来利益的——如农业、手工业、商贸等;要么是从情感上说能够给人类带来快感的——如绘画、舞蹈、歌曲等。这些东西在几千年的文明史中,除了样式上会有与时俱进的变化,但究其核心,若整体一个产业种类或艺术种类自被催生日起便被存续下来,那一定是满足了人类的需求。那么,大数据是否能够被当前的历史潮流接受,那就是要看它是否能够给我们带来切切实实的利益。
有不少人说,工业革命又将迎来一次变革了,更道大数据产业是第四次工业革命的标志,这个说法虽有待商榷,但是,只要它给人类社会带来生产力进步,以一种更智能新颖的模式代替人类重劳力,促进全社会信息共享和交流,让社会以更高进程地进步,那也未尝不可。
科学技术是第一生产力,踏入工业4.0时代,必有新的主导科学技术——大数据、BI、云计算、物联网、移动互联等新一代信息技术打破了原有的技术壁垒,形成了新型的产业和商业创新模式,促进和刺激了新一轮的生产力发展。
低廉快速,让大数据能成为盈利的工具
说到大数据,我们可以具体、广义地理解成Hadoop、各种数据挖掘、机器学习算法、人工智能。因此,今年也催生出学习以上技能的一股风潮。那么,努力学习是否真有丰厚的回报?答案是肯定的,因为,大数据能成为盈利的工具。
日常操作中,为了缩短计算和统计的时间,为运营与决策提供数据成本更为低廉和具有时效性的方案,我们会采用Hadoop或者Spark这些框架进行分布式计算;为了深埋于数据背后的数据量化后的规律与彼此的逻辑关系,我们使用机器学习算法对数据进行深度的挖掘和处理。
在运营学当中,“消除不确定性来降低试错成本”是一句经过万千实践留下的“金句”。而围绕这一中心思想发展起来的工程技术改进、算法改进、架构优化等,都是大数据变现的核心内容。而商家和企业十分看重的大数据分析,深究其本质,其实和获取信息的本质是一致的——通过消除不确定性来降低试错成本。
做大数据是为了降低成本,增加行业收益
很多人认为,大数据变现只是纸上谈兵,然而,在我们认识到本质之后就不会让人觉得变现这件事很困惑或很艰难。虽然大数据带来的利益并不是我们可以唾手可得的,但是,在比较明确的思路和目标下,在国家的相关政策,以及世界科技的潮流催生下,这也渐渐变成了一种趋势。
很多人误会,做大数据是为大而大,其实,做大数据是为了降低成本而大,这个成本是广义的。在项目启动初期,商家与企业看似花费了很多的金钱在设备购买、工具分析、人才挖掘上,但是未来这些设备上所承载的数据以及从中得到的信息,会大幅削减试错成本,而且在某些行业领域里这种增益的效果还会非常明显。以小见大,事半功倍的事情,何乐而不为?
大数据企业,成为融资创收的高产地
根植于大数据核心技术,越来越多的大数据企业被融资。
创建于2014年的 Cazena,位于马萨诸塞州沃尔瑟姆。Cazena开发的大数据即服务产品可以让企业把基于云的数据湖和数据集市结合起来,用于配置和优化大数据系统,包括那些构建在Hadoop、Spark和MPPSQL技术上的系统。因为强大的技术系统,它已经吸引了大量的关注和资金,更在2010年被IBM以17亿美元收购。
在2015年5月正式发布的 Maana位于加州Palo Alto,被看作是可以很好地收集和分析由物联网网络生成的海量数据的公司。而被业务线所广泛应用的Maana Knowledge Graph,则是Maana开发的一个数据搜索和发现平台。这个系统构建在Apache Spark处理引擎上,能收集来自多个系统或者"孤岛"的数据,并将其转换为运营洞察。2016年3月,Maana在B轮融资中获得2600万美元。
位于加州门罗帕克的Aviso,创建于2012年。Aviso基于云的软件集成了一系列CRM应用。结合机器学习算法和投资组合管理技术,Aviso开发的预测分析应用软件能够帮助销售经理和销售代表优化交易、降低风险和精确销售分析。现在,不少销售机构已经将这套应用软件应用于改善销售预测流程。
变现,是大数据火爆背后的根本原因。共享经济时代,越来越多人选择大数据相关行业。

现在大数据这么火,为什么身边一些学统计的本科

6. 大数据时代,统计学还有用吗

大数据时代,统计学还有用吗_数据分析师考试
在数据“爆炸”的时代,大数据常常被寄予厚望。到底,什么样的数据才算大数据,怎样才能用好大数据,传统统计学还有用武之地吗?清华大学统计学研究中心前不久成立,著名统计学家、哈佛大学终身教授刘军担任主任。日前,刘军做客人民日报、人民网《文化讲坛》,分享他的思考。  让大数据区别于数据的,是其海量积累、高增长率和多样性  什么是数据?数据(data)在拉丁文里是“已知”的意思,在英文中的一个解释是“一组事实的集合,从中可以分析出结论”。笼统地说,凡是用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据。古人“结绳记事”,打了结的绳子就是数据。步入现代社会,信息的种类和数量越来越丰富,载体也越来越多。数字是数据,文字是数据,图像、音频、视频等都是数据。  什么是大数据呢?量的增多,是人们对大数据的第一个认识。随着科技发展,各个领域的数据量都在迅猛增长。有研究发现,近年来,数字数据的数量每3年多就会翻一番。  大数据区别于数据,还在于数据的多样性。正如高德纳咨询公司研究报告指出的,数据的爆炸是三维的、立体的。所谓的三维,除了指数据量快速增大外,还指数据增长速度的加快,以及数据的多样性,即数据的来源、种类不断增加。  从数据到大数据,不仅是量的积累,更是质的飞跃。海量的、不同来源、不同形式、包含不同信息的数据可以容易地被整合、分析,原本孤立的数据变得互相联通。这使得人们通过数据分析,能发现小数据时代很难发现的新知识,创造新的价值。  通过数据来研究规律、发现规律,贯穿了人类社会发展的始终。人类科学发展史上的不少进步都和数据采集分析直接相关,例如现代医学流行病学的开端。伦敦1854年发生了大规模的霍乱,很长时间没有办法控制。一位医师用标点地图的方法研究了当地水井分布和霍乱患者分布之间的关系,发现有一口水井周围,霍乱患病率明显较高,借此找到了霍乱暴发的原因:一口被污染的水井。关闭这口水井之后,霍乱的发病率明显下降。这种方法,充分展示了数据的力量。  本质上说,许多科学活动都是数据挖掘,不是从预先设定好的理论或者原理出发,通过演绎来研究问题,而是从数据本身出发通过归纳来总结规律。近现代以来,随着我们面临的问题变得越来越复杂,通过演绎的方式来研究问题常常变得很困难。这就使得数据归纳的方法变得越来越重要,数据的重要性也越发凸显出来。  大数据是非竞争性资源,有助于政府科学决策、商家精准营销  大数据时代,数据的重要作用更加凸显,许多国家都把大数据提升到国家战略的高度。  政府合理利用大数据,引导决策的将是基于实证的事实,政府会更有预见性、更加负责、更加开放。中国古代治国就已经有重数据的思想,如商鞅提出,“强国知十三数……欲强国,不知国十三数,地虽利,民虽众,国愈弱至削”。大数据时代,循“数”治国将更加有效。小数据时代,政府做决策更多依凭经验和局部数据,难免头痛医头、脚痛医脚。比如,交通堵塞就多修路。大数据时代,政府做决策能够从粗放型转向集约型。路堵了,利用大数据分析,可以得知哪一时间、哪一地段最容易堵,或在这一地段附近多修路,或提前预警引导居民合理安排出行,实现对交通流的最佳配置和控制,改善交通。  对于商家来说,大数据使精准营销成为可能。一个有趣的故事,是沃尔玛超市的“啤酒、尿布”现象。沃尔玛超市分析销售数据时发现,顾客消费单上和尿布一起出现次数最多的商品,竟然是啤酒。跟踪调查后发现,有不少年轻爸爸会在买尿布时,顺便买些啤酒喝。沃尔玛发现这一规律后,搭配促销啤酒、尿布,销量大幅增加。大数据时代,每个人都会“自发地”提供数据。我们的各种行为,如点击网页、使用手机、刷卡消费、观看电视、坐地铁出行、驾驶汽车,都会生成数据并被记录下来,我们的性别、职业、喜好、消费能力等信息,都会被商家从中挖掘出来,以分析商机。  大数据也将使个人受益。从生物学、医学上讲,以前生物学家只是通过对单个或几个基因的操控来观察其对生物体的影响,很难发现整体的关联。现在由于技术的发展,可以分析很多,如遗传信息、全体基因的表达量信息、蛋白质族谱信息、全基因组甲基化信息、表观遗传信息等。同时还有个人健康指标、病历、药物反应等数据。如果真能达成生物学上多维多向数据的有机融合,就能够把个人完整地描述出来,从而实现精准医疗的目的。  大数据时代,审核数据的真实性也有了更有效的手段。大数据的特征之一是多样性,不同来源、不同维度的数据之间存在一定的关联度,可以交叉验证。例如,某地的工业产值虚报了一倍,但用电量和能耗却没有达到相应的规模。这就是数据异常,很容易被系统识别出来。发现异常后,相关部门再进行复核,就能更有针对性地防止、打击数据造假。  数据是一种资源,但数据又跟煤、石油等物质性资源不一样。物质性资源不可再生,你用多了,别人就用少了,因而很难共享。数据可以重复使用、不断产生新的价值。大数据资源的使用是非恶性竞争的,共享的前提下,更能够制造双赢。从另一个角度来说,数据如果不被融合、联系在一起,也不能称之为大数据。  大数据不能被直接拿来使用,统计学依然是数据分析的灵魂  现在社会上有一种流行的说法,认为在大数据时代,“样本=全体”,人们得到的不是抽样数据而是全数据,因而只需要简单地数一数就可以下结论了,复杂的统计学方法可以不再需要了。  在我看来,这种观点非常错误。首先,大数据告知信息但不解释信息。打个比方说,大数据是“原油”而不是“汽油”,不能被直接拿来使用。就像股票市场,即使把所有的数据都公布出来,不懂的人依然不知道数据代表的信息。大数据时代,统计学依然是数据分析的灵魂。正如加州大学伯克利分校迈克尔·乔丹教授指出的,“没有系统的数据科学作为指导的大数据研究,就如同不利用工程科学的知识来建造桥梁,很多桥梁可能会坍塌,并带来严重的后果。”  其次,全数据的概念本身很难经得起推敲。全数据,顾名思义就是全部数据。这在某些特定的场合对于某些特定的问题确实可能实现。比如,要比较清华、北大两校同学数学能力整体上哪个更强,可以收集到两校同学高考时的数学成绩作为研究的数据对象。从某种意义上说,这是全数据。但是,并不是说我们有了这个全数据就能很好地回答问题。  一方面,这个数据虽然是全数据,但仍然具有不确定性。入校时的数学成绩并不一定完全代表学生的数学能力。假如让所有同学重新参加一次高考,几乎每个同学都会有一个新的成绩。分别用这两组全数据去做分析,结论就可能发生变化。另一方面,事物在不断地发展和变化,同学入校时的成绩并不能够代表现在的能力。全体同学的高考成绩数据,仅对于那次考试而言是全数据。“全”是有边界的,超出了边界就不再是全知全能了。事物的发展充满了不确定性,而统计学,既研究如何从数据中把信息和规律提取出来,找出最优化的方案;也研究如何把数据当中的不确定性量化出来。  所以说,在大数据时代,数据分析的很多根本性问题和小数据时代并没有本质区别。当然,大数据的特点,确实对数据分析提出了全新挑战。例如,许多传统统计方法应用到大数据上,巨大计算量和存储量往往使其难以承受;对结构复杂、来源多样的数据,如何建立有效的统计学模型也需要新的探索和尝试。对于新时代的数据科学而言,这些挑战也同时意味着巨大的机遇,有可能会产生新的思想、方法和技术。
以上是小编为大家分享的关于大数据时代,统计学还有用吗的相关内容,更多信息可以关注环球青藤分享更多干货

7. 统计学能与大数据联系上吗

已上提问是统计学基本概念不清楚:所为的大数剧就是数剧流大一点而已,并没有超出统计学描述的范围;也就是互联网、计算机、苹果手机,小朋友啊摇一摇,小姑娘们聊啊聊,这些信息、资料、图相飘啊飘,飘到空间瞬间形成庞大的几十万亿的数剧云。最后这些数据流我们用计算机通过统计学专业人士加已整理、分析。
         统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。
      统计学·是当今世上最大的认识论和方法论,所有的科学前言问题都要由统计学来加已描述。统计学统帅一切科学。
参见:社会统计学与数理统计学的统一理论。

统计学能与大数据联系上吗

8. 大数据与统计学有什么关系?

实际上,虽然在大数据时代背景下,统计学的知识体系产生了一定程度的调整,但是统计学本身的理念与大数据还是具有一定区别的,统计学注重的是方式方法,而大数据则更关注于整个数据价值化的过程,大数据不仅需要统计学知识,还需要具备数学知识和计算机知识。从另一个角度来说,统计学为大数据进行数据价值化奠定了一定的基础。


从技术体系结构来看,统计学知识主要应用在大数据分析领域,统计学方式是大数据分析的两种主要方式之一,另一种数据分析方式是机器学习。所以,对于主攻大数据分析方向的研发人员来说,掌握统计学知识还是很有必要的,统计学在数据分析方面已经形成了一个较为系统的知识体系,而且很多技术已经经过了实践的检验。其实对于很多职场人来说,平时大部分的数据分析任务都是基于统计学理论进行的,包括采用的数据分析工具也都属于统计学领域的范畴。


从未来的发展趋势来看,一方面统计学会进一步向大数据倾斜,包括目前不少统计学专业的研究生课题,都逐渐开始向大数据方向拓展,另一方面大数据会在发展的初期大量采用统计学相关理论和技术,这也能够提升大数据相关技术的落地应用能力。
最新文章
热门文章
推荐阅读