大数据容易陷入怎样的误区?

2022-01-10科技678

Ulf-Dietrich Reips 和 Uwe Matzat 在 2014 年写道,大数据已成为科学研究的“时尚”。研究人员达纳赫博伊德(Danah Boyd)对科学中使用大数据感到担忧,他忽视了原则,比如选择一个有代表性的样本,因为他太担心处理大量的数据。这种方法可能会以某种方式导致结果偏差。跨越异构数据资源的整合 - 有些可能被认为是大数据,有些则不是 - 提出了巨大的后勤和分析挑战,但许多研究人员认为,这种整合很可能代表了科学领域最有前途的新领域。在一篇颇为犀利的的文章《关于大数据的关键问题》中,作者称大数据为神话的一部分:“大数据集提供更高形式的智能和知识,具有真实的光环,客观性和准确性“。大数据用户往往“迷失在庞大的数量中”,“处理大数据仍然是主观的,而且它量化的东西并不一定更接近客观事实。”商业智能领域的最新发展,例如主动报告,特别是通过对无用数据和相关性的自动过滤来改善大数据的可用性。

与分析较小的数据集相比,大数据分析通常较浅。在许多大数据项目中,没有发生大数据分析,但挑战在于提取,转换和加载部分数据预处理。

大数据是一个流行词和一个“模糊词”,但与企业家,顾问,科学家和媒体同时成为“痴迷”。 Google 流感趋势等大数据展示近年来未能提供良好的预测,夸大了流感爆发的两倍。同样,仅基于推特的奥斯卡奖和选举预测往往比预期的要少。大数据通常与小数据一样提出相同的挑战,增加更多数据并不能解决偏见问题,但可能会强调其他问题。特别是像 Twitter 这样的数据来源并不代表总体人口,从这些数据中得出的结果可能会导致错误的结论。

了解更多硅谷前沿深度讯息请看 硅发布 微信公众号

相关文章

大学学大数据专业,应在暑假做些什么准备?

这个问题,我来回答你,跟上我的逻辑。 大数据专业是一个实用性很强的专业,学的好,毕业就能拿高薪,甚至方法得当一年半载就能接项目挣钱,真正合格的大数据人才,现在的行价是多少呢?基本上是20K每月起步吧。学大数据,你得定个目标,比如说为了进华为而学大数据,怎么驱动自己呢?当然是薪资喽,研究及实战型的大数...

猫头鹰为什么叫?

很多人认为猫头鹰叫会死人,但实际上,这两者之间并没有什么联系。最近科学研究好象发现,猫头鹰对将死之人身上的气息有特别的嗅觉,似乎就可以解释为什么听到猫头鹰叫的区域总要死人了。猫头鹰叫是常有的事情,住在山里的人都听过,当然不会因此而死人。也许它有一定的根据,只是用现在的科学技术还解决不了,它对着我们叫...

中科院是做什么研究的?

中国科学院是我国的最高科研机构,下属很多科研院所机构,重点承担国家重点项目、基础研究和一些关乎国计民生的大的项目,但在一些特殊时期也会承担急迫的民生项目。改革开放初期,一些新中国成立后已经被宣布灭绝的传染病、性传播疾病死灰复燃,发病率逐年升高,比如艾滋病、淋病、尖锐湿疣等,引起了国家有关部门的高度重...

中科院当研究员搞科研是什么职位?收入多少?

中国科学院助理研究员是科员(九到十四级)了。 首先,因为中国科学院是部级单位,属于专业技术级的部级单位,所以中科院的院长是享受的部长级(三到四级)正职待遇。 然后,中科院下设很多的直属研究机构,这些机构都有他们的负责人,他们的级别应该是厅级正职(五到七级)了。 然后,这些机构的下设研究室,研究室主任...

中国林业科学研究院林产化工研究所是什么性质的单位?

中国林业科学研究院林产化学工业研究所(简称林化所)是中国唯一专业从事木质和非木质生物质资源化学加工与利用,集基础研究、应用研究、产品开发及工程设计为一体的国家级综合性研究机构,为副司局级单位,成立于1960年7月。 林化所的主要研究领域有生物质能源、生物质化学品、生物质新材料、植物提取物、林纸一体化...

中国最优秀的企业有哪些?

这个问题的关键是如何定义“最优秀”? 如果“最优秀”指的是营收规模,可以参照中国企业500强榜单。 在营收规模的排行榜中,前100名多数是统筹国家矿产、金融等资源的国企,所以营收规模不能代表“最优秀”的本质。 如果“最优秀”指的是创新能力,可以参照《2018年中国大陆创新企业百强》。 百强创新榜单是...

学大数据之后能做什么工作?

1、数据挖掘工程师 做数据挖掘要从海量数据中发现规律,这就需要一定的数学知识,最基本的比如线性代数、高等代数、凸优化、概率论等。 PS:经常会用到的语言包括Python、Java、C或者C++,有些人用Python或者Java比较多。有时用MapReduce写程序,再用Hadoop或者Hyp来处理数...

人体艺术真的大部分是展示女人吗?为什么?

可不可以认为,人们对“人”也就是我们自己,一直好奇、一直在探索,因为这个世界上没有两个人是相同的,我们对我们自己是谁、从哪里来、要到哪里去的的不解之谜,不同时期解开的也有所不同,但直到现在我们所探索到的还只是冰山一角而已、未来还能解开多少谁也给不出答案,就像我们对浩瀚的宇宙认知。 不同领域都对人体做...

如何快速增长知识?

需要的是科学的方法在信息爆炸的时代,谁不想快人一步,如果我们脑袋里可以植入晶片,每秒记忆上百兆的内容,那该多好?可惜,现在的我们还没有办法做到如此省事。 怀揣着快速增加知识储备的想法,不是说不好。只是老想着快速的话,反而会让我们陷入焦虑的状态,适得其反。我们需要探讨的应该是如何科学的增加知识储备,不...

互联网行业产品经理(PM)的月薪一般是多少?觉得如何?

你好,谢谢你的邀请。互联网行业产品经理的月薪一般在6000-12000元(三线城市)左右,产品经理需要及时关注行业动态、关注产品数据、挖掘用户需求、挑战用户体验极限,汇总数据写MRD/PRD、展示产品模型、用户访谈及数据监控等等,还要还要根据产品的生命周期,协调研发、营销、运营等,确定和组织实施相应...

藏族是一个什么样的民族?

一个历史悠久的雪域民族,其前身象雄文化内容博大精深,对世界影响深远。表现:1.轮回思想传至印度,与印度吠陀文化相结合形成了印度佛教。2.伴随象雄疆域远播中亚,形成中亚文化,深深影响着波斯和阿拉伯文化。3.藏文化继承其转世说,并在印度佛教的反哺影响之下形成了藏传佛教。 需要指出的是藏文化脱胎于象雄文化...

美国非农数据利好美元,但是利空美债,贵金属怎么走?

首先提问里面有一个误区,非农数据自然是利好美元的,同时利空美债。但是这里利空美债的是价格而不是收益率,事实上非农数据的好转意味着美国经济开始进入明确的复苏,因此作为避险资产的美国国债价格自然下行,收益率因此上行。 所以如果单纯的说非农数据的影响的话,那么如果数据良好,利好美元,利空国债,自然对黄金等...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。