我们先来理一理大数据这个圈子的脉络,先来确定一个问题:我们所说的大数据,研究其的核心价值在哪里? 是的,这是一个很奇怪问题,像是在几年前,大数据这个词突然就火了,然后就一直火,然后火的一塌糊涂。我们再来思考一下这个问题,在数据量未增长到一定规模,或者说大家还没有意识到数据成长到了一定规模,又或者说相关技术支撑尚未成熟的时期,数据被人关注的并不是太多。 在大数据技术日渐成熟时候,特别是以hadoop生态为代表的技术圈日渐丰富,在数据规模日渐增长的今天,对于数据研究的人也越来越多。 于是,越来越多的人投身其中。我们需要先明白我们的目的:挖掘数据中的价值。这里所谓的挖掘并不是狭义上的数据挖掘的概念,而是包括了对于杂乱数据的整理以期发现其体现的业务现状,通过对大批数据的统计分析达到对业务的调整以及决策,通过对大批量数据的潜在关系或者趋势的挖掘实施相关个性化的策略等等。 说白了就两个字,价值。不管是大的价值还是小的价值,我们需要从数据中获利,这是我们的根本目标。也就是说,我们在大数据这个圈子里所干的一切,都是为了榨干数据潜藏的价值。 明白了核心价值所在,我们再来关注一下我们的研究实体——数据。 我们的数据从哪而来?我们的数据拿过来就可以用吗?榨干数据的价值,用榨汁机榨吗?数据到底该怎么处理?是的,我们要用到哪些技术? 围绕怎么榨干数据这个问题,我们可以衍生出很多很多的问题,都是需要我们一一去解决的,这也就是为何很多人迷茫的直接原因。 杂乱无章,无从下手。这是很多新手或者说已经身陷其中的程序猿都面临的一个问题。 不可否认的是我们的研究实体始终是数据,我们是围绕它在转的,确定了这一点,剩下的问题,我们一个一个的来理。 http://www.qykh2009.com/prodetail_15.html
|