研发埠

标题: 我们应该如何利用大数据? [打印本页]

作者: 陈琳    时间: 2014-2-10 09:54
标题: 我们应该如何利用大数据?

作者: 陈西    时间: 2014-2-10 09:55
大数据包含几个方面的内涵      1.  数据量大,TB,PB,乃至EB等数据量的数据需要分析处理。      2.  要求快速响应,市场变化快,要求能及时快速的响应变化,那对数据的分析也要快速,在性能上有更高要求,所以数据量显得对速度要求有些“大”。      3.  数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作,变为结构数据。      4.  价值密度低,由于数据采集的不及时,数据样本不全面,数据可能不连续等等,数据可能会失真,但当数据量达到一定规模,可以通过更多的数据达到更真实全面的反馈。        很多行业都会有大数据需求,譬如电信行业,互联网行业等等容易产生大量数据的行业,很多传统行业,譬如医药,教育,采矿,电力等等任何行业,都会有大数据需求。        随着业务的不断扩张和历史数据的不断增加,数据量的增长是持续的。    如果需要分析大数据,则可以Hadoop等开源大数据项目,或Yonghong Z-Suite等商业大数据BI工具。        不同行业的数据有不同的自身特点,还需要结合自身的行业知识才能把大数据转换为价值。





欢迎光临 研发埠 (http://bbs.yanfabu.com/) Powered by Discuz! X3.2