找回密码
 注册
搜索
热搜: 超星 读书 找书
查看: 461|回复: 8

[【心情日记】] 大数据是什么?

[复制链接]
发表于 2018-1-29 23:23:13 | 显示全部楼层 |阅读模式
大数据是什么呢?互联网爬虫走进新时代?没有互联网就没有大数据。或者说没有大联网就没有大数据。人与人的联网,人与物的联网,物与物的联网,数据与数据的联网!流动的数据形成的一条河流。大数据就是在这河流里淘金。没有大计算也没有大数据。T级以上的数据参与运算,问你的硬盘够大么?大数据是人类的巴别塔。翻译不是,大数据才是。
回复

使用道具 举报

发表于 2018-1-29 23:25:11 | 显示全部楼层
大数据就是数据大                                      
回复

使用道具 举报

发表于 2018-1-30 09:50:24 | 显示全部楼层
大概的数据,统计数据
回复

使用道具 举报

发表于 2018-1-30 10:53:15 | 显示全部楼层
大数据最终是否让计划经济成为可能?
回复

使用道具 举报

发表于 2018-1-30 10:59:26 | 显示全部楼层
你的思想也会联网的
回复

使用道具 举报

发表于 2018-1-30 11:10:48 | 显示全部楼层
真的不知道什么
回复

使用道具 举报

发表于 2018-1-30 13:49:48 | 显示全部楼层
去看施恩伯格那本书啊,是他提出最权威定义的。
回复

使用道具 举报

发表于 2018-1-30 14:26:31 | 显示全部楼层
反正目前最时髦啦 你看单位总结里到处都是大数据
回复

使用道具 举报

发表于 2018-1-30 18:38:23 | 显示全部楼层
大数据的定义
大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。”业界通常用4个V(即Volume、Variety、Value、Velocity)来概括大数据的特征。
数据体量巨大(Volume)。截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类说过的所有的话的数据量大约是5EB(1EB=210PB)。
数据类型繁多(Variety)。相对于以往便于存储的以文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
价值密度低(Value)。价值密度的高低与数据总量的大小成反比。如何通过强大的机器算法更迅速地完成数据的价值“提纯”成为目前大数据背景下亟待解决的难题。
处理速度快(Velocity)。大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。


大数据应用的第一阶段:辅助产品。大数据应用的第二阶段:创造价值。大数据应用的第三阶段:塑造我们。
大数据挖掘商业价值的方法主要分为四种:
客户群体细分,然后为每个群体量定制特别的服务。
模拟现实环境,发掘新的需求同时提高投资的回报率。
加强部门联系,提高整条管理链条和产业链条的效率。
降低服务成本,发现隐藏线索进行产品和服务的创新。
大数据的类型大致可分为三类:
传统企业数据(Traditional enterprise data):包括 CRM systems的消费者数据,传统的ERP数据,库存数据以及账目数据等。
机器和传感器数据(Machine-generated /sensor data):包括呼叫记录(Call Detail Records),智能仪表,工业设备传感器,设备日志(通常是Digital exhaust),交易数据等。
社交数据(Social data):包括用户行为记录,反馈数据等。如Twitter,Facebook这样的社交媒体平台。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|网上读书园地

GMT+8, 2024-4-26 00:18 , Processed in 0.307183 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表