什么是“大数据”?

为什么这是一个大问题?

大数据是通过研究大量的非结构化数据来了解和预测人类行为的新科学。大数据也被称为“预测分析”。

分析推特帖子,Facebook提要,eBay.搜索,全球定位系统跟踪器和ATM机是一些大数据示例。研究安全视频,交通数据,天气模式,航班抵达,手机塔日志和心率跟踪器是其他形式。大数据是一周变化的凌乱新科学,只有少数专家了解这一切。

日常生活中的大数据

过境时间,纽约截图

WNYC.

虽然大多数大数据项目非常模糊,但有成功的实例,影响个人,公司和政府日常生活的大数据:

预测病毒爆发通过研究社会政治数据,天气和气候数据以及医院/临床数据,这些科学家现在预测登革热爆发,预先通知4周。

凶杀手表这个大数据项目描述了华盛顿特区的谋杀受害者、嫌疑人和罪犯。无论是作为缅怀逝者的一种方式,还是作为人们的一种意识资源,这个大数据项目都很吸引人。

Transit Travel Planning,NYCWNYC Radio Programmer Steve Melendez将在线地铁计划与旅行行程软件组合。他的创作让纽约人在地图上点击他们的位置,并将出现对火车和地铁的旅行时间的预测。

Xerox减少了他们的劳动力损失:呼叫中心工作是情绪疲惫的。Xerox在专业分析师的帮助下研究了数据的束缚,现在他们可以预测哪些呼叫中心雇用可能留在公司最长的呼叫中心。

支持反恐:通过研究社交媒体,财务记录,航班预订和安全数据,执法部门可以预测和定位恐怖主义嫌疑人,然后才能完成邪恶的行为。

基于社交媒体评论调整品牌营销:人们直言不讳地迅速分享他们在酒吧,餐厅或健身俱乐部的在线思想。有可能研究这些数百万社交媒体帖子,并向公司提供对人们对其服务的看法提供反馈。

谁使用大数据?他们用它做什么?

计算机网络连接现代城市未来技术 - 增强的照片

AlexSL / Getty Images

许多整体公司使用大数据来调整他们的产品和价格,以最大限度地提高客户满意度。

  • 梅西百货公司:使用大数据来调整其价格超过7000万产品。他们甚至根据他们感兴趣的媒体所信仰的媒体,向客户发送定制的电子邮件。
  • 警方回应波士顿马拉松轰炸:通过使用大数据来学习视频和监视图像,警方能够快速缩小他们对嫌疑人的搜索。
  • 莫顿的牛排馆:利用Twitter来完成营销噱头,包括著名的新泽西机场送牛排和虾晚餐。
  • VISA使用大数据来识别和捕捉欺诈者单一事务在此处,可以轻松地隐藏一个不诚实的信用卡用户,但通过仔细观看数百万笔交易,可以检测到欺诈模式。
  • Facebook使用大数据来定制广告:通过仔细研究您的FB喜欢和浏览习惯,社交媒体巨头对您的口味进行了兴趣洞察力。您在Facebook Feed上看到的那些侧栏广告由非常刻意的和复杂的算法选择,这些算法一直在观看您的Facebook习惯。

为什么大数据如此重要?

1.数据很大-它不适合一个单硬盘驱动器,少了一个u盘。数据量远远超过人类思维能够感知(思考十亿兆字节,然后通过更多数十亿次数乘以乘以更多数量)。

2.数据杂乱无序- 50%至80%的大数据工作正在转换和清理信息,以便可搜索和可排序。我们星球上只有几千名专家完全了解如何进行此数据清理。这些专家还需要非常专业的工具,如HPE和Hadoop,以进行操作。也许在10年内,大数据专家将成为十几个十几个,但目前,他们是一个非常罕见的分析师,他们的作品仍然非常模糊和乏味。

3.数据已成为可以销售和购买的商品- 数据市场存在于公司和个人可以购买社交媒体和其他数据的Tberabytes的地方。大多数数据都是基于云的,因为它太大,不能适合任何单个硬盘。购买数据通常涉及插入云服务器场的订阅费。

亚马逊(Amazon)、谷歌、Facebook和雅虎(Yahoo)是大数据工具和理念的领导者。因为这些公司通过他们的在线服务为数百万人服务,他们将成为大数据分析背后的收集点和远见者是有道理的。

4.大数据的可能性是无限的-也许医生将有一天会在发生前几周预测心脏病发作和笔触。通过对其机械数据和交通和天气模式的预测分析,可能会减少飞机和汽车崩溃。通过为您具有兼容性的谁是兼容性的大数据预测因子,可能会改善在线约会。音乐家可能会洞察最乐观的音乐作品是最令人愉悦的目标观众的味道不断变化。营养学家可能能够预测商店买的食物的组合将加剧或帮助一个人的医疗状况。表面只划伤,并且每周都会发现大数据的发现。

大数据很乱

大数据是预测分析-将大规模的非结构化数据转换为可搜索和排序的东西。这是一个凌乱和混乱的空间,需要一种特殊的知识和耐心。

举例说是单片UPS送货服务。UPS的程序员从他们的驱动程序GPS和智能手机学习数据,以分析适应交通拥堵的最有效方法。此GPS和智能手机数据是Gargantuan,而不是自动准备进行分析。该数据通过不同的智能手机硬件设备从各种GPS和地图数据库中倒入。UPS分析师花了几个月将所有数据转换为可以轻松搜索和排序的格式。但努力是值得的。今天,UPS节省了超过800万加仑的燃料由于他们开始使用这些大数据分析。

因为大数据很乱,需要花费这么多努力来清理和准备使用,但数据科学家已经成为他们所做的所有繁琐工作的绰号“数据Janitors”。

但是,大数据和预测分析的科学每周都在改善。预计2025年,每个人都可以随时随地获得大数据。

大数据是对隐私的侵入性威胁吗?

是的,如果我们的法律和个人隐私辩护未仔细管理,那么大数据侵入个人隐私。因为它代表,谷歌和YouTube和Facebook已经跟踪您的日常在线习惯。您的智能手机和计算生命每天留下数字足迹,先进的公司正在研究这些脚印。

大数据周围的法律正在不断发展。隐私是您现在必须承担个人责任的状态,因为您无法再期望它作为默认权利。

您可以做些什么来保护您的隐私

你可以采取的最大单一步骤是使用a剥夺您的日常习惯VPN.。VPN服务将扰乱信号,以便您的身份和位置至少部分地从跟踪器屏蔽。这不会让您100%匿名,但VPN将大大减少世界可以观察您的在线习惯。

此页面是否有帮助?