Hadoop十大应用领域--从互联网行业到传统行业( 二 )


8. 欺诈检测(Fraud ) 。这已经是老生常谈了,在金融服务机构和情报机构中,欺诈检测一直都是关注的重点 。一家企业,Zions 向我讲述了他们是如何利用来存储所有数据,并对客户交易和现货异常进行判断,对可能存在欺诈行为提前预警的 。
9. IT安全(IT ) 。如基础设施管理一样,企业通过使用来处理机器产生的数据,以识别恶意软件和网络攻击模式 。去年,通过使用来指定IP地址的名誉得分(在0-1之间的得分,O等于没有防线或未知的风险),从而使其他安全产品可以判断是否接受来自这些来源的通信,IBM和HP都使用的安全产品 。
10. 医疗保健( care) 。我认为有很多方法可使更多的医疗保健医生从中受益 。但是最常见的仍然在搜索领域 。去年,我介绍的,利用平台开发了语义分析服务,可以对病人的健康提供医生、护士、及其他相关人士的回答 。试图通过对医疗记录进行先进的技术分析,与一个简单的基于云计算的搜索引擎来帮助医生迅速了解病人相关病史,挽救生命 。
下面是一些全球著名企业应用案例(整理自)
美国国会图书馆是全球最大的图书馆,自1800年设立至今,收藏了超过1.5亿个实体对象,包括书籍、影音、老地图、胶卷等,数字数据量也达到了235TB,但美国eBay拍卖网站,8千万名用户每天产生的数据量就有50TB,5天就相当于1座美国国会图书馆的容量 。
在国外,不只eBay这种跨国电子商务业者感受到巨量数据的冲击,其他如美国连锁超市龙头Wal-Mart、发行信用卡的Visa公司等,在台湾如台湾集成电路(台积电)、中华电信等手上拥有大量顾客资料的企业,都纷纷感受到这股如海啸般来袭的Big Data巨量资料浪潮 。这样的巨量数据并非是没有价值的数据,其中潜藏了许多使用者亲身经验的第一手原始数据,不少企业更是从中嗅到了商机 。
这些企业纷纷向最早面临Big Data挑战的搜索引擎业者、Yahoo取经,学习处理巨量数据的技术和经验,其中,最受这些企业青睐,用来解决巨量数据难题的技术就是基金会的分布式计算技术项目 。
应用案例1-全球最大超市业者Wal-Mart
Wal-Mart分析顾客商品搜索行为,找出超越竞争对手的商机

Hadoop十大应用领域--从互联网行业到传统行业

文章插图
全球最大连锁超市Wal-Mart利用来分析顾客搜寻商品的行为,以及用户透过搜索引擎寻找到Wal-Mart网站的关键词,利用这些关键词的分析结果发掘顾客需求,以规画下一季商品的促销策略,甚至打算分析顾客在、等社交网站上对商品的讨论,期望能比竞争对手提前一步发现顾客需求 。
Wal-Mart虽然十年前就投入在线电子商务,但在线销售的营收远远落后于 。后来,Wal-Mart决定采用来分析顾客搜寻商品的行为,以及用户透过搜索引擎寻找到Wal-Mart网站的关键词,利用这些关键词的分析结果发掘顾客需求,以规画下一季商品的促销策略 。他们并进一步打算要分析顾客在、等社交网站上对商品的讨论,甚至Wal-Mart能比父亲更快知道女儿怀孕的消息,并且主动寄送相关商品的促销邮件,可说是比竞争对手提前一步发现顾客 。
应用案例2-全球最大拍卖网站eBay
eBay用拆解非结构性巨量数据,降低数据仓储负载
经营拍卖业务的eBay则是用来分析买卖双方在网站上的行为 。eBay拥有全世界最大的数据仓储系统,每天增加的数据量有50TB,光是储存就是一大挑战,更遑论要分析这些数据,而且更困难的挑战是这些数据报括了结构化的数据和非结构化的数据,如照片、影片、电子邮件、用户的网站浏览Log记录等 。