日前,Strata+HadoopWorld2016大会在纽约举行。许多业界人士参加了这个活动。行业专家通过此次大会了解到Hadoop市场日趋成熟,大数据应用日益增长。
行业专家的研究表明,大数据可以带来巨大的商业利益。在大数据和分析基准研究中,超过四分之三(78%)的参与者表示,预测分析是其组织采用大数据分析最重要的领域。在这个预测分析研究中,几乎三分之二(57%)的组织表示他们通过应用高级分析获得了竞争优势。
因此,人们正在超越技术采用生命周期的早期采用阶段。越来越多的组织认识到大数据和高级分析可以提供竞争优势。因此,人们更多关注的是其商业价值,而不仅仅是追求这个优势所需的技术。
在Strata+Hadoop世界主题演讲上,许多供应商选择将他们的客户带到会场上或分享他们的客户如何利用大数据技术对组织产生积极影响的故事。还有大量的技术培训课程,而在主题演讲之前还进行了为期两天的培训,但活动的主要阶段集中在可以用大数据做什么,而不是如何做。与会者似乎也将重点放在活动上。
多家供应商参加了今年早些时候在圣荷西举办的Strata+Hadoop活动。他们都表示相比以前的活动,更多的是与业务重点的客户互动。人们开始寻找将大数据技术应用于实际业务需求的方法。
这不是说在活动中没有交流和沟通技术话题,其中包括数据科学,流数据和数据准备和治理。还提供了有关各种数据科学主题的教程,包括如何在编程语言(如Python和Spark)中实现机器学习。而这个研究表明,Python是数据科学分析中最受欢迎的语言之一,超过三分之一(36%)的组织使用它。Spark作为提供大数据,机器学习和实时功能的方式越来越受欢迎。至少有六家知名的供应商参加了展会,宣传他们的数据科学能力,许多其他供应商的营销材料描述了他们如何支持数据科学,例如使用支持数据科学过程的数据准备工具。
实时处理流数据也是一个常见的主题。大数据的大部分都是流数据不断生成的。因此,用户可能会在生成数据时实时分析数据,从而获得价值。在这个研究中,实时分析是预测分析后第二大数据分析领域(54%)。在其原始形式中,Hadoop被设计为一个批处理系统,但随着其流行度越来越高,已经向Hadoop生态系统添加了实时功能。
数据准备和治理的主题并不令人惊讶。通过大数据集成基准研究表明,审查质量和一致性问题(52%)和准备数据(46%)的数据被认为是大数据集成过程中最耗时的两个方面。同样,这个大数据分析研究表明,39%的组织认为数据质量和信息管理是大数据分析的第二大障碍。供应商和大数据的技术社区正在试图解决这些问题。
如今,大数据社区不断发展,Strata+Hadoop世界活动正在帮助厂商与用户促进对话,教育和增长。这个最近的事件是大数据社区 成长 的表现,意味着重点已经转移到提供业务价值。Strata+HadoopWorld不仅让业界人士可以了解大数据技术,还可以了解如何解决业务问题。
编辑:Harris