博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
助人就是助己:IBM宣布大规模资助开源大数据项目Spark
阅读量:5869 次
发布时间:2019-06-19

本文共 1045 字,大约阅读时间需要 3 分钟。

本周一,IBM宣布将对开源实时大数据分析项目Apache Spark进行大规模资助,蓝色巨人宣称,其资助的力度之大相当于每年数亿美元的投入。

Hadoop技术出自Google、Yahoo这些互联网公司,主要是为了对规模庞大的各类数据进行处理和分析。不过近年来随着大数据应用的流行,越来越多的公司也希望自己具备类似的能力,这使得Hadoop逐步进入了主流。Hadoop以及相关的分发企业如Cloudera, Hortonworks等也成为了大数据领域的投资热点。

Spark同样也提供大数据处理与分析能力。如果说Hadoop胜在规模的话,那么Spark就胜在速度。这项由2年前UC Berkeley AMP实验室开发的技术将中间输出结果保存在内存而不是分布式文件系统中,从而可以提供实时的数据分析能力。与Hadoop获得的资助相比,对Spark的支持还很不够。

正是在此背景下IBM宣布了对Spark的大规模资助。蓝色巨人将投入超过3500名开发者到Spark相关项目,为项目提供机器学习技术,并将Spark嵌入到IBM的数据分析和商用软件中,同时还会把Spark作为服务在它的Bluemix开发平台上提供出来。为了鼓励基于Spark的创新,IBM还将在旧金山设立一个Spark技术中心。IBM还将把自己的一个研究项目SystemML开源。这个项目是利用机器学习技术去识别数据模式,而它正是在Spark基础上开发的。

IBM还计划与UC Berkeley的AMPLab、DataCamp、Galvanize以及Big Data University等学术及教育组织合作提供Spark教育课程,目标是培养100万名数据工程师和数据科学家。

IBM的大规模资助令人瞩目。回顾过去,正是由于IBM的出手才让若干关键技术得到了普及,比如说1980年代IBM对PC的投入,2000年代对Linux的投入均加速了相关技术成为主流的进程。

当然,对于IBM来说,对Spark的大规模投入实际上也在帮助它自己。此举不仅能强化自己在大数据领域的地位,同时也能吸引更多开发者加盟它的生态体系,帮助IBM更快更好地解决其业务问题。

而放眼更大的环境,开源化已成不可逆转的趋势。技术巨头比以往任何时候都更加热情地涌入到这一潮流当中。比方说Google开源了自己最大的秘密之一,Facebook更是几乎将自己变成了一所开源实验室。因为这些巨头明白,如果不拥抱开源,也许就会被开源消灭。

本文作者:佚名

来源:51CTO

转载地址:http://gjanx.baihongyu.com/

你可能感兴趣的文章
Character Studio
查看>>
【转】关于PHP的header("P3P: CP=CURa……")
查看>>
PHP如何释放内存之unset销毁变量并释放内存详解
查看>>
开源:Taurus.MVC 框架 (已支持.NET Core)
查看>>
C# WPF定时器
查看>>
30个你必须记住的CSS选择符
查看>>
CSS图片裁剪Clip
查看>>
iOS中JS 与OC的交互(JavaScriptCore.framework)
查看>>
Unbuntu和Centos中部署同时多版本PHP的详细过程
查看>>
Spring Boot配置文件规则以及使用方法官方文档查找以及Spring项目的官方文档查找方法...
查看>>
python binascii模块详解
查看>>
Hive之 hive的三种使用方式(CLI、HWI、Thrift)
查看>>
UWP的一种下拉刷新实现
查看>>
requests 证书验证
查看>>
iOS开发基础:OC数组对象NSArray的常用方法
查看>>
Xcode下的中文乱码问题
查看>>
How can I set ccshared=-fPIC while executing ./configure?
查看>>
python常见面试题(三)
查看>>
串行 RapidIO
查看>>
linux service命令解析(重要)
查看>>