9
Apache Spark a یک موتور سریع و کلی برای پردازش داده در مقیاس بزرگ است.سرعت اجرای برنامه ها تا 100 برابر سریعتر از Hadoop MapReduce در حافظه یا 10 برابر سریعتر بر روی دیسک.جرقه یک موتور اجرای پیشرفته DAG دارد که از جریان داده های چرخه ای و محاسبات درون حافظه پشتیبانی می کند.
apache-spark
سایت اینترنتی:
http://spark.apache.orgدسته بندی ها
گزینه های دیگر برای Apache Spark برای Windows
18
Apache Hadoop
Apache Hadoop یک چارچوب نرم افزار منبع باز است که از برنامه های توزیع شده با داده های گسترده با مجوز Apache v2 مجوز پشتیبانی می کند.
1
Disco MapReduce
دیسکو یک چارچوب سبک باز و منبع باز برای محاسبات توزیع شده مبتنی بر الگوی MapReduce است و در پایتون نوشته شده است.