大数据Spark “蘑菇云”行动第82课：Spark机器学习本质思考及案例初体验

段智华发布时间：2016-11-22 20:51:00 ，浏览量：3

大数据Spark “蘑菇云”行动第82课：Spark机器学习本质思考及案例初体验

逻辑回归 a b 男还是女垃圾邮件合格还是不合格
线性回归多个

ALS是机器学习最重要的算法！！

机器学习水平的高低：水平体现在2个方面：
1，标签的选取；2，参数的调优

类似数码相机：选景、参数选取

K-means is one of the most commonly used clustering algorithms that clusters the data points into a predefined number of clusters.

import org.apache.spark.mllib.clustering.{KMeans, KMeansModel}
import org.apache.spark.mllib.linalg.Vectors

// Load and parse the data
val data = sc.textFile("data/mllib/kmeans_data.txt")
val parsedData = data.map(s => Vectors.dense(s.split(' ').map(_.toDouble))).cache()

// Cluster the data into two classes using KMeans
val numClusters = 2
val numIterati

关注

打赏

查看更多评论

大数据Spark “蘑菇云”行动第82课：Spark机器学习本质思考及案例初体验

[ 申请 ]友情链接：