索引地址:系列索引
Mean shift 算法是基于核密度估计的爬山算法,可用于聚类、图像分割、跟踪等
假设在一个多维空间中有很多数据点需要进行聚类,Mean Shift的过程如下:
1、在未被标记的数据点中随机选择一个点作为中心center;
2、找出离center距离在bandwidth之内的所有点,记做集合M,认为这些点属于簇c。同时,把这些求内点属于这个类的概率加1,这个参数将用于最后步骤的分类
3、以center为中心点,计算从center开始到集合M中每个元素的向量,将这些向量相加,得到向量shift。
4、center = center+shift。即center沿着shift的方向移动,移动距离是||shift||。
5、重复步骤2、3、4,直到shift的大小很小(就是迭代到收敛),记住此时的center。注意,这个迭代过程中遇到的点都应该归类到簇c。
6、如果收敛时当前簇c的center与其它已经存在的簇c2中心的距离小于阈值,那么把c2和c合并。否则,把c作为新的聚类,增加1类。
6、重复1、2、3、4、5直到所有的点都被标记访问。
7、分类:根据每个类,对每个点的访问频率,取访问频率最大的那个类,作为当前点集的所属类。
简单的说,mean shift就是沿着密度上升的方向寻找同属一个簇的数据点。
测试代码
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56
|
#include "opencv2/highgui/highgui.hpp" #include "opencv2/core/core.hpp" #include "opencv2/imgproc/imgproc.hpp" #include <iostream> using namespace cv; using namespace std;
static void MergeSeg(Mat& img , const Scalar& colorDiff = Scalar::all(1)) { CV_Assert(!img.empty()); RNG rng = theRNG(); Mat mask(img.rows + 2, img.cols + 2, CV_8UC1, Scalar::all(0)); for (int y = 0; y < img.rows; y++) { for (int x = 0; x < img.cols; x++) { if (mask.at<uchar>(y + 1, x + 1) == 0) { Scalar newVal(rng(256), rng(256), rng(256)); floodFill(img, mask, Point(x, y) , newVal, 0, colorDiff, colorDiff); } } } } int main(int argc, char** argv) { cv::Mat srcImg = imread("..\\images\\sea.jpg"); if (srcImg.empty()) return -1; int spatialRad = 20; int colorRad = 20; int maxPyrLevel = 6; cv::Mat resImg; pyrMeanShiftFiltering(srcImg, resImg, spatialRad, colorRad, maxPyrLevel); MergeSeg(resImg, Scalar::all(2)); cv::imshow("src", srcImg); cv::imshow("resImg", resImg); cv::waitKey(); return 0; }
|
效果为