峰谷检测算法技术文档

1. 算法概述

本算法用于在二维曲线数据中精确检测局部极值点（峰和谷）。算法结合了离散极值检测、二次插值精确定位和突出度过滤，适用于干净数据和轻度噪声数据。

2. 核心算法流程

2.1 主流程图

输入数据 (std::map<double, double>)
    ↓
数据预处理（转换为向量）
    ↓
计算自适应阈值
    ↓
遍历所有内部点（i = 1 to n-2）
    ↓
离散极值检测（三点比较）
    ↓ [是极值]
二次插值精确定位
    ↓
计算突出度
    ↓ [突出度 ≥ 阈值]
距离检查
    ↓ [距离 ≥ 最小间隔]
添加到结果集
    ↓
返回极值点列表

3. 详细算法步骤

3.1 离散极值检测

原理：对每个内部数据点，检查其是否大于（峰）或小于（谷）两个相邻点。

// 峰检测条件
isPeak = (y[i] > y[i-1]) && (y[i] > y[i+1])

// 谷检测条件  
isValley = (y[i] < y[i-1]) && (y[i] < y[i+1])

时间复杂度：O(n)，其中n为数据点数量

3.2 二次插值精确定位（拉格朗日插值）

目的：极值点可能位于两个采样点之间，使用二次插值找到真实极值位置。

数学原理：
给定三个点 (x₀, y₀), (x₁, y₁), (x₂, y₂)，拟合二次多项式：

y = ax² + bx + c

系数计算（拉格朗日形式转标准形式）：

denom = (x0 - x1) * (x0 - x2) * (x1 - x2)
a = (y0*(x1-x2) + y1*(x2-x0) + y2*(x0-x1)) / denom
b = (y0*(x2²-x1²) + y1*(x0²-x2²) + y2*(x1²-x0²)) / denom
c = (y0*x1*x2*(x1-x2) + y1*x0*x2*(x2-x0) + y2*x0*x1*(x0-x1)) / denom

极值点位置：
x_vertex = -b / (2a)

边界检查：

验证 x_vertex ∈ [min(x₀,x₂), max(x₀,x₂)]
若超出范围，回退到离散点(x₁, y₁)
若a ≈ 0（近似线性），返回离散点

优势：

处理非等距采样点
亚采样精度定位
数值稳定性好

3.3 突出度（Prominence）计算

突出度衡量极值点的显著程度，用于过滤噪声和微小波动。

3.3.1 简单方法（适用于干净数据）

搜索范围：

1	`searchRange = min(20, dataSize/4)`

峰的突出度：

在峰左侧搜索范围内找最小值 min_left
在峰右侧搜索范围内找最小值 min_right
突出度 = y_peak - max(min_left, min_right)

谷的突出度：

在谷左侧搜索范围内找最大值 max_left
在谷右侧搜索范围内找最大值 max_right
突出度 = min(max_left, max_right) - y_valley

代码实现：

double calculateProminenceSimple(
    const QVector<double>& yData,
    int index, 
    double extremumY, 
    bool isPeak) {
    
    int searchRange = std::min(20, (int)yData.size() / 4);
    
    if (isPeak) {
        double leftMin = extremumY;
        double rightMin = extremumY;
        
        for (int j = std::max(0, index - searchRange); j < index; ++j) {
            leftMin = std::min(leftMin, yData[j]);
        }
        
        for (int j = index + 1; j < std::min(yData.size(), index + searchRange); ++j) {
            rightMin = std::min(rightMin, yData[j]);
        }
        
        return extremumY - std::max(leftMin, rightMin);
    } else {
        double leftMax = extremumY;
        double rightMax = extremumY;
        
        for (int j = std::max(0, index - searchRange); j < index; ++j) {
            leftMax = std::max(leftMax, yData[j]);
        }
        
        for (int j = index + 1; j < std::min(yData.size(), index + searchRange); ++j) {
            rightMax = std::max(rightMax, yData[j]);
        }
        
        return std::min(leftMax, rightMax) - extremumY;
    }
}

3.3.2 鲁棒方法（类SciPy，适用于噪声数据）

算法步骤：

对于峰：

向左搜索直到找到更高的峰或到达边界
在峰与左边界之间找最小值
向右搜索直到找到更高的峰或到达边界
在峰与右边界之间找最小值
突出度 = 峰值 - max(左侧最小值, 右侧最小值)

核心思想：突出度是相对于”参考水平”的高度，参考水平由两侧的最低点决定。

3.4 阈值选择策略

3.4.1 固定阈值

1	`threshold = (yMax - yMin) * 0.03 // 范围的3%`

3.4.2 自适应阈值

基于噪声水平估计：

// 估计噪声水平（相邻点差值的标准差）
double estimateNoise(const QVector<double>& yData) {
    double sumDiffSq = 0;
    for (int i = 1; i < yData.size(); ++i) {
        double diff = yData[i] - yData[i-1];
        sumDiffSq += diff * diff;
    }
    return std::sqrt(sumDiffSq / (yData.size() - 1));
}

// 自适应阈值
double range = yMax - yMin;
double noiseLevel = estimateNoise(yData);

if (noiseLevel < range * 0.01)
    threshold = range * 0.02;  // 非常干净：2%
else if (noiseLevel < range * 0.05)
    threshold = range * 0.03;  // 中等干净：3%
else
    threshold = range * 0.05;  // 有噪声：5%

3.5 距离过滤

确保极值点之间有最小间隔，避免密集重复检测：

minDistance = 5.0;  // 度数或数据单位

// 检查新极值点与已有极值点的距离
bool tooClose = false;
for (const auto& existingExtremum : extrema) {
    if (std::abs(newExtremum.x - existingExtremum.x) < minDistance) {
        tooClose = true;
        break;
    }
}

4. 算法特性对比

特性	简单方法	鲁棒方法（SciPy-like）
计算复杂度	O(n)	O(n²)（最坏情况）
搜索范围	固定	动态
适用场景	干净数据	噪声数据
参数数量	少	多
结果稳定性	高	中
内存占用	低	中

5. 实现细节

5.1 数据结构

// 输入
std::map<double, double> data  // x-y数据对，自动排序

// 中间数据
QVector<double> xData, yData;  // 向量形式，便于索引访问

// 输出
QVector<QPair<double, double>> extrema  // 极值点列表

5.2 关键参数

参数	默认值	说明	调节建议
prominenceThreshold	3% of range	突出度阈值	噪声大时增加
minDistance	5.0	极值点最小间隔	根据数据密度调整
searchRange	min(20, n/4)	突出度搜索范围	周期性数据可减小

5.3 完整实现示例

QVector<QPair<double, double>> MarkerManager::findLocalExtrema(
    const std::map<double, double>& data, 
    bool findPeaks) {
    
    QVector<QPair<double, double>> extrema;
    if (data.size() < 3) return extrema;
    
    // 1. 数据预处理
    QVector<double> xData, yData;
    for (const auto& [x, y] : data) {
        xData.append(x);
        yData.append(y);
    }
    
    // 2. 计算阈值
    double yMin = *std::min_element(yData.begin(), yData.end());
    double yMax = *std::max_element(yData.begin(), yData.end());
    double prominenceThreshold = (yMax - yMin) * 0.03;
    
    // 3. 遍历检测
    for (int i = 1; i < xData.size() - 1; ++i) {
        double x0 = xData[i-1], y0 = yData[i-1];
        double x1 = xData[i],   y1 = yData[i];
        double x2 = xData[i+1], y2 = yData[i+1];
        
        bool isPotentialExtremum = findPeaks ? 
            (y1 > y0 && y1 > y2) : 
            (y1 < y0 && y1 < y2);
        
        if (isPotentialExtremum) {
            // 4. 精确定位
            auto extremumPoint = refineExtremumQuadratic(x0, y0, x1, y1, x2, y2);
            
            // 5. 突出度检查
            if (extremumPoint.first >= x0 && extremumPoint.first <= x2) {
                double prominence = calculateProminence(
                    xData, yData, i, extremumPoint.second, findPeaks);
                
                if (prominence >= prominenceThreshold) {
                    // 6. 距离检查
                    bool tooClose = false;
                    for (const auto& ext : extrema) {
                        if (std::abs(extremumPoint.first - ext.first) < 5.0) {
                            tooClose = true;
                            break;
                        }
                    }
                    
                    if (!tooClose) {
                        extrema.append(extremumPoint);
                    }
                }
            }
        }
    }
    
    return extrema;
}

6. 使用建议

6.1 干净数据场景

特征：

噪声水平 < 1% 范围
平滑曲线
明确的峰谷结构

推荐配置：

1
2
3

prominenceThreshold = range * 0.02;  // 2%
minDistance = 5.0;
useSimpleProminence = true;

6.2 噪声数据场景

特征：

噪声水平 > 5% 范围
包含高频扰动
峰谷不明显

推荐配置：

prominenceThreshold = range * 0.05;  // 5%
minDistance = 10.0;  // 增加最小间隔
useRobustProminence = true;
// 考虑预滤波

6.3 性能优化建议

大数据集（>10000点）：
- 分段并行处理
- 缓存插值结果
- 使用空间索引加速距离检查
实时处理：
- 滑动窗口算法
- 增量更新
- 降低采样率
高精度要求：
- 使用样条插值替代二次插值
- 增加搜索范围
- 多尺度分析

7. 算法优势

精确定位：二次插值提供亚采样精度，误差小于0.1个采样间隔
自适应性：根据数据质量自动调整参数
鲁棒性：两种突出度算法适应不同数据质量
可配置性：所有关键参数可调，适应不同应用场景
计算效率：O(n)时间复杂度（简单方法）
数值稳定：拉格朗日插值避免矩阵求逆

8. 局限性与改进方向

8.1 当前局限性

强噪声处理：噪声>10%范围时效果下降
局部二次假设：对尖锐峰或平顶峰效果不佳
固定最小距离：不适合非均匀分布的极值
边界效应：首尾数据点无法检测

8.2 可能的改进

预处理：
- Savitzky-Golay滤波
- 小波去噪
- 中值滤波
高级插值：
- 三次样条插值
- PCHIP插值
- 高斯拟合
自适应参数：
- 基于局部统计的动态阈值
- 自适应最小距离
- 多尺度检测

9. 代码示例

9.1 基本使用

// 创建管理器
MarkerManager manager;

// 检测峰
auto peaks = manager.findLocalExtrema(data, true);

// 检测谷
auto valleys = manager.findLocalExtrema(data, false);

// 添加标记
for (const auto& peak : peaks) {
    manager.addMarker(curveName, peak.first, peak.second, MarkerType::Peak);
}

9.2 高级配置

// 自定义参数检测
QVector<QPair<double, double>> findCustomExtrema(
    const std::map<double, double>& data) {
    
    // 自定义阈值
    double customThreshold = calculateCustomThreshold(data);
    
    // 自定义最小距离
    double customMinDistance = estimateFeatureScale(data);
    
    // 使用鲁棒方法
    return findLocalExtremaRobust(data, true, 
                                  customThreshold, 
                                  customMinDistance);
}

10. 测试与验证

10.1 测试用例

正弦波：验证周期性峰谷检测
高斯峰：验证精确定位
噪声数据：验证鲁棒性
边界情况：验证边界处理

10.2 性能基准

数据规模	简单方法	鲁棒方法
100点	<1ms	<2ms
1000点	<5ms	<20ms
10000点	<50ms	<500ms

11. 总结

该峰谷检测算法通过结合离散检测、连续插值和智能过滤，实现了高精度的极值点定位。算法的模块化设计使其易于根据具体应用场景进行调整。对于干净数据，简单方法即可获得亚采样精度的检测结果；对于噪声数据，鲁棒方法提供了更好的适应性。二次插值确保了即使在稀疏采样的情况下也能准确定位极值点，而基于突出度的过滤机制有效排除了噪声引起的伪极值。

该算法已在实际工程项目中验证，适用于信号处理、数据分析、曲线特征提取等多个领域。

技术分享

#C++ #算法 #峰谷检测 #插值

峰谷检测算法技术文档

http://aojian-blog.oss-cn-wuhan-lr.aliyuncs.com/2025/09/05/peak-valley-detection/

作者

遨见

发布于

2025年9月5日

许可协议

数据匹配接口性能优化方案分析上一篇

ParaView插件开发中的数据传递方式对比与性能优化下一篇