[python] 1D numpy 배열에서 Numpy를 사용하여 로컬 최대 값 / 최소값 찾기

1D numpy 배열에서 로컬 최대 값 / 최소값을 찾을 수있는 numpy / scipy의 모듈 함수를 제안 할 수 있습니까? 분명히 가장 간단한 접근 방식은 가장 가까운 이웃을 보는 것입니다. 그러나 저는 numpy 배포판의 일부인 수용된 솔루션을 갖고 싶습니다.

답변

a이웃보다 작은 1d 배열의 모든 항목을 찾고 있다면 시도해 볼 수 있습니다.

numpy.r_[True, a[1:] < a[:-1]] & numpy.r_[a[:-1] < a[1:], True]

당신은 또한 수 부드럽게 사용이 단계 전에 배열을 numpy.convolve().

나는 이것에 대한 전용 기능이 없다고 생각합니다.

답변

SciPy에서> = 0.11

import numpy as np
from scipy.signal import argrelextrema

x = np.random.random(12)

# for local maxima
argrelextrema(x, np.greater)

# for local minima
argrelextrema(x, np.less)

생산

>>> x
array([ 0.56660112,  0.76309473,  0.69597908,  0.38260156,  0.24346445,
    0.56021785,  0.24109326,  0.41884061,  0.35461957,  0.54398472,
    0.59572658,  0.92377974])
>>> argrelextrema(x, np.greater)
(array([1, 5, 7]),)
>>> argrelextrema(x, np.less)
(array([4, 6, 8]),)

이것은 로컬 최대 / 최소 인 x의 인덱스입니다. 값을 얻으려면 다음을 시도하십시오.

>>> x[argrelextrema(x, np.greater)[0]]

scipy.signal또한 제공 argrelmax하고 argrelmin각각 최대 값과 최소값을 찾기위한.

답변

노이즈가 많지 않은 곡선의 경우 다음과 같은 작은 코드 스 니펫을 권장합니다.

from numpy import *

# example data with some peaks:
x = linspace(0,4,1e3)
data = .2*sin(10*x)+ exp(-abs(2-x)**2)

# that's the line, you need:
a = diff(sign(diff(data))).nonzero()[0] + 1 # local min+max
b = (diff(sign(diff(data))) > 0).nonzero()[0] + 1 # local min
c = (diff(sign(diff(data))) < 0).nonzero()[0] + 1 # local max


# graphical output...
from pylab import *
plot(x,data)
plot(x[b], data[b], "o", label="min")
plot(x[c], data[c], "o", label="max")
legend()
show()

이 +1있기 때문에 중요하다 diff원래의 인덱스 수를 줄일 수 있습니다.

답변

도움이 될 수있는 또 다른 접근 방식 (더 많은 단어, 적은 코드) :

국소 최댓값과 최솟값의 위치는 1 차 미분의 제로 교차점의 위치이기도합니다. 일반적으로 로컬 최대 값과 최소값을 직접 찾는 것보다 제로 교차점을 찾는 것이 훨씬 쉽습니다.

불행히도 1 차 미분은 노이즈를 “증폭”하는 경향이 있으므로 원본 데이터에 상당한 노이즈가있는 경우 1 차 미분은 원본 데이터에 어느 정도의 평활화가 적용된 후에 만 사용하는 것이 가장 좋습니다.

평활화는 가장 단순한 의미에서 저역 통과 필터이기 때문에 평활화는 종종 컨볼 루션 커널을 사용하여 가장 잘 (가장 쉽게) 수행되며 커널이 놀라운 양의 기능 보존 / 향상 기능을 제공 할 수 있도록 “형성”합니다. . 최적의 커널을 찾는 프로세스는 다양한 수단을 사용하여 자동화 할 수 있지만 가장 좋은 방법은 단순한 무차별 대입 (작은 커널을 찾는 데 매우 빠름) 일 수 있습니다. 좋은 커널은 (의도 한대로) 원본 데이터를 크게 왜곡하지만 관심있는 피크 / 밸리의 위치에는 영향을주지 않습니다.

다행히도 간단한 SWAG ( “교육 된 추측”)를 통해 적절한 커널을 만들 수 있습니다. 평활화 커널의 너비는 원래 데이터에서 예상되는 가장 넓은 “흥미로운”피크보다 약간 더 넓어야하며 그 모양은 해당 피크 (단일 스케일 웨이블릿)와 유사합니다. 평균 보존 커널 (좋은 평활 필터가 있어야하는 것)의 경우 커널 요소의 합은 정확히 1.00이어야하며 커널은 중심에 대해 대칭이어야합니다 (즉, 요소 수가 홀수임을 의미합니다.

최적의 평활화 커널 (또는 다른 데이터 콘텐츠에 최적화 된 적은 수의 커널)이 주어지면 평활화 정도는 컨볼 루션 커널 (의 “이득”)에 대한 스케일링 인자가됩니다.

평활화 (컨볼 루션 커널 이득)의 “올바른”(최적) 정도를 결정하는 것도 자동화 할 수 있습니다. 1 차 도함수 데이터의 표준 편차를 평활 데이터의 표준 편차와 비교합니다. 스무딩 캠 정도의 변화에 따라 두 표준 편차의 비율이 어떻게 변하는지를 사용하여 효과적인 스무딩 값을 예측합니다. 몇 가지 수동 데이터 실행 (정말로 대표적 임) 만 있으면됩니다.

위에 게시 된 모든 이전 솔루션은 1 차 도함수를 계산하지만이를 통계적 측정으로 취급하지 않으며, 위의 솔루션은 기능 유지 / 향상 평활화를 수행하려고 시도하지 않습니다 (미묘한 피크가 노이즈 “위로”도약하는 데 도움이 됨).

마지막으로, 나쁜 소식 : “실제”피크를 찾는 것은 노이즈가 실제 피크 (중복 대역폭)처럼 보이는 기능도 포함 할 때 왕실의 고통이됩니다. 다음으로 더 복잡한 솔루션은 일반적으로 인접한 “실제”피크 (예 : 피크 발생에 대한 최소 또는 최대 속도) 간의 관계를 고려하는 더 긴 컨볼 루션 커널 ( “더 넓은 커널 애 퍼처”)을 사용하거나 다중을 사용하는 것입니다. 컨볼 루션은 너비가 다른 커널을 사용하여 전달됩니다 (그러나 더 빠를 경우에만 : 순차적으로 수행되는 선형 컨볼 루션이 항상 단일 컨볼 루션으로 함께 컨볼 루션 될 수 있다는 것이 기본적인 수학적 사실입니다). 그러나 한 단계에서 최종 커널을 직접 찾는 것보다 먼저 유용한 커널 시퀀스 (다양한 너비)를 찾아서 함께 연결하는 것이 훨씬 쉽습니다.

이 정보가 Google (그리고 아마도 좋은 통계 텍스트)이 공백을 메울 수 있도록 충분한 정보를 제공하기를 바랍니다. 작업 한 예제 나 링크를 제공 할 시간이 있었으면합니다. 누군가가 온라인에서 하나를 발견하면 여기에 게시하십시오!

답변

SciPy 버전 1.1부터 find_peaks 를 사용할 수도 있습니다 . 다음은 문서 자체에서 가져온 두 가지 예입니다.

height인수를 사용하면 특정 임계 값 이상의 모든 최대 값을 선택할 수 있습니다 (이 예에서는 모두 음이 아닌 최대 값입니다. 잡음이있는 기준선을 처리해야하는 경우 매우 유용 할 수 있습니다. 최소값을 찾으려면 입력 값을 곱하면됩니다. 작성자 -1🙂 :

import matplotlib.pyplot as plt
from scipy.misc import electrocardiogram
from scipy.signal import find_peaks
import numpy as np

x = electrocardiogram()[2000:4000]
peaks, _ = find_peaks(x, height=0)
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.plot(np.zeros_like(x), "--", color="gray")
plt.show()

또 다른 매우 유용한 인수는 distance두 봉우리 사이의 최소 거리를 정의하는입니다.

peaks, _ = find_peaks(x, distance=150)
# difference between peaks is >= 150
print(np.diff(peaks))
# prints [186 180 177 171 177 169 167 164 158 162 172]

plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.show()

답변

Scipy 내장 함수 signal.find_peaks_cwt 를 사용하여 작업을 수행하지 않는 이유는 무엇 입니까?

from scipy import signal
import numpy as np

#generate junk data (numpy 1D arr)
xs = np.arange(0, np.pi, 0.05)
data = np.sin(xs)

# maxima : use builtin function to find (max) peaks
max_peakind = signal.find_peaks_cwt(data, np.arange(1,10))

# inverse  (in order to find minima)
inv_data = 1/data
# minima : use builtin function fo find (min) peaks (use inversed data)
min_peakind = signal.find_peaks_cwt(inv_data, np.arange(1,10))

#show results
print "maxima",  data[max_peakind]
print "minima",  data[min_peakind]

결과 :

maxima [ 0.9995736]
minima [ 0.09146464]

문안 인사

답변

업데이트 :
그래디언트가 마음에 들지 않아 사용하는 것이 더 안정적이라는 것을 알았습니다 numpy.diff. 원하는대로 작동하는지 알려주세요.

노이즈 문제와 관련하여 수학적 문제는 앞서 언급 한 convolve와 같은 것을 사용할 수있는 노이즈를보고 싶다면 최대 / 최소를 찾는 것입니다.

import numpy as np
from matplotlib import pyplot

a=np.array([10.3,2,0.9,4,5,6,7,34,2,5,25,3,-26,-20,-29],dtype=np.float)

gradients=np.diff(a)
print gradients


maxima_num=0
minima_num=0
max_locations=[]
min_locations=[]
count=0
for i in gradients[:-1]:
        count+=1

    if ((cmp(i,0)>0) & (cmp(gradients[count],0)<0) & (i != gradients[count])):
        maxima_num+=1
        max_locations.append(count)

    if ((cmp(i,0)<0) & (cmp(gradients[count],0)>0) & (i != gradients[count])):
        minima_num+=1
        min_locations.append(count)


turning_points = {'maxima_number':maxima_num,'minima_number':minima_num,'maxima_locations':max_locations,'minima_locations':min_locations}

print turning_points

pyplot.plot(a)
pyplot.show()