Mercurial > hg > constant-q-cpp


#include "CQKernel.h"

#include "qm-dsp/maths/MathUtilities.h"
#include "qm-dsp/dsp/transforms/FFT.h"
#include "qm-dsp/base/Window.h"

#include <cmath>
#include <cassert>
#include <vector>
#include <iostream>

using std::vector;
using std::cerr;
using std::endl;

CQKernel::CQKernel(double sampleRate, double maxFreq, int binsPerOctave)
{
    m_p.sampleRate = sampleRate;
    m_p.maxFrequency = maxFreq;
    m_p.binsPerOctave = binsPerOctave;
    generateKernel();
}

CQKernel::~CQKernel()
{
    delete m_fft;
}

void
CQKernel::generateKernel()
{
    double q = 1;
    double atomHopFactor = 0.25;
    double thresh = 0.0005;

    double bpo = m_p.binsPerOctave;

    m_p.minFrequency = (m_p.maxFrequency / 2) * pow(2, 1.0/bpo);
    m_p.Q = q / (pow(2, 1.0/bpo) - 1.0);

    double maxNK = round(m_p.Q * m_p.sampleRate / m_p.minFrequency);
    double minNK = round
	(m_p.Q * m_p.sampleRate /
	 (m_p.minFrequency * pow(2, (bpo - 1.0) / bpo)));

    m_p.atomSpacing = round(minNK * atomHopFactor);
    m_p.firstCentre = m_p.atomSpacing * ceil(ceil(maxNK / 2.0) / m_p.atomSpacing);
    m_p.fftSize = MathUtilities::nextPowerOfTwo
	(m_p.firstCentre + ceil(maxNK / 2.0));

    m_p.atomsPerFrame = floor
	(1.0 + (m_p.fftSize - ceil(maxNK / 2.0) - m_p.firstCentre) / m_p.atomSpacing);

    int lastCentre = m_p.firstCentre + (m_p.atomsPerFrame - 1) * m_p.atomSpacing;

    m_p.fftHop = (lastCentre + m_p.atomSpacing) - m_p.firstCentre;

    m_fft = new FFT(m_p.fftSize);

    for (int k = 1; k <= m_p.binsPerOctave; ++k) {

	int nk = round(m_p.Q * m_p.sampleRate /
		       (m_p.minFrequency * pow(2, ((k-1.0) / bpo))));

	// The MATLAB version uses a symmetric window, but our windows
	// are periodic. A symmetric window of size N is a periodic
	// one of size N-1 with the first element stuck on the end
	Window<double> w(BlackmanHarrisWindow, nk-1);
	vector<double> win = w.getWindowData();
	win.push_back(win[0]);

	for (int i = 0; i < (int)win.size(); ++i) {
	    win[i] = sqrt(win[i]) / nk;
	}

	double fk = m_p.minFrequency * pow(2, ((k-1.0) / bpo));

	vector<double> reals, imags;

	for (int i = 0; i < nk; ++i) {
	    double arg = (2.0 * M_PI * fk * i) / m_p.sampleRate;
	    reals.push_back(win[i] * cos(arg));
	    imags.push_back(win[i] * sin(arg));
	}

	int atomOffset = m_p.firstCentre - int(ceil(nk/2.0));

	for (int i = 0; i < m_p.atomsPerFrame; ++i) {

	    int shift = atomOffset + (i * m_p.atomSpacing);

	    vector<double> rin(m_p.fftSize, 0.0);
	    vector<double> iin(m_p.fftSize, 0.0);

	    for (int j = 0; j < nk; ++j) {
		rin[j + shift] = reals[j];
		iin[j + shift] = imags[j];
	    }

	    vector<double> rout(m_p.fftSize, 0.0);
	    vector<double> iout(m_p.fftSize, 0.0);

	    m_fft->process(false,
			   rin.data(), iin.data(),
			   rout.data(), iout.data());

	    int firstNZ = -1, lastNZ = -1;

	    for (int j = 0; j < m_p.fftSize; ++j) {
		if (sqrt(rout[j] * rout[j] + iout[j] * iout[j]) >= thresh) {
		    lastNZ = j;
		    if (firstNZ < 0) firstNZ = j;
		} else {
		    rout[j] = iout[j] = 0;
		}
	    }

	    vector<double> rnz, inz;

	    if (firstNZ >= 0) {
		for (int j = firstNZ; j <= lastNZ; ++j) {
		    rnz.push_back(rout[j] / m_p.fftSize);
		    inz.push_back(iout[j] / m_p.fftSize);
		}
		m_kernel.offsets.push_back(firstNZ);
	    } else {
		m_kernel.offsets.push_back(0);
	    }

	    m_kernel.real.push_back(rnz);
	    m_kernel.imag.push_back(inz);
	}
    }

    assert((int)m_kernel.offsets.size() == m_p.binsPerOctave * m_p.atomsPerFrame);
    assert((int)m_kernel.real.size() == m_p.binsPerOctave * m_p.atomsPerFrame);
    assert((int)m_kernel.imag.size() == m_p.binsPerOctave * m_p.atomsPerFrame);

    // print density as diagnostic

    int nnz = 0;
    for (int i = 0; i < m_kernel.offsets.size(); ++i) {
	assert(m_kernel.real[i].size() == m_kernel.imag[i].size());
	for (int j = 0; j < m_kernel.real[i].size(); ++j) {
	    if (m_kernel.real[i][j] != 0.0 ||
		m_kernel.imag[i][j] != 0.0) {
		++nnz;
	    }
	}
    }

    cerr << "density = " << double(nnz) / double(m_p.binsPerOctave * m_p.atomsPerFrame * m_p.fftSize) << " (" << nnz << " of " << m_p.binsPerOctave * m_p.atomsPerFrame * m_p.fftSize << ")" << endl;

    //!!! and normalise

/* far too laborious

    int wx1 = -1, wx2 = -1;
    double wm1 = 0, wm2 = 0;

    for (int i = 0; i < m_kernel.real[0].size(); ++i) {
	m = m_kernel.real[0][i] * m_kernel.real[0][i] +
	    m_kernel.imag[0][i] * m_kernel.imag[0][i];
	if (wx1 == -1 || m > wm1) {
	    wx1 = i + m_kernel.offsets[0];
	    wm1 = m;
	}
    }

    int n = m_kernel.offsets.size() - 1;
    for (int i = 0; i < m_kernel.real[n].size(); ++i) {
	m = m_kernel.real[n][i] * m_kernel.real[n][i] +
	    m_kernel.imag[n][i] * m_kernel.imag[n][i];
	if (wx2 == -1 || m > wm1) {
	    wx2 = i + m_kernel.offsets[n];
	    wm2 = m;
	}
    }

*/
}
author	Chris Cannam <c.cannam@qmul.ac.uk>
date	Fri, 01 Nov 2013 17:58:39 +0000
parents	701900c371b0
children	3973be829352