vamp-fanchirp: FChTransformF0gram.cpp comparison

comparison FChTransformF0gram.cpp @ 16:ce62ed201de8 spect

Toward (but not quite reaching) accurate frequency labels for outputs

author	Chris Cannam
date	Wed, 03 Oct 2018 15:47:00 +0100
parents	0a860992b4f4
children	436eab0bc1ff

comparison

equal deleted inserted replaced

-:0a860992b4f4
+:ce62ed201de8
 #include "bqvec/Allocators.h"
 using namespace breakfastquay;
-//#define DEBUG
+#define DEBUG
 #define MAX(x, y) (((x) > (y)) ? (x) : (y))
 FChTransformF0gram::FChTransformF0gram(ProcessingMode mode,
 float inputSampleRate) :
 m_fs = inputSampleRate;
 // max frequency of interest (Hz)
 m_fmax = 10000.f;
 // warping parameters
 m_warp_params.nsamps_twarp = 2048;
-//m_warp_params.nsamps_twarp = 8;
 m_warp_params.alpha_max = 4;
 m_warp_params.num_warps = 21;
-//m_warp_params.num_warps = 11;
 m_warp_params.fact_over_samp = 2;
 m_warp_params.alpha_dist = 0;
 // f0 parameters
 m_f0_params.f0min = 80.0;
 m_f0_params.num_octs = 4;
 m_nfft = m_warp_params.nsamps_twarp;
 // hop in samples
 m_hop = m_warp_params.fact_over_samp * 256;
 m_num_f0s = 0;
+m_f0s = 0;
 }
 FChTransformF0gram::~FChTransformF0gram()
 {
 if (!m_blockSize) {
 deallocate(m_glogs_fifth_harmonic_posfrac);
 deallocate(m_glogs_fifth_harmonic);
 deallocate(m_glogs_f0_preference_weights);
 deallocate(m_glogs_median_correction);
 deallocate(m_glogs_sigma_correction);
+deallocate(m_f0s);
 }
 string
 FChTransformF0gram::getIdentifier() const {
 switch (m_processingMode) {
 FChTransformF0gram::OutputList
 FChTransformF0gram::getOutputDescriptors() const {
 OutputList list;
-// See OutputDescriptor documentation for the possibilities here.
+vector<string> labels;
-// Every plugin must have at least one output.
+char label[100];
-/* f0 values of F0gram grid as string values */
+if (m_processingMode == ModeF0Gram) {
-vector<string> f0values;
-int ind = 0;
+/* f0 values of F0gram grid as string values */
-char f0String[100];
+for (int i = 0; i < m_num_f0s; ++i) {
-while (ind < m_num_f0s) {
+sprintf(label, "%4.2f Hz", m_f0s[i]);
-sprintf(f0String, "%4.2f", m_f0s[ind]);
+labels.push_back(label);
-f0values.push_back(f0String);
+}
-ind++;
-}
+/* The F0gram */
+OutputDescriptor d;
-/* The F0gram */
+d.identifier = "f0gram";
-OutputDescriptor d;
+d.name = "F0gram: salience of f0s";
-d.identifier = "f0gram";
+d.description = "This representation show the salience of the different f0s in the signal.";
-d.name = "F0gram: salience of f0s";
+d.hasFixedBinCount = true;
-d.description = "This representation show the salience of the different f0s in the signal.";
+d.binCount = m_f0_params.num_octs * m_f0_params.num_f0s_per_oct;
-d.hasFixedBinCount = true;
+d.binNames = labels;
-d.binCount = m_f0_params.num_octs * m_f0_params.num_f0s_per_oct;
+d.hasKnownExtents = false;
-d.binNames = f0values;
+d.isQuantized = false;
-d.hasKnownExtents = false;
+d.sampleType = OutputDescriptor::OneSamplePerStep;
-d.isQuantized = false;
+d.hasDuration = false;
-d.sampleType = OutputDescriptor::OneSamplePerStep;
+list.push_back(d);
-d.hasDuration = false;
-list.push_back(d);
+} else {
+for (int i = 0; i < m_warp_params.nsamps_twarp/2+1; ++i) {
+double freq = i * (m_warpings.fs_warp / m_nfft);
+sprintf(label, "%4.2f Hz", freq);
+labels.push_back(label);
+}
+OutputDescriptor d;
+d.identifier = "spectrogram";
+d.name = "Spectrogram";
+d.description = "Time/frequency spectrogram derived from the Fan Chirp Transform output";
+d.hasFixedBinCount = true;
+d.binCount = m_warp_params.nsamps_twarp/2+1;
+d.binNames = labels;
+d.hasKnownExtents = false;
+d.isQuantized = false;
+d.sampleType = OutputDescriptor::OneSamplePerStep;
+d.hasDuration = false;
+list.push_back(d);
+}
 return list;
 }
 bool
 FChTransformF0gram::initialise(size_t channels, size_t stepSize, size_t blockSize) {
 // WARNING !!!
 // these values in fact are determined by the sampling frequency m_fs
 // the parameters used below correspond to default values i.e. m_fs = 44.100 Hz
 //m_blockSize = 4 * m_warp_params.nsamps_twarp;
-m_stepSize = floor(m_hop / m_warp_params.fact_over_samp);
+//    m_stepSize = floor(m_hop / m_warp_params.fact_over_samp);
+/* design of FChT */
+design_FChT();
 /* initialise m_glogs_params */
 design_GLogS();
-/* design of FChT */
-design_FChT();
 design_LPF();
 design_time_window();
 // Create Hanning window for warped signals
 mp_HanningWindow = allocate<double>(m_warp_params.nsamps_twarp);
 bool normalize = false;
 Utils::hanning_window(mp_HanningWindow, m_warp_params.nsamps_twarp, normalize);
+m_num_f0s = m_f0_params.num_octs * m_f0_params.num_f0s_per_oct;
+m_f0s = allocate<double>(m_num_f0s);
+for (int i = 0; i < m_num_f0s; ++i) {
+m_f0s[i] = m_glogs_f0[m_glogs_init_f0s + i];
+}
 return true;
 }
 void
 FChTransformF0gram::design_GLogS() {
 // total number & initial quantity of f0s
+cerr << "per oct = " << m_f0_params.num_f0s_per_oct << ", octs = " << m_f0_params.num_octs << endl;
 m_glogs_init_f0s = (int)(((double)m_f0_params.num_f0s_per_oct)*log2(5.0))+1;
+cerr << "init_f0s = " << m_glogs_init_f0s << endl;
 m_glogs_num_f0s = (m_f0_params.num_octs+1)*m_f0_params.num_f0s_per_oct + m_glogs_init_f0s;
+cerr << "num_f0s = " << m_glogs_num_f0s << endl;
 // Initialize arrays
 m_glogs_f0 = allocate<double>(m_glogs_num_f0s);
 m_glogs = allocate<double>(m_glogs_num_f0s*m_warp_params.num_warps);
 m_glogs_n = allocate<int>(m_glogs_num_f0s);
 double aux_pos;
 for (int i = 0; i < m_glogs_num_f0s; i++) {
 for (int j = 1; j <= m_glogs_n[i]; j++) {
 // indice en el vector de largo t_warp/2+1 donde el ultimo valor corresponde a f=m_fmax
 aux_pos = ((double)j*m_glogs_f0[i])*((double)(m_warp_params.nsamps_twarp/2+1))/m_fmax;
+//!!!            cerr << "aux_pos = " << aux_pos << endl;
+//            aux_pos = ((double)j*m_glogs_f0[i])*((double)(m_warp_params.nsamps_twarp/2+1))/m_warpings.fs_warp;
+//            cerr << "or " << aux_pos << " (as fs_warp = " << m_warpings.fs_warp << ")" << endl;
 m_glogs_posint[aux_index] = (int)aux_pos;
 m_glogs_posfrac[aux_index] = aux_pos - (double)m_glogs_posint[aux_index];
 aux_index++;
 }
 }
 void FChTransformF0gram::apply_LPF()
 {
 fft_forward_LPF->forward(LPF_time, LPF_frequency);
 for (int i = 0; i < m_blockSize/2+1; i++) {
-LPF_frequency[i*2]     *= mp_LPFWindow[i] * m_warpings.nsamps_torig;
+LPF_frequency[i*2]     *= mp_LPFWindow[i];
-LPF_frequency[i*2 + 1] *= mp_LPFWindow[i] * m_warpings.nsamps_torig;
+LPF_frequency[i*2 + 1] *= mp_LPFWindow[i];
 }
 fft_inverse_LPF->inverse(LPF_frequency, LPF_time);
 // TODO ver si hay que hacer fftshift para corregir la fase respecto al centro del frame.
 //---------------------------------------------------------------------------
 FeatureSet fs;
 #ifdef DEBUG
-printf("\n	----- DEBUG INFORMATION ----- \n");
+fprintf(stderr, "\n	----- DEBUG INFORMATION ----- \n");
-printf("	m_fs = %f Hz.\n",m_fs);
+fprintf(stderr, "	m_fs = %f Hz.\n",m_fs);
-printf("	fs_orig = %f Hz.\n",m_warpings.fs_orig);
+fprintf(stderr, "	fs_orig = %f Hz.\n",m_warpings.fs_orig);
-printf("	fs_warp = %f Hz.\n",m_warpings.fs_warp);
+fprintf(stderr, "	fs_warp = %f Hz.\n",m_warpings.fs_warp);
-printf("	m_nfft = %d.\n",m_nfft);
+fprintf(stderr, "	m_nfft = %d.\n",m_nfft);
-printf("	m_blockSize = %d.\n",m_blockSize);
+fprintf(stderr, "	m_blockSize = %d.\n",m_blockSize);
-printf("	m_warpings.nsamps_torig = %d.\n",m_warpings.nsamps_torig);
+fprintf(stderr, "	m_warpings.nsamps_torig = %d.\n",m_warpings.nsamps_torig);
-printf("	m_warp_params.num_warps = %d.\n",m_warp_params.num_warps);
+fprintf(stderr, "	m_warp_params.num_warps = %d.\n",m_warp_params.num_warps);
-printf("	m_glogs_harmonic_count = %d.\n",m_glogs_harmonic_count);
+fprintf(stderr, "	m_glogs_harmonic_count = %d.\n",m_glogs_harmonic_count);
 #endif
 for (int i = 0; i < m_blockSize; i++) {
 LPF_time[i] = (double)(inputBuffers[0][i]) * m_timeWindow[i];
+LPF_time[m_blockSize+i] = 0.0;
 }
 //	#ifdef DEBUG
-//		printf("	HASTA ACÁ ANDA!!!\n");
+//		fprintf(stderr, "	HASTA ACÁ ANDA!!!\n");
 //		cout << flush;
 //	#endif
 apply_LPF();
 // Señal filtrada queda en LPF_time
 double max_glogs = -DBL_MAX;
 int ind_max_glogs = 0;
 for (int i_warp = 0; i_warp < m_warp_params.num_warps; i_warp++) {
 // Interpolate
 Utils::interp1q(LPF_time, (m_warpings.pos_int) + i_warp*m_warp_params.nsamps_twarp, m_warpings.pos_frac + i_warp*m_warp_params.nsamps_twarp, x_warping, m_warp_params.nsamps_twarp);
 // Apply window
 for (int i = 0; i < m_warp_params.nsamps_twarp; i++) {
 }
 #ifdef DEBUG
 for (int i = 0; i < m_blockSize; i++) {
 if ((i<transitionWidth)) {
-printf("	m_timeWindow[%d] = %f.\n",i,m_timeWindow[i]);
+fprintf(stderr, "	m_timeWindow[%d] = %f.\n",i,m_timeWindow[i]);
 }
 }
 #endif
 deallocate(lp_transitionWindow);

Mercurial > hg > vamp-fanchirp

comparison FChTransformF0gram.cpp @ 16:ce62ed201de8 spect