vamp-fanchirp: FChTransformF0gram.cpp comparison

comparison FChTransformF0gram.cpp @ 20:7964cc5ad98f spect

Correct the time-alignment of the output blocks

author	Chris Cannam
date	Thu, 04 Oct 2018 13:32:47 +0100
parents	d7fbd446f47f
children	37917af73ae9

comparison

equal deleted inserted replaced

-:d7fbd446f47f
+:7964cc5ad98f
 FChTransformF0gram::FChTransformF0gram(ProcessingMode mode,
 float inputSampleRate) :
 Plugin(inputSampleRate),
 m_processingMode(mode),
-m_stepSize(0), // We are using 0 for step and block size to indicate "not yet set".
+m_initialised(false),
-m_blockSize(0) {
+m_stepSize(256),
+m_blockSize(8192) {
 m_fs = inputSampleRate;
 // max frequency of interest (Hz)
 m_fmax = 10000.f;
 // warping parameters
 m_f0s = 0;
 }
 FChTransformF0gram::~FChTransformF0gram()
 {
-if (!m_blockSize) {
+if (!m_initialised) {
 return; // nothing was allocated
 }
+deallocate(m_inputBuffer);
 deallocate(m_warpings.pos_int);
 deallocate(m_warpings.pos_frac);
 deallocate(m_warpings.chirp_rates);
 clean_LPF();
 FChTransformF0gram::getInputDomain() const {
 return TimeDomain;
 }
 size_t FChTransformF0gram::getPreferredBlockSize() const {
-return 8192; // 0 means "I can handle any block size"
+// We do our own accumulating into blocks within process()
+return m_blockSize/2;
 }
 size_t
 FChTransformF0gram::getPreferredStepSize() const {
-return 256; // 0 means "anything sensible"; in practice this
+return m_stepSize;
-// means the same as the block size for TimeDomain
-// plugins, or half of it for FrequencyDomain plugins
 }
 size_t
 FChTransformF0gram::getMinChannelCount() const {
 return 1;
 }
 bool
 FChTransformF0gram::initialise(size_t channels, size_t stepSize, size_t blockSize) {
 if (channels < getMinChannelCount() ||
-channels > getMaxChannelCount()) {
+channels > getMaxChannelCount() ||
+blockSize != m_blockSize/2 ||
+stepSize != m_stepSize) {
 return false;
 }
-// set blockSize and stepSize (but changed below)
+m_inputBuffer = allocate_and_zero<float>(m_blockSize);
-m_blockSize = blockSize;
-m_stepSize = stepSize;
 // WARNING !!!
 // these values in fact are determined by the sampling frequency m_fs
 // the parameters used below correspond to default values i.e. m_fs = 44.100 Hz
 //m_blockSize = 4 * m_warp_params.nsamps_twarp;
 //    m_stepSize = floor(m_hop / m_warp_params.fact_over_samp);
 m_num_f0s = m_f0_params.num_octs * m_f0_params.num_f0s_per_oct;
 m_f0s = allocate<double>(m_num_f0s);
 for (int i = 0; i < m_num_f0s; ++i) {
 m_f0s[i] = m_glogs_f0[m_glogs_init_f0s + i];
 }
+m_initialised = true;
 return true;
 }
 void
 FChTransformF0gram::design_GLogS() {
 }
 void
 FChTransformF0gram::design_FChT() {
-/*
-* FILES FOR DEBUGGING
-*/
-//ofstream output("output.txt");
 /*  =============  WARPING DESIGN   ============= */
 // sampling frequency after oversampling
 m_warpings.fs_orig = m_warp_params.fact_over_samp * m_fs;
 }
 // design of warpings for efficient interpolation
 design_warps(freq_relative, t_orig, t_warp);
-/*
-* FILES FOR DEBUGGING
-*/
-/*
-output << "chirp_rates" << endl;
-for (int j = 0; j < m_warp_params.num_warps; j++){
-output << m_warpings.chirp_rates[j];
-output << " ";
-}
-output << endl << "freq_relative" << endl;
-for (int i = 0; i < m_warpings.nsamps_torig; i++){
-for (int j = 0; j < m_warp_params.num_warps; j++){
-output << freq_relative[j * m_warpings.nsamps_torig + i];
-output << " ";
-}
-output << endl;
-}
-output << endl << "t_orig" << endl;
-for (int i = 0; i < m_warpings.nsamps_torig; i++){
-output << t_orig[i] << endl ;
-}
-*/
 deallocate(freq_relative);
 deallocate(t_orig);
 deallocate(t_warp);
-//output.close();
 /*  =============  FFTW PLAN DESIGN   ============= */
 // Initialize 2-d array for warped signals
 x_warping = allocate<double>(m_warp_params.nsamps_twarp);
 m_absFanChirpTransform = allocate<double>(m_warp_params.num_warps * (m_warp_params.nsamps_twarp/2 + 1));
 LPF_frequency[i*2]     *= mp_LPFWindow[i];
 LPF_frequency[i*2 + 1] *= mp_LPFWindow[i];
 }
 fft_inverse_LPF->inverse(LPF_frequency, LPF_time);
 // TODO ver si hay que hacer fftshift para corregir la fase respecto al centro del frame.
 // nota: además de aplicar el LPF, esta función resamplea la señal original.
 }
 void FChTransformF0gram::clean_LPF()
 }
 FChTransformF0gram::FeatureSet
 FChTransformF0gram::process(const float *const *inputBuffers, Vamp::RealTime) {
-//    // Do actual work!
+if (!m_initialised) return FeatureSet();
-//
 /* PSEUDOCÓDIGO:
 - Aplicar FFT al frame entero.
 - Filtro pasabajos en frecuencia.
 - FFT inversa al frame entero.
 -----------------------------------------------------------------------------
 fprintf(stderr, "	m_warpings.nsamps_torig = %d.\n",m_warpings.nsamps_torig);
 fprintf(stderr, "	m_warp_params.num_warps = %d.\n",m_warp_params.num_warps);
 fprintf(stderr, "	m_glogs_harmonic_count = %d.\n",m_glogs_harmonic_count);
 #endif
-for (int i = 0; i < m_blockSize; i++) {
+for (int i = 0; i < m_blockSize - m_stepSize; ++i) {
-LPF_time[i] = (double)(inputBuffers[0][i]) * m_timeWindow[i];
+m_inputBuffer[i] = m_inputBuffer[i + m_stepSize];
-LPF_time[m_blockSize+i] = 0.0;
+}
-}
+for (int i = 0; i < m_blockSize/2; ++i) {
+m_inputBuffer[m_blockSize/2 + i] = inputBuffers[0][i];
-//	#ifdef DEBUG
+}
-//		fprintf(stderr, "	HASTA ACÁ ANDA!!!\n");
+for (int i = 0; i < m_blockSize; ++i) {
-//		cout << flush;
+LPF_time[i] = m_inputBuffer[i] * m_timeWindow[i];
-//	#endif
+}
+for (int i = 0; i < m_blockSize; ++i) {
+LPF_time[m_blockSize + i] = 0.0;
+}
 apply_LPF();
 // Señal filtrada queda en LPF_time
 Feature feature;
 feature.hasTimestamp = false;
 }
 void
 FChTransformF0gram::design_time_window() {
-int transitionWidth = (int)m_blockSize/128 + 1;;
+int transitionWidth = (int)m_blockSize/128 + 128;
 m_timeWindow = allocate<double>(m_blockSize);
 double *lp_transitionWindow = allocate<double>(transitionWidth);
-//memset(m_timeWindow, 1.0, m_blockSize);
 for (int i = 0; i < m_blockSize; i++) {
 m_timeWindow[i] = 1.0;
 }
 for (int i = 0; i < transitionWidth; i++) {

Mercurial > hg > vamp-fanchirp

comparison FChTransformF0gram.cpp @ 20:7964cc5ad98f spect