Chris@320: /* -*- c-basic-offset: 4 indent-tabs-mode: nil -*- vi:set ts=8 sts=4 sw=4: */ Chris@320: Chris@320: /* Chris@320: Sonic Visualiser Chris@320: An audio file viewer and annotation editor. Chris@320: Centre for Digital Music, Queen Mary, University of London. Chris@320: This file copyright 2006 Chris Cannam and QMUL. Chris@320: Chris@320: This program is free software; you can redistribute it and/or Chris@320: modify it under the terms of the GNU General Public License as Chris@320: published by the Free Software Foundation; either version 2 of the Chris@320: License, or (at your option) any later version. See the file Chris@320: COPYING included with this distribution for more information. Chris@320: */ Chris@320: Chris@331: #include "FeatureExtractionModelTransformer.h" Chris@320: Chris@320: #include "plugin/FeatureExtractionPluginFactory.h" Chris@320: #include "plugin/PluginXml.h" Chris@475: #include Chris@320: Chris@320: #include "data/model/Model.h" Chris@320: #include "base/Window.h" Chris@387: #include "base/Exceptions.h" Chris@320: #include "data/model/SparseOneDimensionalModel.h" Chris@320: #include "data/model/SparseTimeValueModel.h" Chris@320: #include "data/model/EditableDenseThreeDimensionalModel.h" Chris@320: #include "data/model/DenseTimeValueModel.h" Chris@320: #include "data/model/NoteModel.h" Chris@441: #include "data/model/RegionModel.h" Chris@320: #include "data/model/FFTModel.h" Chris@320: #include "data/model/WaveFileModel.h" Chris@558: #include "rdf/PluginRDFDescription.h" Chris@320: Chris@350: #include "TransformFactory.h" Chris@350: Chris@320: #include Chris@320: Chris@350: FeatureExtractionModelTransformer::FeatureExtractionModelTransformer(Input in, Chris@350: const Transform &transform) : Chris@350: ModelTransformer(in, transform), Chris@320: m_plugin(0), Chris@320: m_descriptor(0), Chris@320: m_outputFeatureNo(0) Chris@320: { Chris@350: // std::cerr << "FeatureExtractionModelTransformer::FeatureExtractionModelTransformer: plugin " << pluginId.toStdString() << ", outputName " << m_transform.getOutput().toStdString() << std::endl; Chris@350: Chris@350: QString pluginId = transform.getPluginIdentifier(); Chris@320: Chris@320: FeatureExtractionPluginFactory *factory = Chris@320: FeatureExtractionPluginFactory::instanceFor(pluginId); Chris@320: Chris@320: if (!factory) { Chris@361: m_message = tr("No factory available for feature extraction plugin id \"%1\" (unknown plugin type, or internal error?)").arg(pluginId); Chris@320: return; Chris@320: } Chris@320: Chris@350: DenseTimeValueModel *input = getConformingInput(); Chris@350: if (!input) { Chris@361: m_message = tr("Input model for feature extraction plugin \"%1\" is of wrong type (internal error?)").arg(pluginId); Chris@350: return; Chris@350: } Chris@320: Chris@350: m_plugin = factory->instantiatePlugin(pluginId, input->getSampleRate()); Chris@320: if (!m_plugin) { Chris@361: m_message = tr("Failed to instantiate plugin \"%1\"").arg(pluginId); Chris@320: return; Chris@320: } Chris@320: Chris@350: TransformFactory::getInstance()->makeContextConsistentWithPlugin Chris@350: (m_transform, m_plugin); Chris@343: Chris@350: TransformFactory::getInstance()->setPluginParameters Chris@350: (m_transform, m_plugin); Chris@320: Chris@320: size_t channelCount = input->getChannelCount(); Chris@320: if (m_plugin->getMaxChannelCount() < channelCount) { Chris@320: channelCount = 1; Chris@320: } Chris@320: if (m_plugin->getMinChannelCount() > channelCount) { Chris@361: m_message = tr("Cannot provide enough channels to feature extraction plugin \"%1\" (plugin min is %2, max %3; input model has %4)") Chris@361: .arg(pluginId) Chris@361: .arg(m_plugin->getMinChannelCount()) Chris@361: .arg(m_plugin->getMaxChannelCount()) Chris@361: .arg(input->getChannelCount()); Chris@320: return; Chris@320: } Chris@320: Chris@320: std::cerr << "Initialising feature extraction plugin with channels = " Chris@350: << channelCount << ", step = " << m_transform.getStepSize() Chris@350: << ", block = " << m_transform.getBlockSize() << std::endl; Chris@320: Chris@320: if (!m_plugin->initialise(channelCount, Chris@350: m_transform.getStepSize(), Chris@350: m_transform.getBlockSize())) { Chris@361: Chris@361: size_t pstep = m_transform.getStepSize(); Chris@361: size_t pblock = m_transform.getBlockSize(); Chris@361: Chris@361: m_transform.setStepSize(0); Chris@361: m_transform.setBlockSize(0); Chris@361: TransformFactory::getInstance()->makeContextConsistentWithPlugin Chris@361: (m_transform, m_plugin); Chris@361: Chris@361: if (m_transform.getStepSize() != pstep || Chris@361: m_transform.getBlockSize() != pblock) { Chris@361: Chris@361: if (!m_plugin->initialise(channelCount, Chris@361: m_transform.getStepSize(), Chris@361: m_transform.getBlockSize())) { Chris@361: Chris@361: m_message = tr("Failed to initialise feature extraction plugin \"%1\"").arg(pluginId); Chris@361: return; Chris@361: Chris@361: } else { Chris@361: Chris@361: m_message = tr("Feature extraction plugin \"%1\" rejected the given step and block sizes (%2 and %3); using plugin defaults (%4 and %5) instead") Chris@361: .arg(pluginId) Chris@361: .arg(pstep) Chris@361: .arg(pblock) Chris@361: .arg(m_transform.getStepSize()) Chris@361: .arg(m_transform.getBlockSize()); Chris@361: } Chris@361: Chris@361: } else { Chris@361: Chris@361: m_message = tr("Failed to initialise feature extraction plugin \"%1\"").arg(pluginId); Chris@361: return; Chris@361: } Chris@320: } Chris@320: Chris@366: if (m_transform.getPluginVersion() != "") { Chris@366: QString pv = QString("%1").arg(m_plugin->getPluginVersion()); Chris@366: if (pv != m_transform.getPluginVersion()) { Chris@366: QString vm = tr("Transform was configured for version %1 of plugin \"%2\", but the plugin being used is version %3") Chris@366: .arg(m_transform.getPluginVersion()) Chris@366: .arg(pluginId) Chris@366: .arg(pv); Chris@366: if (m_message != "") { Chris@366: m_message = QString("%1; %2").arg(vm).arg(m_message); Chris@366: } else { Chris@366: m_message = vm; Chris@366: } Chris@366: } Chris@366: } Chris@366: Chris@320: Vamp::Plugin::OutputList outputs = m_plugin->getOutputDescriptors(); Chris@320: Chris@320: if (outputs.empty()) { Chris@361: m_message = tr("Plugin \"%1\" has no outputs").arg(pluginId); Chris@320: return; Chris@320: } Chris@320: Chris@320: for (size_t i = 0; i < outputs.size(); ++i) { Chris@429: // std::cerr << "comparing output " << i << " name \"" << outputs[i].identifier << "\" with expected \"" << m_transform.getOutput().toStdString() << "\"" << std::endl; Chris@350: if (m_transform.getOutput() == "" || Chris@350: outputs[i].identifier == m_transform.getOutput().toStdString()) { Chris@320: m_outputFeatureNo = i; Chris@441: m_descriptor = new Vamp::Plugin::OutputDescriptor(outputs[i]); Chris@320: break; Chris@320: } Chris@320: } Chris@320: Chris@320: if (!m_descriptor) { Chris@361: m_message = tr("Plugin \"%1\" has no output named \"%2\"") Chris@361: .arg(pluginId) Chris@361: .arg(m_transform.getOutput()); Chris@320: return; Chris@320: } Chris@320: Chris@558: createOutputModel(); Chris@558: } Chris@558: Chris@558: void Chris@558: FeatureExtractionModelTransformer::createOutputModel() Chris@558: { Chris@558: DenseTimeValueModel *input = getConformingInput(); Chris@558: Chris@331: // std::cerr << "FeatureExtractionModelTransformer: output sample type " Chris@320: // << m_descriptor->sampleType << std::endl; Chris@320: Chris@558: PluginRDFDescription description(m_transform.getPluginIdentifier()); Chris@558: QString outputId = m_transform.getOutput(); Chris@558: Chris@320: int binCount = 1; Chris@320: float minValue = 0.0, maxValue = 0.0; Chris@320: bool haveExtents = false; Chris@320: Chris@320: if (m_descriptor->hasFixedBinCount) { Chris@320: binCount = m_descriptor->binCount; Chris@320: } Chris@320: Chris@331: // std::cerr << "FeatureExtractionModelTransformer: output bin count " Chris@320: // << binCount << std::endl; Chris@320: Chris@320: if (binCount > 0 && m_descriptor->hasKnownExtents) { Chris@320: minValue = m_descriptor->minValue; Chris@320: maxValue = m_descriptor->maxValue; Chris@320: haveExtents = true; Chris@320: } Chris@320: Chris@350: size_t modelRate = input->getSampleRate(); Chris@320: size_t modelResolution = 1; Chris@320: Chris@320: switch (m_descriptor->sampleType) { Chris@320: Chris@320: case Vamp::Plugin::OutputDescriptor::VariableSampleRate: Chris@320: if (m_descriptor->sampleRate != 0.0) { Chris@320: modelResolution = size_t(modelRate / m_descriptor->sampleRate + 0.001); Chris@320: } Chris@320: break; Chris@320: Chris@320: case Vamp::Plugin::OutputDescriptor::OneSamplePerStep: Chris@350: modelResolution = m_transform.getStepSize(); Chris@320: break; Chris@320: Chris@320: case Vamp::Plugin::OutputDescriptor::FixedSampleRate: Chris@451: //!!! SV doesn't actually support display of models that have Chris@451: //!!! different underlying rates together -- so we always set Chris@451: //!!! the model rate to be the input model's rate, and adjust Chris@451: //!!! the resolution appropriately. We can't properly display Chris@451: //!!! data with a higher resolution than the base model at all Chris@451: // modelRate = size_t(m_descriptor->sampleRate + 0.001); Chris@451: if (m_descriptor->sampleRate > input->getSampleRate()) { Chris@451: modelResolution = 1; Chris@451: } else { Chris@451: modelResolution = size_t(input->getSampleRate() / Chris@451: m_descriptor->sampleRate); Chris@451: } Chris@320: break; Chris@320: } Chris@320: Chris@441: bool preDurationPlugin = (m_plugin->getVampApiVersion() < 2); Chris@441: Chris@441: if (binCount == 0 && Chris@441: (preDurationPlugin || !m_descriptor->hasDuration)) { Chris@320: Chris@445: // Anything with no value and no duration is an instant Chris@445: Chris@320: m_output = new SparseOneDimensionalModel(modelRate, modelResolution, Chris@320: false); Chris@320: Chris@558: QString outputEventTypeURI = description.getOutputEventTypeURI(outputId); Chris@558: m_output->setRDFTypeURI(outputEventTypeURI); Chris@558: Chris@441: } else if ((preDurationPlugin && binCount > 1 && Chris@441: (m_descriptor->sampleType == Chris@441: Vamp::Plugin::OutputDescriptor::VariableSampleRate)) || Chris@441: (!preDurationPlugin && m_descriptor->hasDuration)) { Chris@441: Chris@441: // For plugins using the old v1 API without explicit duration, Chris@441: // we treat anything that has multiple bins (i.e. that has the Chris@441: // potential to have value and duration) and a variable sample Chris@441: // rate as a note model, taking its values as pitch, duration Chris@441: // and velocity (if present) respectively. This is the same Chris@441: // behaviour as always applied by SV to these plugins in the Chris@441: // past. Chris@441: Chris@441: // For plugins with the newer API, we treat anything with Chris@441: // duration as either a note model with pitch and velocity, or Chris@441: // a region model. Chris@441: Chris@441: // How do we know whether it's an interval or note model? Chris@441: // What's the essential difference? Is a note model any Chris@441: // interval model using a Hz or "MIDI pitch" scale? There Chris@441: // isn't really a reliable test for "MIDI pitch"... Does a Chris@441: // note model always have velocity? This is a good question Chris@441: // to be addressed by accompanying RDF, but for the moment we Chris@441: // will do the following... Chris@441: Chris@441: bool isNoteModel = false; Chris@441: Chris@441: // Regions have only value (and duration -- we can't extract a Chris@441: // region model from an old-style plugin that doesn't support Chris@441: // duration) Chris@441: if (binCount > 1) isNoteModel = true; Chris@441: Chris@595: // Regions do not have units of Hz or MIDI things (a sweeping Chris@595: // assumption!) Chris@595: if (m_descriptor->unit == "Hz" || Chris@595: m_descriptor->unit.find("MIDI") != std::string::npos || Chris@595: m_descriptor->unit.find("midi") != std::string::npos) { Chris@595: isNoteModel = true; Chris@595: } Chris@441: Chris@441: // If we had a "sparse 3D model", we would have the additional Chris@441: // problem of determining whether to use that here (if bin Chris@441: // count > 1). But we don't. Chris@441: Chris@441: if (isNoteModel) { Chris@441: Chris@441: NoteModel *model; Chris@441: if (haveExtents) { Chris@441: model = new NoteModel Chris@441: (modelRate, modelResolution, minValue, maxValue, false); Chris@441: } else { Chris@441: model = new NoteModel Chris@441: (modelRate, modelResolution, false); Chris@441: } Chris@441: model->setScaleUnits(m_descriptor->unit.c_str()); Chris@441: m_output = model; Chris@441: Chris@441: } else { Chris@441: Chris@441: RegionModel *model; Chris@441: if (haveExtents) { Chris@441: model = new RegionModel Chris@441: (modelRate, modelResolution, minValue, maxValue, false); Chris@441: } else { Chris@441: model = new RegionModel Chris@441: (modelRate, modelResolution, false); Chris@441: } Chris@441: model->setScaleUnits(m_descriptor->unit.c_str()); Chris@441: m_output = model; Chris@441: } Chris@441: Chris@558: QString outputEventTypeURI = description.getOutputEventTypeURI(outputId); Chris@558: m_output->setRDFTypeURI(outputEventTypeURI); Chris@558: Chris@441: } else if (binCount == 1 || Chris@441: (m_descriptor->sampleType == Chris@441: Vamp::Plugin::OutputDescriptor::VariableSampleRate)) { Chris@441: Chris@441: // Anything that is not a 1D, note, or interval model and that Chris@441: // has only one value per result must be a sparse time value Chris@441: // model. Chris@441: Chris@441: // Anything that is not a 1D, note, or interval model and that Chris@441: // has a variable sample rate is also treated as a sparse time Chris@441: // value model regardless of its bin count, because we lack a Chris@441: // sparse 3D model. Chris@320: Chris@320: SparseTimeValueModel *model; Chris@320: if (haveExtents) { Chris@320: model = new SparseTimeValueModel Chris@320: (modelRate, modelResolution, minValue, maxValue, false); Chris@320: } else { Chris@320: model = new SparseTimeValueModel Chris@320: (modelRate, modelResolution, false); Chris@320: } Chris@558: Chris@558: Vamp::Plugin::OutputList outputs = m_plugin->getOutputDescriptors(); Chris@320: model->setScaleUnits(outputs[m_outputFeatureNo].unit.c_str()); Chris@320: Chris@320: m_output = model; Chris@320: Chris@558: QString outputEventTypeURI = description.getOutputEventTypeURI(outputId); Chris@558: m_output->setRDFTypeURI(outputEventTypeURI); Chris@558: Chris@441: } else { Chris@320: Chris@441: // Anything that is not a 1D, note, or interval model and that Chris@441: // has a fixed sample rate and more than one value per result Chris@441: // must be a dense 3D model. Chris@320: Chris@320: EditableDenseThreeDimensionalModel *model = Chris@320: new EditableDenseThreeDimensionalModel Chris@535: (modelRate, modelResolution, binCount, Chris@535: EditableDenseThreeDimensionalModel::BasicMultirateCompression, Chris@535: false); Chris@320: Chris@320: if (!m_descriptor->binNames.empty()) { Chris@320: std::vector names; Chris@320: for (size_t i = 0; i < m_descriptor->binNames.size(); ++i) { Chris@320: names.push_back(m_descriptor->binNames[i].c_str()); Chris@320: } Chris@320: model->setBinNames(names); Chris@320: } Chris@320: Chris@320: m_output = model; Chris@558: Chris@558: QString outputSignalTypeURI = description.getOutputSignalTypeURI(outputId); Chris@558: m_output->setRDFTypeURI(outputSignalTypeURI); Chris@320: } Chris@333: Chris@350: if (m_output) m_output->setSourceModel(input); Chris@320: } Chris@320: Chris@331: FeatureExtractionModelTransformer::~FeatureExtractionModelTransformer() Chris@320: { Chris@436: // std::cerr << "FeatureExtractionModelTransformer::~FeatureExtractionModelTransformer()" << std::endl; Chris@320: delete m_plugin; Chris@320: delete m_descriptor; Chris@320: } Chris@320: Chris@320: DenseTimeValueModel * Chris@350: FeatureExtractionModelTransformer::getConformingInput() Chris@320: { Chris@408: // std::cerr << "FeatureExtractionModelTransformer::getConformingInput: input model is " << getInputModel() << std::endl; Chris@408: Chris@320: DenseTimeValueModel *dtvm = Chris@320: dynamic_cast(getInputModel()); Chris@320: if (!dtvm) { Chris@350: std::cerr << "FeatureExtractionModelTransformer::getConformingInput: WARNING: Input model is not conformable to DenseTimeValueModel" << std::endl; Chris@320: } Chris@320: return dtvm; Chris@320: } Chris@320: Chris@320: void Chris@331: FeatureExtractionModelTransformer::run() Chris@320: { Chris@350: DenseTimeValueModel *input = getConformingInput(); Chris@320: if (!input) return; Chris@320: Chris@320: if (!m_output) return; Chris@320: Chris@497: while (!input->isReady() && !m_abandoned) { Chris@331: std::cerr << "FeatureExtractionModelTransformer::run: Waiting for input model to be ready..." << std::endl; Chris@497: usleep(500000); Chris@320: } Chris@497: if (m_abandoned) return; Chris@320: Chris@350: size_t sampleRate = input->getSampleRate(); Chris@320: Chris@320: size_t channelCount = input->getChannelCount(); Chris@320: if (m_plugin->getMaxChannelCount() < channelCount) { Chris@320: channelCount = 1; Chris@320: } Chris@320: Chris@320: float **buffers = new float*[channelCount]; Chris@320: for (size_t ch = 0; ch < channelCount; ++ch) { Chris@350: buffers[ch] = new float[m_transform.getBlockSize() + 2]; Chris@320: } Chris@320: Chris@350: size_t stepSize = m_transform.getStepSize(); Chris@350: size_t blockSize = m_transform.getBlockSize(); Chris@350: Chris@320: bool frequencyDomain = (m_plugin->getInputDomain() == Chris@320: Vamp::Plugin::FrequencyDomain); Chris@320: std::vector fftModels; Chris@320: Chris@320: if (frequencyDomain) { Chris@320: for (size_t ch = 0; ch < channelCount; ++ch) { Chris@320: FFTModel *model = new FFTModel Chris@350: (getConformingInput(), Chris@350: channelCount == 1 ? m_input.getChannel() : ch, Chris@350: m_transform.getWindowType(), Chris@350: blockSize, Chris@350: stepSize, Chris@350: blockSize, Chris@334: false, Chris@334: StorageAdviser::PrecisionCritical); Chris@320: if (!model->isOK()) { Chris@320: delete model; Chris@320: setCompletion(100); Chris@387: //!!! need a better way to handle this -- previously we were using a QMessageBox but that isn't an appropriate thing to do here either Chris@387: throw AllocationFailed("Failed to create the FFT model for this feature extraction model transformer"); Chris@320: } Chris@320: model->resume(); Chris@320: fftModels.push_back(model); Chris@320: } Chris@320: } Chris@320: Chris@350: long startFrame = m_input.getModel()->getStartFrame(); Chris@350: long endFrame = m_input.getModel()->getEndFrame(); Chris@320: Chris@350: RealTime contextStartRT = m_transform.getStartTime(); Chris@350: RealTime contextDurationRT = m_transform.getDuration(); Chris@350: Chris@350: long contextStart = Chris@350: RealTime::realTime2Frame(contextStartRT, sampleRate); Chris@350: Chris@350: long contextDuration = Chris@350: RealTime::realTime2Frame(contextDurationRT, sampleRate); Chris@320: Chris@320: if (contextStart == 0 || contextStart < startFrame) { Chris@320: contextStart = startFrame; Chris@320: } Chris@320: Chris@320: if (contextDuration == 0) { Chris@320: contextDuration = endFrame - contextStart; Chris@320: } Chris@320: if (contextStart + contextDuration > endFrame) { Chris@320: contextDuration = endFrame - contextStart; Chris@320: } Chris@320: Chris@320: long blockFrame = contextStart; Chris@320: Chris@320: long prevCompletion = 0; Chris@320: Chris@320: setCompletion(0); Chris@320: Chris@556: float *reals = 0; Chris@556: float *imaginaries = 0; Chris@556: if (frequencyDomain) { Chris@556: reals = new float[blockSize/2 + 1]; Chris@556: imaginaries = new float[blockSize/2 + 1]; Chris@556: } Chris@556: Chris@678: QString error = ""; Chris@678: Chris@320: while (!m_abandoned) { Chris@320: Chris@320: if (frequencyDomain) { Chris@350: if (blockFrame - int(blockSize)/2 > Chris@320: contextStart + contextDuration) break; Chris@320: } else { Chris@320: if (blockFrame >= Chris@320: contextStart + contextDuration) break; Chris@320: } Chris@320: Chris@331: // std::cerr << "FeatureExtractionModelTransformer::run: blockFrame " Chris@320: // << blockFrame << ", endFrame " << endFrame << ", blockSize " Chris@350: // << blockSize << std::endl; Chris@320: Chris@320: long completion = Chris@350: (((blockFrame - contextStart) / stepSize) * 99) / Chris@557: (contextDuration / stepSize + 1); Chris@320: Chris@350: // channelCount is either m_input.getModel()->channelCount or 1 Chris@320: Chris@363: if (frequencyDomain) { Chris@363: for (size_t ch = 0; ch < channelCount; ++ch) { Chris@350: int column = (blockFrame - startFrame) / stepSize; Chris@556: fftModels[ch]->getValuesAt(column, reals, imaginaries); Chris@350: for (size_t i = 0; i <= blockSize/2; ++i) { Chris@556: buffers[ch][i*2] = reals[i]; Chris@556: buffers[ch][i*2+1] = imaginaries[i]; Chris@320: } Chris@678: error = fftModels[ch]->getError(); Chris@678: if (error != "") { Chris@678: std::cerr << "FeatureExtractionModelTransformer::run: Abandoning, error is " << error << std::endl; Chris@678: m_abandoned = true; Chris@678: m_message = error; Chris@678: } Chris@363: } Chris@363: } else { Chris@363: getFrames(channelCount, blockFrame, blockSize, buffers); Chris@320: } Chris@320: Chris@497: if (m_abandoned) break; Chris@497: Chris@320: Vamp::Plugin::FeatureSet features = m_plugin->process Chris@320: (buffers, Vamp::RealTime::frame2RealTime(blockFrame, sampleRate)); Chris@320: Chris@497: if (m_abandoned) break; Chris@497: Chris@320: for (size_t fi = 0; fi < features[m_outputFeatureNo].size(); ++fi) { Chris@320: Vamp::Plugin::Feature feature = Chris@320: features[m_outputFeatureNo][fi]; Chris@320: addFeature(blockFrame, feature); Chris@320: } Chris@320: Chris@320: if (blockFrame == contextStart || completion > prevCompletion) { Chris@320: setCompletion(completion); Chris@320: prevCompletion = completion; Chris@320: } Chris@320: Chris@350: blockFrame += stepSize; Chris@320: } Chris@320: Chris@497: if (!m_abandoned) { Chris@497: Vamp::Plugin::FeatureSet features = m_plugin->getRemainingFeatures(); Chris@320: Chris@497: for (size_t fi = 0; fi < features[m_outputFeatureNo].size(); ++fi) { Chris@497: Vamp::Plugin::Feature feature = Chris@497: features[m_outputFeatureNo][fi]; Chris@497: addFeature(blockFrame, feature); Chris@497: } Chris@497: } Chris@320: Chris@497: setCompletion(100); Chris@320: Chris@320: if (frequencyDomain) { Chris@320: for (size_t ch = 0; ch < channelCount; ++ch) { Chris@320: delete fftModels[ch]; Chris@320: } Chris@556: delete[] reals; Chris@556: delete[] imaginaries; Chris@320: } Chris@320: } Chris@320: Chris@320: void Chris@363: FeatureExtractionModelTransformer::getFrames(int channelCount, Chris@363: long startFrame, long size, Chris@363: float **buffers) Chris@320: { Chris@320: long offset = 0; Chris@320: Chris@320: if (startFrame < 0) { Chris@363: for (int c = 0; c < channelCount; ++c) { Chris@363: for (int i = 0; i < size && startFrame + i < 0; ++i) { Chris@363: buffers[c][i] = 0.0f; Chris@363: } Chris@320: } Chris@320: offset = -startFrame; Chris@320: size -= offset; Chris@320: if (size <= 0) return; Chris@320: startFrame = 0; Chris@320: } Chris@320: Chris@350: DenseTimeValueModel *input = getConformingInput(); Chris@350: if (!input) return; Chris@363: Chris@363: long got = 0; Chris@350: Chris@363: if (channelCount == 1) { Chris@363: Chris@363: got = input->getData(m_input.getChannel(), startFrame, size, Chris@363: buffers[0] + offset); Chris@363: Chris@363: if (m_input.getChannel() == -1 && input->getChannelCount() > 1) { Chris@363: // use mean instead of sum, as plugin input Chris@363: float cc = float(input->getChannelCount()); Chris@363: for (long i = 0; i < size; ++i) { Chris@363: buffers[0][i + offset] /= cc; Chris@363: } Chris@363: } Chris@363: Chris@363: } else { Chris@363: Chris@363: float **writebuf = buffers; Chris@363: if (offset > 0) { Chris@363: writebuf = new float *[channelCount]; Chris@363: for (int i = 0; i < channelCount; ++i) { Chris@363: writebuf[i] = buffers[i] + offset; Chris@363: } Chris@363: } Chris@363: Chris@363: got = input->getData(0, channelCount-1, startFrame, size, writebuf); Chris@363: Chris@363: if (writebuf != buffers) delete[] writebuf; Chris@363: } Chris@320: Chris@320: while (got < size) { Chris@363: for (int c = 0; c < channelCount; ++c) { Chris@363: buffers[c][got + offset] = 0.0; Chris@363: } Chris@320: ++got; Chris@320: } Chris@320: } Chris@320: Chris@320: void Chris@331: FeatureExtractionModelTransformer::addFeature(size_t blockFrame, Chris@320: const Vamp::Plugin::Feature &feature) Chris@320: { Chris@350: size_t inputRate = m_input.getModel()->getSampleRate(); Chris@320: Chris@331: // std::cerr << "FeatureExtractionModelTransformer::addFeature(" Chris@320: // << blockFrame << ")" << std::endl; Chris@320: Chris@320: int binCount = 1; Chris@320: if (m_descriptor->hasFixedBinCount) { Chris@320: binCount = m_descriptor->binCount; Chris@320: } Chris@320: Chris@320: size_t frame = blockFrame; Chris@320: Chris@320: if (m_descriptor->sampleType == Chris@320: Vamp::Plugin::OutputDescriptor::VariableSampleRate) { Chris@320: Chris@320: if (!feature.hasTimestamp) { Chris@320: std::cerr Chris@331: << "WARNING: FeatureExtractionModelTransformer::addFeature: " Chris@320: << "Feature has variable sample rate but no timestamp!" Chris@320: << std::endl; Chris@320: return; Chris@320: } else { Chris@320: frame = Vamp::RealTime::realTime2Frame(feature.timestamp, inputRate); Chris@320: } Chris@320: Chris@320: } else if (m_descriptor->sampleType == Chris@320: Vamp::Plugin::OutputDescriptor::FixedSampleRate) { Chris@320: Chris@320: if (feature.hasTimestamp) { Chris@320: //!!! warning: sampleRate may be non-integral Chris@320: frame = Vamp::RealTime::realTime2Frame(feature.timestamp, Chris@451: //!!! see comment above when setting up modelResolution and modelRate Chris@451: // lrintf(m_descriptor->sampleRate)); Chris@451: inputRate); Chris@320: } else { Chris@320: frame = m_output->getEndFrame(); Chris@320: } Chris@320: } Chris@320: Chris@441: // Rather than repeat the complicated tests from the constructor Chris@441: // to determine what sort of model we must be adding the features Chris@441: // to, we instead test what sort of model the constructor decided Chris@441: // to create. Chris@320: Chris@441: if (isOutput()) { Chris@441: Chris@441: SparseOneDimensionalModel *model = Chris@350: getConformingOutput(); Chris@320: if (!model) return; Chris@350: Chris@441: model->addPoint(SparseOneDimensionalModel::Point Chris@441: (frame, feature.label.c_str())); Chris@320: Chris@441: } else if (isOutput()) { Chris@320: Chris@350: SparseTimeValueModel *model = Chris@350: getConformingOutput(); Chris@320: if (!model) return; Chris@350: Chris@454: for (int i = 0; i < feature.values.size(); ++i) { Chris@454: Chris@454: float value = feature.values[i]; Chris@454: Chris@454: QString label = feature.label.c_str(); Chris@454: if (feature.values.size() > 1) { Chris@454: label = QString("[%1] %2").arg(i+1).arg(label); Chris@454: } Chris@454: Chris@454: model->addPoint(SparseTimeValueModel::Point(frame, value, label)); Chris@454: } Chris@320: Chris@441: } else if (isOutput() || isOutput()) { Chris@320: Chris@441: int index = 0; Chris@441: Chris@441: float value = 0.0; Chris@441: if (feature.values.size() > index) { Chris@441: value = feature.values[index++]; Chris@441: } Chris@320: Chris@320: float duration = 1; Chris@441: if (feature.hasDuration) { Chris@441: duration = Vamp::RealTime::realTime2Frame(feature.duration, inputRate); Chris@441: } else { Chris@441: if (feature.values.size() > index) { Chris@441: duration = feature.values[index++]; Chris@441: } Chris@441: } Chris@320: Chris@441: if (isOutput()) { Chris@320: Chris@441: float velocity = 100; Chris@441: if (feature.values.size() > index) { Chris@441: velocity = feature.values[index++]; Chris@441: } Chris@441: if (velocity < 0) velocity = 127; Chris@441: if (velocity > 127) velocity = 127; Chris@320: Chris@441: NoteModel *model = getConformingOutput(); Chris@441: if (!model) return; Chris@441: model->addPoint(NoteModel::Point(frame, value, // value is pitch Chris@441: lrintf(duration), Chris@441: velocity / 127.f, Chris@441: feature.label.c_str())); Chris@441: } else { Chris@441: RegionModel *model = getConformingOutput(); Chris@454: if (!model) return; Chris@454: Chris@474: if (feature.hasDuration && !feature.values.empty()) { Chris@454: Chris@454: for (int i = 0; i < feature.values.size(); ++i) { Chris@454: Chris@454: float value = feature.values[i]; Chris@454: Chris@454: QString label = feature.label.c_str(); Chris@454: if (feature.values.size() > 1) { Chris@454: label = QString("[%1] %2").arg(i+1).arg(label); Chris@454: } Chris@454: Chris@454: model->addPoint(RegionModel::Point(frame, value, Chris@454: lrintf(duration), Chris@454: label)); Chris@454: } Chris@454: } else { Chris@454: Chris@441: model->addPoint(RegionModel::Point(frame, value, Chris@441: lrintf(duration), Chris@441: feature.label.c_str())); Chris@454: } Chris@441: } Chris@320: Chris@441: } else if (isOutput()) { Chris@320: Chris@533: DenseThreeDimensionalModel::Column values = Chris@533: DenseThreeDimensionalModel::Column::fromStdVector(feature.values); Chris@320: Chris@320: EditableDenseThreeDimensionalModel *model = Chris@350: getConformingOutput(); Chris@320: if (!model) return; Chris@320: Chris@320: model->setColumn(frame / model->getResolution(), values); Chris@441: Chris@441: } else { Chris@441: std::cerr << "FeatureExtractionModelTransformer::addFeature: Unknown output model type!" << std::endl; Chris@320: } Chris@320: } Chris@320: Chris@320: void Chris@331: FeatureExtractionModelTransformer::setCompletion(int completion) Chris@320: { Chris@320: int binCount = 1; Chris@320: if (m_descriptor->hasFixedBinCount) { Chris@320: binCount = m_descriptor->binCount; Chris@320: } Chris@320: Chris@331: // std::cerr << "FeatureExtractionModelTransformer::setCompletion(" Chris@320: // << completion << ")" << std::endl; Chris@320: Chris@441: if (isOutput()) { Chris@320: Chris@350: SparseOneDimensionalModel *model = Chris@350: getConformingOutput(); Chris@320: if (!model) return; Chris@441: model->setCompletion(completion, true); Chris@320: Chris@441: } else if (isOutput()) { Chris@320: Chris@350: SparseTimeValueModel *model = Chris@350: getConformingOutput(); Chris@320: if (!model) return; Chris@441: model->setCompletion(completion, true); Chris@320: Chris@441: } else if (isOutput()) { Chris@320: Chris@441: NoteModel *model = getConformingOutput(); Chris@320: if (!model) return; Chris@441: model->setCompletion(completion, true); Chris@320: Chris@441: } else if (isOutput()) { Chris@441: Chris@441: RegionModel *model = getConformingOutput(); Chris@441: if (!model) return; Chris@441: model->setCompletion(completion, true); Chris@441: Chris@441: } else if (isOutput()) { Chris@320: Chris@320: EditableDenseThreeDimensionalModel *model = Chris@350: getConformingOutput(); Chris@320: if (!model) return; Chris@350: model->setCompletion(completion, true); //!!!m_context.updates); Chris@320: } Chris@320: } Chris@320: