pyin: PYIN.cpp comparison

comparison PYIN.cpp @ 108:ae827f6c46c8 notes_refinement

introduced a variable for minimum note length

author	matthiasm
date	Mon, 26 Jan 2015 15:07:05 +0000
parents	314c2d56625d
children

comparison

equal deleted inserted replaced

-:314c2d56625d
+:ae827f6c46c8
 m_oCandidateSalience(0),
 m_oSmoothedPitchTrack(0),
 m_oNotes(0),
 m_threshDistr(2.0f),
 m_outputUnvoiced(0.0f),
-m_onsetSensitivity(0.0),
+m_onsetSensitivity(0.6f),
+m_pruneThresh(0.07f),
 m_pitchProb(0),
 m_timestamp(0),
 m_level(0)
 {
 }
 d.name = "Onset sensitivity";
 d.description = "Adds additional note onsets when RMS increases.";
 d.unit = "";
 d.minValue = 0.0f;
 d.maxValue = 1.0f;
-d.defaultValue = 0.0f;
+d.defaultValue = 0.5f;
+d.isQuantized = false;
+list.push_back(d);
+d.identifier = "prunethresh";
+d.valueNames.clear();
+d.name = "Duration pruning threshold.";
+d.description = "Prune notes that are shorter than this value.";
+d.unit = "";
+d.minValue = 0.0f;
+d.maxValue = 0.2f;
+d.defaultValue = 0.05f;
 d.isQuantized = false;
 list.push_back(d);
 return list;
 }
 return m_outputUnvoiced;
 }
 if (identifier == "onsetsensitivity") {
 return m_onsetSensitivity;
 }
+if (identifier == "prunethresh") {
+return m_pruneThresh;
+}
 return 0.f;
 }
 void
 PYIN::setParameter(string identifier, float value)
 m_outputUnvoiced = value;
 }
 if (identifier == "onsetsensitivity")
 {
 m_onsetSensitivity = value;
+}
+if (identifier == "prunethresh")
+{
+m_pruneThresh = value;
 }
 }
 PYIN::ProgramList
 PYIN::getPrograms() const
 int onsetFrame = 0;
 bool isVoiced = 0;
 bool oldIsVoiced = 0;
 size_t nFrame = m_pitchProb.size();
+float minNoteFrames = (m_inputSampleRate*m_pruneThresh) / m_stepSize;
 std::vector<float> notePitchTrack; // collects pitches for one note at a time
 for (size_t iFrame = 0; iFrame < nFrame; ++iFrame)
 {
 isVoiced = mnOut[iFrame].noteState < 3
 && smoothedPitch[iFrame].size() > 0
 && (iFrame >= nFrame-2
 || ((m_level[iFrame]/m_level[iFrame+2]) > m_onsetSensitivity));
-// std::cerr << m_level[iFrame]/m_level[iFrame-1] << std::endl;
+// std::cerr << m_level[iFrame]/m_level[iFrame-1] << " " << isVoiced << std::endl;
 if (isVoiced && iFrame != nFrame-1)
 {
 if (oldIsVoiced == 0) // beginning of a note
 {
 onsetFrame = iFrame;
-notePitchTrack.clear();
 }
 float pitch = smoothedPitch[iFrame][0].first;
 notePitchTrack.push_back(pitch); // add to the note's pitch track
 } else { // not currently voiced
-if (oldIsVoiced == 1 && notePitchTrack.size() > 17) // end of note
+if (oldIsVoiced == 1) // end of note
 {
-std::sort(notePitchTrack.begin(), notePitchTrack.end());
+// std::cerr << notePitchTrack.size() << " " << minNoteFrames << std::endl;
-float medianPitch = notePitchTrack[notePitchTrack.size()/2];
+if (notePitchTrack.size() >= minNoteFrames)
-float medianFreq = std::pow(2,(medianPitch - 69) / 12) * 440;
+{
-f.values.clear();
+std::sort(notePitchTrack.begin(), notePitchTrack.end());
-f.values.push_back(medianFreq);
+float medianPitch = notePitchTrack[notePitchTrack.size()/2];
-f.timestamp = m_timestamp[onsetFrame];
+float medianFreq = std::pow(2,(medianPitch - 69) / 12) * 440;
-f.duration = m_timestamp[iFrame] - m_timestamp[onsetFrame];
+f.values.clear();
-fs[m_oNotes].push_back(f);
+f.values.push_back(medianFreq);
+f.timestamp = m_timestamp[onsetFrame];
+f.duration = m_timestamp[iFrame] - m_timestamp[onsetFrame];
+fs[m_oNotes].push_back(f);
+}
+notePitchTrack.clear();
 }
 }
 oldIsVoiced = isVoiced;
 }
 return fs;

Mercurial > hg > pyin

comparison PYIN.cpp @ 108:ae827f6c46c8 notes_refinement