gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: The Audio Features ontology gyorgyf@0: Revision: 1.1 gyorgyf@0: The Audio Features ontology gyorgyf@0: gyorgyf@0: This ontology expresses some common concepts gyorgyf@0: to represent automatically extracted features gyorgyf@0: from audio signals. Therefore, it mainly relies gyorgyf@0: on the Event ontology, in order to classify particular gyorgyf@0: parts of the timeline backing an audio signal. gyorgyf@0: gyorgyf@0: Programs outputting RDF according to this ontology should gyorgyf@0: also describe the ouputted document to express some information gyorgyf@0: about itself (estimated confidence, maintainer of the program, etc.) gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: $Date: 2008/06/23 10:24:13 $ gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Signal-level feature gyorgyf@0: gyorgyf@0: gyorgyf@0: A signal-like feature, holding dense data describing another signal. gyorgyf@0: Examples of signal features include chromagrams, spectrograms, onset detection functions etc. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Chromagram gyorgyf@0: gyorgyf@0: gyorgyf@0: A chromagram feature. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: A detection function. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Tempo detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: A tempo detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Onset detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: An onset detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Tonal change detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: A tonal change detection function gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Tonal content space gyorgyf@0: gyorgyf@0: gyorgyf@0: A 6-D tonal content space gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Amplitude gyorgyf@0: gyorgyf@0: gyorgyf@0: Result of an amplitude following process gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Spectral centroid gyorgyf@0: gyorgyf@0: gyorgyf@0: Spectral centroid gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Log-frequency spectral centroid gyorgyf@0: gyorgyf@0: gyorgyf@0: Log-frequency spectral centroid gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Linear-frequency spectral centroid gyorgyf@0: gyorgyf@0: gyorgyf@0: Log-frequency spectral centroid gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Zero-crossing counts gyorgyf@0: gyorgyf@0: gyorgyf@0: Zero-crossing counts gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: signal-level feature gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates an audio signal with a track-level signal feature. gyorgyf@0: eg. a spectrogram, a chromagram, an onset detection function. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: value gyorgyf@0: gyorgyf@0: Associates a signal resource as defined in the Music Ontology to a literal: its actual value. gyorgyf@0: For example, it can be used to link an onset detection function to a list of values. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: dimensions gyorgyf@0: gyorgyf@0: Associates a signal with its dimensions, eg. "12 3546". Equivalent to the mpeg7:dim attribute of the mpeg7:Raw gyorgyf@0: element. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Segment gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier for a temporal region corresponding to the output gyorgyf@0: of an automatic process---an artificial cognitive agent. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Structural Segment gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier trying to capture the notion of structure in an audio piece. gyorgyf@0: This classifier should be subsumed by more specific classifiers: speech/music gyorgyf@0: segmentation, structural music segmmentation (intro, verse, chorus, etc.). gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Point gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier for instants corresponding to the output of an automatic process---an gyorgyf@0: artificial cognitive agent (should be associated to a time:Instant---DL version). gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Speech gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier capturing the notion of an audio segment holding speech gyorgyf@0: content gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Laugh gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier for laugh content gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Text gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier allowing to associate some text to a segment gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Emotion segment gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier for emotional content gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Idiom segment gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier for recognized idiom (English with Irish accent, etc.) gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Person speaking gyorgyf@0: gyorgyf@0: A classifier associating a FOAF description to a particular segment gyorgyf@0: (to classify genre, recognized speaker, etc.) gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Music gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier capturing the notion of an audio segment holding music. gyorgyf@0: This classifier can be subsumed with more specific classifiers. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Music structural segment gyorgyf@0: gyorgyf@0: gyorgyf@0: Classifier capturing the notion of chorus, verse, intro, bridge, phrase, etc. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: A classifier for chords. Equivalent concept as the one gyorgyf@0: in the Chord ontology. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: A classifier for keys. gyorgyf@0: In case of a "clean cut", instances of such events gyorgyf@0: should have one factor: the detected key (perhaps using the gyorgyf@0: key ontology at http://purl.org/NET/c4dm/keys.owl). gyorgyf@0: In other cases, we can put several keys as a factor, maybe with different confidence gyorgyf@0: factors, using event decomposition. gyorgyf@0: gyorgyf@0: gyorgyf@0: Key event gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: A classifier for tonics. gyorgyf@0: In case of a "clean cut", instances of such events have one gyorgyf@0: factor. In other cases, this event can have several factors, each associated gyorgyf@0: with a particular confidence using event decomposition. gyorgyf@0: gyorgyf@0: gyorgyf@0: Tonic event gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: A classifier for a major mode region. gyorgyf@0: In case of a "clean cut", instances of such events have one gyorgyf@0: factor. In other cases, this event can have several factors, each associated gyorgyf@0: with a particular confidence using event decomposition. gyorgyf@0: gyorgyf@0: gyorgyf@0: Major segment gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: A classifier for a minor mode region. gyorgyf@0: In case of a "clean cut", instances of such events have one gyorgyf@0: factor. In other cases, this event can have several factors, each associated gyorgyf@0: with a particular confidence using event decomposition. gyorgyf@0: gyorgyf@0: gyorgyf@0: Minor segment gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Event holding a loudness value gyorgyf@0: gyorgyf@0: Loudness event gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Event holding a pitch value (for example coming from a monophonic transcription process) gyorgyf@0: gyorgyf@0: Pitch event gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Pitch event gyorgyf@0: Associate a point to a particular pitch gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Event holding a tempo value (120bpm...) gyorgyf@0: gyorgyf@0: Tempo event gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: Ornament event gyorgyf@0: Classifying a temporal region holding a musical ornament gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: Time signature gyorgyf@0: Classifying a temporal region with a particular time signature (what? there is something else than 4/4?? :-) gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Onset gyorgyf@0: gyorgyf@0: gyorgyf@0: A classifier corresponding to the output of an onset detection process. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Pitched onset gyorgyf@0: gyorgyf@0: A pitched onset gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Percussive onset gyorgyf@0: gyorgyf@0: A percussive onset gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Beat event gyorgyf@0: A beat event (instantaneous) gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Key change event gyorgyf@0: A key change event. The factor of such an event captures the key that holds after that event. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Tonic change event gyorgyf@0: A tonic change event. The factors of such events include the tonic that holds after the event. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Mode change event gyorgyf@0: A mode change event. The factors of such events include the mode that holds after the event. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Tonal change event gyorgyf@0: A tonal change event. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Zero crossing gyorgyf@0: Classifier for a zero-crossing point gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Idiom gyorgyf@0: gyorgyf@0: Idiom (English with Irish accent, Austrian German, etc.) gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: English idiom gyorgyf@0: gyorgyf@0: English idiom gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Standard British English gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Standard US English gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: English with an Irish accent gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: English with a Scottish accent gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: German idiom gyorgyf@0: gyorgyf@0: German idiom gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Austrian German gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Swiss German gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Standard German gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Hungarian idiom gyorgyf@0: Hungarian idiom gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: Standard Hungarian gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: Relates a Text segment (classifying a time interval that can gyorgyf@0: be associated to some text) to a text string or other literals (number, etc.) gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates a segment which classify an idiom (English with Irish accent, etc.) to an actual idiom gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates a segment classified as holding speech content to a FOAF gyorgyf@0: profile (maybe holding information about genre, recognized speaker URI, etc.) gyorgyf@0: gyorgyf@0: person gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates an "emotional intensity" value to a gyorgyf@0: segment detected as being "emotional" gyorgyf@0: gyorgyf@0: emotional intensity gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: key gyorgyf@0: Associates a key event to the corresponding key gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: new key gyorgyf@0: Associates a key change event to the new key, holding after the change gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: tonic gyorgyf@0: Associates a tonic event with the corresponding tonic gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: new tonic gyorgyf@0: Tonic that holds after the tonic change event gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: new mode gyorgyf@0: Mode that holds after the mode change event gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates a segment classifying a feature to the actual feature---we should use mpeg7 sort-of datatypes here gyorgyf@0: gyorgyf@0: feature gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: tempo gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates a tempo event to the corresponding tempo value. gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: pitch gyorgyf@0: gyorgyf@0: gyorgyf@0: Associates a pitch event to the corresponding pitch gyorgyf@0: gyorgyf@0: gyorgyf@0: gyorgyf@0: testing gyorgyf@0: gyorgyf@0: gyorgyf@0: A really generic property, allowing to associate a confidence to a document or to a particular gyorgyf@0: resource (such as an automatically detected segment) gyorgyf@0: gyorgyf@0: confidence gyorgyf@0: gyorgyf@0: gyorgyf@0: