auditok: tests/test_io.py annotate

annotate tests/test_io.py @ 386:059599823c34

Merge branch 'master' of https://github.com/amsehili/auditok

author	www-data <www-data@c4dm-xenserv-virt2.eecs.qmul.ac.uk>
date	Tue, 02 Mar 2021 19:17:59 +0000
parents	9f17aa9a4018
children	323d59b404a2

rev	line source
amine@106	1 import os
amine@106	2 import sys
amine@106	3 import math
amine@107	4 from array import array
amine@133	5 from tempfile import NamedTemporaryFile, TemporaryDirectory
amine@110	6 import filecmp
amine@337	7 import unittest
amine@108	8 from unittest import TestCase
amine@313	9 from unittest.mock import patch, Mock
amine@108	10 from genty import genty, genty_dataset
amine@157	11 from test_util import _sample_generator, _generate_pure_tone, PURE_TONE_DICT
amine@321	12 from auditok.signal import FORMAT
amine@110	13 from auditok.io import (
amine@121	14 AudioIOError,
amine@110	15 AudioParameterError,
amine@126	16 BufferAudioSource,
amine@162	17 RawAudioSource,
amine@162	18 WaveAudioSource,
amine@190	19 StdinAudioSource,
amine@110	20 check_audio_data,
amine@143	21 _guess_audio_format,
amine@128	22 _get_audio_parameters,
amine@126	23 _load_raw,
amine@129	24 _load_wave,
amine@131	25 _load_with_pydub,
amine@190	26 get_audio_source,
amine@120	27 from_file,
amine@111	28 _save_raw,
amine@110	29 _save_wave,
amine@141	30 _save_with_pydub,
amine@135	31 to_file,
amine@110	32 )
amine@106	33
amine@120	34 AUDIO_PARAMS_SHORT = {"sr": 16000, "sw": 2, "ch": 1}
amine@106	35
amine@106	36
amine@108	37 @genty
amine@108	38 class TestIO(TestCase):
amine@108	39 @genty_dataset(
amine@108	40 valid_mono=(b"\0" * 113, 1, 1),
amine@108	41 valid_stereo=(b"\0" * 160, 1, 2),
amine@108	42 invalid_mono_sw_2=(b"\0" * 113, 2, 1, False),
amine@108	43 invalid_stereo_sw_1=(b"\0" * 113, 1, 2, False),
amine@108	44 invalid_stereo_sw_2=(b"\0" * 158, 2, 2, False),
amine@108	45 )
amine@108	46 def test_check_audio_data(self, data, sample_width, channels, valid=True):
amine@108	47
amine@108	48 if not valid:
amine@108	49 with self.assertRaises(AudioParameterError):
amine@108	50 check_audio_data(data, sample_width, channels)
amine@108	51 else:
amine@108	52 self.assertIsNone(check_audio_data(data, sample_width, channels))
amine@110	53
amine@110	54 @genty_dataset(
amine@143	55 extention_and_format_same=("wav", "filename.wav", "wav"),
amine@143	56 extention_and_format_different=("wav", "filename.mp3", "wav"),
amine@143	57 extention_no_format=(None, "filename.wav", "wav"),
amine@143	58 format_no_extension=("wav", "filename", "wav"),
amine@143	59 no_format_no_extension=(None, "filename", None),
amine@289	60 wave_as_wav=("wave", "filename", "wav"),
amine@289	61 wave_as_wav_extension=(None, "filename.wave", "wav"),
amine@143	62 )
amine@143	63 def test_guess_audio_format(self, fmt, filename, expected):
amine@143	64 result = _guess_audio_format(fmt, filename)
amine@143	65 self.assertEqual(result, expected)
amine@143	66
amine@240	67 def test_get_audio_parameters_short_params(self):
amine@240	68 expected = (8000, 2, 1)
amine@240	69 params = dict(zip(("sr", "sw", "ch"), expected))
amine@145	70 result = _get_audio_parameters(params)
amine@145	71 self.assertEqual(result, expected)
amine@145	72
amine@240	73 def test_get_audio_parameters_long_params(self):
amine@240	74 expected = (8000, 2, 1)
amine@209	75 params = dict(
amine@209	76 zip(
amine@209	77 ("sampling_rate", "sample_width", "channels", "use_channel"),
amine@240	78 expected,
amine@209	79 )
amine@209	80 )
amine@145	81 result = _get_audio_parameters(params)
amine@145	82 self.assertEqual(result, expected)
amine@145	83
amine@240	84 def test_get_audio_parameters_long_params_shadow_short_ones(self):
amine@240	85 expected = (8000, 2, 1)
amine@209	86 params = dict(
amine@240	87 zip(("sampling_rate", "sample_width", "channels"), expected)
amine@209	88 )
amine@240	89 params.update(dict(zip(("sr", "sw", "ch"), "xxx")))
amine@145	90 result = _get_audio_parameters(params)
amine@145	91 self.assertEqual(result, expected)
amine@145	92
amine@145	93 @genty_dataset(
amine@240	94 str_sampling_rate=(("x", 2, 1),),
amine@240	95 negative_sampling_rate=((-8000, 2, 1),),
amine@240	96 str_sample_width=((8000, "x", 1),),
amine@240	97 negative_sample_width=((8000, -2, 1),),
amine@240	98 str_channels=((8000, 2, "x"),),
amine@240	99 negative_channels=((8000, 2, -1),),
amine@146	100 )
amine@146	101 def test_get_audio_parameters_invalid(self, values):
amine@209	102 params = dict(
amine@313	103 zip(("sampling_rate", "sample_width", "channels"), values)
amine@209	104 )
amine@146	105 with self.assertRaises(AudioParameterError):
amine@146	106 _get_audio_parameters(params)
amine@146	107
amine@146	108 @genty_dataset(
amine@120	109 raw_with_audio_format=(
amine@120	110 "audio",
amine@120	111 "raw",
amine@120	112 "_load_raw",
amine@120	113 AUDIO_PARAMS_SHORT,
amine@120	114 ),
amine@120	115 raw_with_extension=(
amine@120	116 "audio.raw",
amine@120	117 None,
amine@120	118 "_load_raw",
amine@120	119 AUDIO_PARAMS_SHORT,
amine@120	120 ),
amine@120	121 wave_with_audio_format=("audio", "wave", "_load_wave"),
amine@120	122 wav_with_audio_format=("audio", "wave", "_load_wave"),
amine@120	123 wav_with_extension=("audio.wav", None, "_load_wave"),
amine@120	124 format_and_extension_both_given=("audio.dat", "wav", "_load_wave"),
amine@120	125 format_and_extension_both_given_b=("audio.raw", "wave", "_load_wave"),
amine@120	126 no_format_nor_extension=("audio", None, "_load_with_pydub"),
amine@120	127 other_formats_ogg=("audio.ogg", None, "_load_with_pydub"),
amine@120	128 other_formats_webm=("audio", "webm", "_load_with_pydub"),
amine@120	129 )
amine@120	130 def test_from_file(
amine@120	131 self, filename, audio_format, funtion_name, kwargs=None
amine@120	132 ):
amine@120	133 funtion_name = "auditok.io." + funtion_name
amine@120	134 if kwargs is None:
amine@120	135 kwargs = {}
amine@120	136 with patch(funtion_name) as patch_function:
amine@120	137 from_file(filename, audio_format, **kwargs)
amine@120	138 self.assertTrue(patch_function.called)
amine@120	139
amine@190	140 def test_from_file_large_file_raw(self,):
amine@162	141 filename = "tests/data/test_16KHZ_mono_400Hz.raw"
amine@190	142 audio_source = from_file(
amine@190	143 filename,
amine@190	144 large_file=True,
amine@190	145 sampling_rate=16000,
amine@190	146 sample_width=2,
amine@190	147 channels=1,
amine@190	148 )
amine@162	149 self.assertIsInstance(audio_source, RawAudioSource)
amine@162	150
amine@190	151 def test_from_file_large_file_wave(self,):
amine@162	152 filename = "tests/data/test_16KHZ_mono_400Hz.wav"
amine@162	153 audio_source = from_file(filename, large_file=True)
amine@162	154 self.assertIsInstance(audio_source, WaveAudioSource)
amine@163	155
amine@190	156 def test_from_file_large_file_compressed(self,):
amine@163	157 filename = "tests/data/test_16KHZ_mono_400Hz.ogg"
amine@163	158 with self.assertRaises(AudioIOError):
amine@163	159 from_file(filename, large_file=True)
amine@162	160
amine@137	161 @genty_dataset(
amine@137	162 missing_sampling_rate=("sr",),
amine@137	163 missing_sample_width=("sw",),
amine@137	164 missing_channels=("ch",),
amine@137	165 )
amine@137	166 def test_from_file_missing_audio_param(self, missing_param):
amine@137	167 with self.assertRaises(AudioParameterError):
amine@137	168 params = AUDIO_PARAMS_SHORT.copy()
amine@137	169 del params[missing_param]
amine@137	170 from_file("audio", audio_format="raw", **params)
amine@137	171
amine@121	172 def test_from_file_no_pydub(self):
amine@121	173 with patch("auditok.io._WITH_PYDUB", False):
amine@121	174 with self.assertRaises(AudioIOError):
amine@121	175 from_file("audio", "mp3")
amine@121	176
amine@124	177 @patch("auditok.io._WITH_PYDUB", True)
amine@124	178 @patch("auditok.io.BufferAudioSource")
amine@124	179 @genty_dataset(
amine@240	180 ogg_first_channel=("ogg", "from_ogg"),
amine@240	181 ogg_second_channel=("ogg", "from_ogg"),
amine@240	182 ogg_mix=("ogg", "from_ogg"),
amine@240	183 ogg_default=("ogg", "from_ogg"),
amine@240	184 mp3_left_channel=("mp3", "from_mp3"),
amine@240	185 mp3_right_channel=("mp3", "from_mp3"),
amine@240	186 flac_first_channel=("flac", "from_file"),
amine@240	187 flac_second_channel=("flac", "from_file"),
amine@240	188 flv_left_channel=("flv", "from_flv"),
amine@240	189 webm_right_channel=("webm", "from_file"),
amine@124	190 )
amine@124	191 def test_from_file_multichannel_audio_compressed(
amine@125	192 self, audio_format, function, *mocks
amine@125	193 ):
amine@125	194 filename = "audio.{}".format(audio_format)
amine@125	195 segment_mock = Mock()
amine@125	196 segment_mock.sample_width = 2
amine@125	197 segment_mock.channels = 2
amine@125	198 segment_mock._data = b"abcd"
amine@313	199 with patch("auditok.io.AudioSegment.{}".format(function)) as open_func:
amine@240	200 open_func.return_value = segment_mock
amine@240	201 from_file(filename)
amine@240	202 self.assertTrue(open_func.called)
amine@240	203
amine@123	204 @genty_dataset(
amine@240	205 mono=("mono_400", (400,)),
amine@240	206 three_channel=("3channel_400-800-1600", (400, 800, 1600)),
amine@240	207 mono_large_file=("mono_400", (400,), True),
amine@313	208 three_channel_large_file=(
amine@313	209 "3channel_400-800-1600",
amine@313	210 (400, 800, 1600),
amine@313	211 True,
amine@313	212 ),
amine@126	213 )
amine@240	214 def test_load_raw(self, file_id, frequencies, large_file=False):
amine@240	215 filename = "tests/data/test_16KHZ_{}Hz.raw".format(file_id)
amine@313	216 audio_source = _load_raw(
amine@313	217 filename, 16000, 2, len(frequencies), large_file=large_file
amine@313	218 )
amine@240	219 audio_source.open()
amine@240	220 data = audio_source.read(-1)
amine@240	221 audio_source.close()
amine@240	222 expected_class = RawAudioSource if large_file else BufferAudioSource
amine@240	223 self.assertIsInstance(audio_source, expected_class)
amine@126	224 self.assertEqual(audio_source.sampling_rate, 16000)
amine@126	225 self.assertEqual(audio_source.sample_width, 2)
amine@240	226 self.assertEqual(audio_source.channels, len(frequencies))
amine@240	227 mono_channels = [PURE_TONE_DICT[freq] for freq in frequencies]
amine@321	228 fmt = FORMAT[audio_source.sample_width]
amine@313	229 expected = array(fmt, _sample_generator(*mono_channels)).tobytes()
amine@126	230 self.assertEqual(data, expected)
amine@126	231
amine@126	232 @genty_dataset(
amine@128	233 missing_sampling_rate=("sr",),
amine@128	234 missing_sample_width=("sw",),
amine@128	235 missing_channels=("ch",),
amine@128	236 )
amine@128	237 def test_load_raw_missing_audio_param(self, missing_param):
amine@128	238 with self.assertRaises(AudioParameterError):
amine@128	239 params = AUDIO_PARAMS_SHORT.copy()
amine@128	240 del params[missing_param]
amine@128	241 srate, swidth, channels, _ = _get_audio_parameters(params)
amine@128	242 _load_raw("audio", srate, swidth, channels)
amine@128	243
amine@128	244 @genty_dataset(
amine@240	245 mono=("mono_400", (400,)),
amine@240	246 three_channel=("3channel_400-800-1600", (400, 800, 1600)),
amine@240	247 mono_large_file=("mono_400", (400,), True),
amine@313	248 three_channel_large_file=(
amine@313	249 "3channel_400-800-1600",
amine@313	250 (400, 800, 1600),
amine@313	251 True,
amine@313	252 ),
amine@129	253 )
amine@240	254 def test_load_wave(self, file_id, frequencies, large_file=False):
amine@240	255 filename = "tests/data/test_16KHZ_{}Hz.wav".format(file_id)
amine@240	256 audio_source = _load_wave(filename, large_file=large_file)
amine@240	257 audio_source.open()
amine@240	258 data = audio_source.read(-1)
amine@240	259 audio_source.close()
amine@240	260 expected_class = WaveAudioSource if large_file else BufferAudioSource
amine@240	261 self.assertIsInstance(audio_source, expected_class)
amine@129	262 self.assertEqual(audio_source.sampling_rate, 16000)
amine@129	263 self.assertEqual(audio_source.sample_width, 2)
amine@240	264 self.assertEqual(audio_source.channels, len(frequencies))
amine@240	265 mono_channels = [PURE_TONE_DICT[freq] for freq in frequencies]
amine@321	266 fmt = FORMAT[audio_source.sample_width]
amine@313	267 expected = array(fmt, _sample_generator(*mono_channels)).tobytes()
amine@129	268 self.assertEqual(data, expected)
amine@129	269
amine@131	270 @patch("auditok.io._WITH_PYDUB", True)
amine@131	271 @patch("auditok.io.BufferAudioSource")
amine@131	272 @genty_dataset(
amine@240	273 ogg_default_first_channel=("ogg", 2, "from_ogg"),
amine@240	274 ogg_first_channel=("ogg", 1, "from_ogg"),
amine@240	275 ogg_second_channel=("ogg", 2, "from_ogg"),
amine@240	276 ogg_mix_channels=("ogg", 3, "from_ogg"),
amine@240	277 mp3_left_channel=("mp3", 1, "from_mp3"),
amine@240	278 mp3_right_channel=("mp3", 2, "from_mp3"),
amine@240	279 mp3_mix_channels=("mp3", 3, "from_mp3"),
amine@240	280 flac_first_channel=("flac", 2, "from_file"),
amine@240	281 flac_second_channel=("flac", 2, "from_file"),
amine@240	282 flv_left_channel=("flv", 1, "from_flv"),
amine@240	283 webm_right_channel=("webm", 2, "from_file"),
amine@240	284 webm_mix_channels=("webm", 4, "from_file"),
amine@131	285 )
amine@313	286 def test_load_with_pydub(self, audio_format, channels, function, *mocks):
amine@131	287 filename = "audio.{}".format(audio_format)
amine@131	288 segment_mock = Mock()
amine@131	289 segment_mock.sample_width = 2
amine@131	290 segment_mock.channels = channels
amine@131	291 segment_mock._data = b"abcdefgh"
amine@313	292 with patch("auditok.io.AudioSegment.{}".format(function)) as open_func:
amine@240	293 open_func.return_value = segment_mock
amine@240	294 _load_with_pydub(filename, audio_format)
amine@240	295 self.assertTrue(open_func.called)
amine@240	296
amine@130	297 @genty_dataset(
amine@132	298 mono=("mono_400Hz.raw", (400,)),
amine@132	299 three_channel=("3channel_400-800-1600Hz.raw", (400, 800, 1600)),
amine@132	300 )
amine@132	301 def test_save_raw(self, filename, frequencies):
amine@132	302 filename = "tests/data/test_16KHZ_{}".format(filename)
amine@132	303 sample_width = 2
amine@321	304 fmt = FORMAT[sample_width]
amine@132	305 mono_channels = [PURE_TONE_DICT[freq] for freq in frequencies]
amine@313	306 data = array(fmt, _sample_generator(*mono_channels)).tobytes()
amine@132	307 tmpfile = NamedTemporaryFile()
amine@136	308 _save_raw(data, tmpfile.name)
amine@132	309 self.assertTrue(filecmp.cmp(tmpfile.name, filename, shallow=False))
amine@132	310
amine@132	311 @genty_dataset(
amine@110	312 mono=("mono_400Hz.wav", (400,)),
amine@110	313 three_channel=("3channel_400-800-1600Hz.wav", (400, 800, 1600)),
amine@110	314 )
amine@110	315 def test_save_wave(self, filename, frequencies):
amine@110	316 filename = "tests/data/test_16KHZ_{}".format(filename)
amine@110	317 sampling_rate = 16000
amine@110	318 sample_width = 2
amine@110	319 channels = len(frequencies)
amine@321	320 fmt = FORMAT[sample_width]
amine@110	321 mono_channels = [PURE_TONE_DICT[freq] for freq in frequencies]
amine@313	322 data = array(fmt, _sample_generator(*mono_channels)).tobytes()
amine@110	323 tmpfile = NamedTemporaryFile()
amine@136	324 _save_wave(data, tmpfile.name, sampling_rate, sample_width, channels)
amine@110	325 self.assertTrue(filecmp.cmp(tmpfile.name, filename, shallow=False))
amine@132	326
amine@132	327 @genty_dataset(
amine@132	328 missing_sampling_rate=("sr",),
amine@132	329 missing_sample_width=("sw",),
amine@132	330 missing_channels=("ch",),
amine@132	331 )
amine@132	332 def test_save_wave_missing_audio_param(self, missing_param):
amine@132	333 with self.assertRaises(AudioParameterError):
amine@132	334 params = AUDIO_PARAMS_SHORT.copy()
amine@132	335 del params[missing_param]
amine@132	336 srate, swidth, channels, _ = _get_audio_parameters(params)
amine@136	337 _save_wave(b"\0\0", "audio", srate, swidth, channels)
amine@133	338
amine@141	339 def test_save_with_pydub(self):
amine@141	340 with patch("auditok.io.AudioSegment.export") as export:
amine@142	341 tmpdir = TemporaryDirectory()
amine@142	342 filename = os.path.join(tmpdir.name, "audio.ogg")
amine@142	343 _save_with_pydub(b"\0\0", filename, "ogg", 16000, 2, 1)
amine@141	344 self.assertTrue(export.called)
amine@142	345 tmpdir.cleanup()
amine@141	346
amine@133	347 @genty_dataset(
amine@133	348 raw_with_audio_format=("audio", "raw"),
amine@133	349 raw_with_extension=("audio.raw", None),
amine@133	350 raw_with_audio_format_and_extension=("audio.mp3", "raw"),
amine@133	351 raw_no_audio_format_nor_extension=("audio", None),
amine@133	352 )
amine@133	353 def test_to_file_raw(self, filename, audio_format):
amine@133	354 exp_filename = "tests/data/test_16KHZ_mono_400Hz.raw"
amine@133	355 tmpdir = TemporaryDirectory()
amine@133	356 filename = os.path.join(tmpdir.name, filename)
amine@313	357 data = PURE_TONE_DICT[400].tobytes()
amine@135	358 to_file(data, filename, audio_format=audio_format)
amine@133	359 self.assertTrue(filecmp.cmp(filename, exp_filename, shallow=False))
amine@133	360 tmpdir.cleanup()
amine@134	361
amine@134	362 @genty_dataset(
amine@134	363 wav_with_audio_format=("audio", "wav"),
amine@134	364 wav_with_extension=("audio.wav", None),
amine@134	365 wav_with_audio_format_and_extension=("audio.mp3", "wav"),
amine@134	366 wave_with_audio_format=("audio", "wave"),
amine@134	367 wave_with_extension=("audio.wave", None),
amine@134	368 wave_with_audio_format_and_extension=("audio.mp3", "wave"),
amine@134	369 )
amine@135	370 def test_to_file_wave(self, filename, audio_format):
amine@134	371 exp_filename = "tests/data/test_16KHZ_mono_400Hz.wav"
amine@134	372 tmpdir = TemporaryDirectory()
amine@134	373 filename = os.path.join(tmpdir.name, filename)
amine@313	374 data = PURE_TONE_DICT[400].tobytes()
amine@135	375 to_file(
amine@135	376 data,
amine@135	377 filename,
amine@135	378 audio_format=audio_format,
amine@135	379 sampling_rate=16000,
amine@135	380 sample_width=2,
amine@135	381 channels=1,
amine@134	382 )
amine@134	383 self.assertTrue(filecmp.cmp(filename, exp_filename, shallow=False))
amine@134	384 tmpdir.cleanup()
amine@138	385
amine@138	386 @genty_dataset(
amine@138	387 missing_sampling_rate=("sr",),
amine@138	388 missing_sample_width=("sw",),
amine@138	389 missing_channels=("ch",),
amine@138	390 )
amine@138	391 def test_to_file_missing_audio_param(self, missing_param):
amine@138	392 params = AUDIO_PARAMS_SHORT.copy()
amine@138	393 del params[missing_param]
amine@138	394 with self.assertRaises(AudioParameterError):
amine@138	395 to_file(b"\0\0", "audio", audio_format="wav", **params)
amine@138	396 with self.assertRaises(AudioParameterError):
amine@138	397 to_file(b"\0\0", "audio", audio_format="mp3", **params)
amine@139	398
amine@139	399 def test_to_file_no_pydub(self):
amine@139	400 with patch("auditok.io._WITH_PYDUB", False):
amine@139	401 with self.assertRaises(AudioIOError):
amine@139	402 to_file("audio", b"", "mp3")
amine@140	403
amine@140	404 @patch("auditok.io._WITH_PYDUB", True)
amine@140	405 @genty_dataset(
amine@140	406 ogg_with_extension=("audio.ogg", None),
amine@140	407 ogg_with_audio_format=("audio", "ogg"),
amine@140	408 ogg_format_with_wrong_extension=("audio.wav", "ogg"),
amine@140	409 )
amine@140	410 def test_to_file_compressed(self, filename, audio_format, *mocks):
amine@140	411 with patch("auditok.io.AudioSegment.export") as export:
amine@142	412 tmpdir = TemporaryDirectory()
amine@142	413 filename = os.path.join(tmpdir.name, filename)
amine@140	414 to_file(b"\0\0", filename, audio_format, **AUDIO_PARAMS_SHORT)
amine@140	415 self.assertTrue(export.called)
amine@142	416 tmpdir.cleanup()
amine@190	417
amine@190	418 @genty_dataset(
amine@190	419 string_wave=(
amine@190	420 "tests/data/test_16KHZ_mono_400Hz.wav",
amine@190	421 BufferAudioSource,
amine@190	422 ),
amine@190	423 string_wave_large_file=(
amine@190	424 "tests/data/test_16KHZ_mono_400Hz.wav",
amine@190	425 WaveAudioSource,
amine@190	426 {"large_file": True},
amine@190	427 ),
amine@190	428 stdin=("-", StdinAudioSource),
amine@190	429 string_raw=("tests/data/test_16KHZ_mono_400Hz.raw", BufferAudioSource),
amine@190	430 string_raw_large_file=(
amine@190	431 "tests/data/test_16KHZ_mono_400Hz.raw",
amine@190	432 RawAudioSource,
amine@190	433 {"large_file": True},
amine@190	434 ),
amine@190	435 bytes_=(b"0" * 8000, BufferAudioSource),
amine@190	436 )
amine@190	437 def test_get_audio_source(self, input, expected_type, extra_args=None):
amine@190	438 kwargs = {"sampling_rate": 16000, "sample_width": 2, "channels": 1}
amine@190	439 if extra_args is not None:
amine@190	440 kwargs.update(extra_args)
amine@190	441 audio_source = get_audio_source(input, **kwargs)
amine@313	442 self.assertIsInstance(audio_source, expected_type)
amine@337	443
amine@337	444
amine@337	445 if __name__ == "__main__":
amine@337	446 unittest.main()

Mercurial > hg > auditok

annotate tests/test_io.py @ 386:059599823c34