sv-dependency-builds: src/opus-1.3/silk/enc

annotate src/opus-1.3/silk/enc_API.c @ 169:223a55898ab9 tip default

Add null config files

author	Chris Cannam <cannam@all-day-breakfast.com>
date	Mon, 02 Mar 2020 14:03:47 +0000
parents	4664ac0c1032
children

rev	line source
cannam@154	1 /***********************************************************************
cannam@154	2 Copyright (c) 2006-2011, Skype Limited. All rights reserved.
cannam@154	3 Redistribution and use in source and binary forms, with or without
cannam@154	4 modification, are permitted provided that the following conditions
cannam@154	5 are met:
cannam@154	6 - Redistributions of source code must retain the above copyright notice,
cannam@154	7 this list of conditions and the following disclaimer.
cannam@154	8 - Redistributions in binary form must reproduce the above copyright
cannam@154	9 notice, this list of conditions and the following disclaimer in the
cannam@154	10 documentation and/or other materials provided with the distribution.
cannam@154	11 - Neither the name of Internet Society, IETF or IETF Trust, nor the
cannam@154	12 names of specific contributors, may be used to endorse or promote
cannam@154	13 products derived from this software without specific prior written
cannam@154	14 permission.
cannam@154	15 THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
cannam@154	16 AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
cannam@154	17 IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
cannam@154	18 ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
cannam@154	19 LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
cannam@154	20 CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
cannam@154	21 SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
cannam@154	22 INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
cannam@154	23 CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
cannam@154	24 ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
cannam@154	25 POSSIBILITY OF SUCH DAMAGE.
cannam@154	26 ***********************************************************************/
cannam@154	27
cannam@154	28 #ifdef HAVE_CONFIG_H
cannam@154	29 #include "config.h"
cannam@154	30 #endif
cannam@154	31 #include "define.h"
cannam@154	32 #include "API.h"
cannam@154	33 #include "control.h"
cannam@154	34 #include "typedef.h"
cannam@154	35 #include "stack_alloc.h"
cannam@154	36 #include "structs.h"
cannam@154	37 #include "tuning_parameters.h"
cannam@154	38 #ifdef FIXED_POINT
cannam@154	39 #include "main_FIX.h"
cannam@154	40 #else
cannam@154	41 #include "main_FLP.h"
cannam@154	42 #endif
cannam@154	43
cannam@154	44 /***************************************/
cannam@154	45 /* Read control structure from encoder */
cannam@154	46 /***************************************/
cannam@154	47 static opus_int silk_QueryEncoder( /* O Returns error code */
cannam@154	48 const void encState, / I State */
cannam@154	49 silk_EncControlStruct encStatus / O Encoder Status */
cannam@154	50 );
cannam@154	51
cannam@154	52 /****************************************/
cannam@154	53 /* Encoder functions */
cannam@154	54 /****************************************/
cannam@154	55
cannam@154	56 opus_int silk_Get_Encoder_Size( /* O Returns error code */
cannam@154	57 opus_int encSizeBytes / O Number of bytes in SILK encoder state */
cannam@154	58 )
cannam@154	59 {
cannam@154	60 opus_int ret = SILK_NO_ERROR;
cannam@154	61
cannam@154	62 *encSizeBytes = sizeof( silk_encoder );
cannam@154	63
cannam@154	64 return ret;
cannam@154	65 }
cannam@154	66
cannam@154	67 /*************************/
cannam@154	68 /* Init or Reset encoder */
cannam@154	69 /*************************/
cannam@154	70 opus_int silk_InitEncoder( /* O Returns error code */
cannam@154	71 void encState, / I/O State */
cannam@154	72 int arch, /* I Run-time architecture */
cannam@154	73 silk_EncControlStruct encStatus / O Encoder Status */
cannam@154	74 )
cannam@154	75 {
cannam@154	76 silk_encoder *psEnc;
cannam@154	77 opus_int n, ret = SILK_NO_ERROR;
cannam@154	78
cannam@154	79 psEnc = (silk_encoder *)encState;
cannam@154	80
cannam@154	81 /* Reset encoder */
cannam@154	82 silk_memset( psEnc, 0, sizeof( silk_encoder ) );
cannam@154	83 for( n = 0; n < ENCODER_NUM_CHANNELS; n++ ) {
cannam@154	84 if( ret += silk_init_encoder( &psEnc->state_Fxx[ n ], arch ) ) {
cannam@154	85 celt_assert( 0 );
cannam@154	86 }
cannam@154	87 }
cannam@154	88
cannam@154	89 psEnc->nChannelsAPI = 1;
cannam@154	90 psEnc->nChannelsInternal = 1;
cannam@154	91
cannam@154	92 /* Read control structure */
cannam@154	93 if( ret += silk_QueryEncoder( encState, encStatus ) ) {
cannam@154	94 celt_assert( 0 );
cannam@154	95 }
cannam@154	96
cannam@154	97 return ret;
cannam@154	98 }
cannam@154	99
cannam@154	100 /***************************************/
cannam@154	101 /* Read control structure from encoder */
cannam@154	102 /***************************************/
cannam@154	103 static opus_int silk_QueryEncoder( /* O Returns error code */
cannam@154	104 const void encState, / I State */
cannam@154	105 silk_EncControlStruct encStatus / O Encoder Status */
cannam@154	106 )
cannam@154	107 {
cannam@154	108 opus_int ret = SILK_NO_ERROR;
cannam@154	109 silk_encoder_state_Fxx *state_Fxx;
cannam@154	110 silk_encoder psEnc = (silk_encoder )encState;
cannam@154	111
cannam@154	112 state_Fxx = psEnc->state_Fxx;
cannam@154	113
cannam@154	114 encStatus->nChannelsAPI = psEnc->nChannelsAPI;
cannam@154	115 encStatus->nChannelsInternal = psEnc->nChannelsInternal;
cannam@154	116 encStatus->API_sampleRate = state_Fxx[ 0 ].sCmn.API_fs_Hz;
cannam@154	117 encStatus->maxInternalSampleRate = state_Fxx[ 0 ].sCmn.maxInternal_fs_Hz;
cannam@154	118 encStatus->minInternalSampleRate = state_Fxx[ 0 ].sCmn.minInternal_fs_Hz;
cannam@154	119 encStatus->desiredInternalSampleRate = state_Fxx[ 0 ].sCmn.desiredInternal_fs_Hz;
cannam@154	120 encStatus->payloadSize_ms = state_Fxx[ 0 ].sCmn.PacketSize_ms;
cannam@154	121 encStatus->bitRate = state_Fxx[ 0 ].sCmn.TargetRate_bps;
cannam@154	122 encStatus->packetLossPercentage = state_Fxx[ 0 ].sCmn.PacketLoss_perc;
cannam@154	123 encStatus->complexity = state_Fxx[ 0 ].sCmn.Complexity;
cannam@154	124 encStatus->useInBandFEC = state_Fxx[ 0 ].sCmn.useInBandFEC;
cannam@154	125 encStatus->useDTX = state_Fxx[ 0 ].sCmn.useDTX;
cannam@154	126 encStatus->useCBR = state_Fxx[ 0 ].sCmn.useCBR;
cannam@154	127 encStatus->internalSampleRate = silk_SMULBB( state_Fxx[ 0 ].sCmn.fs_kHz, 1000 );
cannam@154	128 encStatus->allowBandwidthSwitch = state_Fxx[ 0 ].sCmn.allow_bandwidth_switch;
cannam@154	129 encStatus->inWBmodeWithoutVariableLP = state_Fxx[ 0 ].sCmn.fs_kHz == 16 && state_Fxx[ 0 ].sCmn.sLP.mode == 0;
cannam@154	130
cannam@154	131 return ret;
cannam@154	132 }
cannam@154	133
cannam@154	134
cannam@154	135 /**************************/
cannam@154	136 /* Encode frame with Silk */
cannam@154	137 /**************************/
cannam@154	138 /* Note: if prefillFlag is set, the input must contain 10 ms of audio, irrespective of what */
cannam@154	139 /* encControl->payloadSize_ms is set to */
cannam@154	140 opus_int silk_Encode( /* O Returns error code */
cannam@154	141 void encState, / I/O State */
cannam@154	142 silk_EncControlStruct encControl, / I Control status */
cannam@154	143 const opus_int16 samplesIn, / I Speech sample input vector */
cannam@154	144 opus_int nSamplesIn, /* I Number of samples in input vector */
cannam@154	145 ec_enc psRangeEnc, / I/O Compressor data structure */
cannam@154	146 opus_int32 nBytesOut, / I/O Number of bytes in payload (input: Max bytes) */
cannam@154	147 const opus_int prefillFlag, /* I Flag to indicate prefilling buffers no coding */
cannam@154	148 opus_int activity /* I Decision of Opus voice activity detector */
cannam@154	149 )
cannam@154	150 {
cannam@154	151 opus_int n, i, nBits, flags, tmp_payloadSize_ms = 0, tmp_complexity = 0, ret = 0;
cannam@154	152 opus_int nSamplesToBuffer, nSamplesToBufferMax, nBlocksOf10ms;
cannam@154	153 opus_int nSamplesFromInput = 0, nSamplesFromInputMax;
cannam@154	154 opus_int speech_act_thr_for_switch_Q8;
cannam@154	155 opus_int32 TargetRate_bps, MStargetRates_bps[ 2 ], channelRate_bps, LBRR_symbol, sum;
cannam@154	156 silk_encoder psEnc = ( silk_encoder )encState;
cannam@154	157 VARDECL( opus_int16, buf );
cannam@154	158 opus_int transition, curr_block, tot_blocks;
cannam@154	159 SAVE_STACK;
cannam@154	160
cannam@154	161 if (encControl->reducedDependency)
cannam@154	162 {
cannam@154	163 psEnc->state_Fxx[0].sCmn.first_frame_after_reset = 1;
cannam@154	164 psEnc->state_Fxx[1].sCmn.first_frame_after_reset = 1;
cannam@154	165 }
cannam@154	166 psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded = psEnc->state_Fxx[ 1 ].sCmn.nFramesEncoded = 0;
cannam@154	167
cannam@154	168 /* Check values in encoder control structure */
cannam@154	169 if( ( ret = check_control_input( encControl ) ) != 0 ) {
cannam@154	170 celt_assert( 0 );
cannam@154	171 RESTORE_STACK;
cannam@154	172 return ret;
cannam@154	173 }
cannam@154	174
cannam@154	175 encControl->switchReady = 0;
cannam@154	176
cannam@154	177 if( encControl->nChannelsInternal > psEnc->nChannelsInternal ) {
cannam@154	178 /* Mono -> Stereo transition: init state of second channel and stereo state */
cannam@154	179 ret += silk_init_encoder( &psEnc->state_Fxx[ 1 ], psEnc->state_Fxx[ 0 ].sCmn.arch );
cannam@154	180 silk_memset( psEnc->sStereo.pred_prev_Q13, 0, sizeof( psEnc->sStereo.pred_prev_Q13 ) );
cannam@154	181 silk_memset( psEnc->sStereo.sSide, 0, sizeof( psEnc->sStereo.sSide ) );
cannam@154	182 psEnc->sStereo.mid_side_amp_Q0[ 0 ] = 0;
cannam@154	183 psEnc->sStereo.mid_side_amp_Q0[ 1 ] = 1;
cannam@154	184 psEnc->sStereo.mid_side_amp_Q0[ 2 ] = 0;
cannam@154	185 psEnc->sStereo.mid_side_amp_Q0[ 3 ] = 1;
cannam@154	186 psEnc->sStereo.width_prev_Q14 = 0;
cannam@154	187 psEnc->sStereo.smth_width_Q14 = SILK_FIX_CONST( 1, 14 );
cannam@154	188 if( psEnc->nChannelsAPI == 2 ) {
cannam@154	189 silk_memcpy( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state, &psEnc->state_Fxx[ 0 ].sCmn.resampler_state, sizeof( silk_resampler_state_struct ) );
cannam@154	190 silk_memcpy( &psEnc->state_Fxx[ 1 ].sCmn.In_HP_State, &psEnc->state_Fxx[ 0 ].sCmn.In_HP_State, sizeof( psEnc->state_Fxx[ 1 ].sCmn.In_HP_State ) );
cannam@154	191 }
cannam@154	192 }
cannam@154	193
cannam@154	194 transition = (encControl->payloadSize_ms != psEnc->state_Fxx[ 0 ].sCmn.PacketSize_ms) \|\| (psEnc->nChannelsInternal != encControl->nChannelsInternal);
cannam@154	195
cannam@154	196 psEnc->nChannelsAPI = encControl->nChannelsAPI;
cannam@154	197 psEnc->nChannelsInternal = encControl->nChannelsInternal;
cannam@154	198
cannam@154	199 nBlocksOf10ms = silk_DIV32( 100 * nSamplesIn, encControl->API_sampleRate );
cannam@154	200 tot_blocks = ( nBlocksOf10ms > 1 ) ? nBlocksOf10ms >> 1 : 1;
cannam@154	201 curr_block = 0;
cannam@154	202 if( prefillFlag ) {
cannam@154	203 silk_LP_state save_LP;
cannam@154	204 /* Only accept input length of 10 ms */
cannam@154	205 if( nBlocksOf10ms != 1 ) {
cannam@154	206 celt_assert( 0 );
cannam@154	207 RESTORE_STACK;
cannam@154	208 return SILK_ENC_INPUT_INVALID_NO_OF_SAMPLES;
cannam@154	209 }
cannam@154	210 if ( prefillFlag == 2 ) {
cannam@154	211 save_LP = psEnc->state_Fxx[ 0 ].sCmn.sLP;
cannam@154	212 /* Save the sampling rate so the bandwidth switching code can keep handling transitions. */
cannam@154	213 save_LP.saved_fs_kHz = psEnc->state_Fxx[ 0 ].sCmn.fs_kHz;
cannam@154	214 }
cannam@154	215 /* Reset Encoder */
cannam@154	216 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	217 ret = silk_init_encoder( &psEnc->state_Fxx[ n ], psEnc->state_Fxx[ n ].sCmn.arch );
cannam@154	218 /* Restore the variable LP state. */
cannam@154	219 if ( prefillFlag == 2 ) {
cannam@154	220 psEnc->state_Fxx[ n ].sCmn.sLP = save_LP;
cannam@154	221 }
cannam@154	222 celt_assert( !ret );
cannam@154	223 }
cannam@154	224 tmp_payloadSize_ms = encControl->payloadSize_ms;
cannam@154	225 encControl->payloadSize_ms = 10;
cannam@154	226 tmp_complexity = encControl->complexity;
cannam@154	227 encControl->complexity = 0;
cannam@154	228 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	229 psEnc->state_Fxx[ n ].sCmn.controlled_since_last_payload = 0;
cannam@154	230 psEnc->state_Fxx[ n ].sCmn.prefillFlag = 1;
cannam@154	231 }
cannam@154	232 } else {
cannam@154	233 /* Only accept input lengths that are a multiple of 10 ms */
cannam@154	234 if( nBlocksOf10ms * encControl->API_sampleRate != 100 * nSamplesIn \|\| nSamplesIn < 0 ) {
cannam@154	235 celt_assert( 0 );
cannam@154	236 RESTORE_STACK;
cannam@154	237 return SILK_ENC_INPUT_INVALID_NO_OF_SAMPLES;
cannam@154	238 }
cannam@154	239 /* Make sure no more than one packet can be produced */
cannam@154	240 if( 1000 * (opus_int32)nSamplesIn > encControl->payloadSize_ms * encControl->API_sampleRate ) {
cannam@154	241 celt_assert( 0 );
cannam@154	242 RESTORE_STACK;
cannam@154	243 return SILK_ENC_INPUT_INVALID_NO_OF_SAMPLES;
cannam@154	244 }
cannam@154	245 }
cannam@154	246
cannam@154	247 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	248 /* Force the side channel to the same rate as the mid */
cannam@154	249 opus_int force_fs_kHz = (n==1) ? psEnc->state_Fxx[0].sCmn.fs_kHz : 0;
cannam@154	250 if( ( ret = silk_control_encoder( &psEnc->state_Fxx[ n ], encControl, psEnc->allowBandwidthSwitch, n, force_fs_kHz ) ) != 0 ) {
cannam@154	251 silk_assert( 0 );
cannam@154	252 RESTORE_STACK;
cannam@154	253 return ret;
cannam@154	254 }
cannam@154	255 if( psEnc->state_Fxx[n].sCmn.first_frame_after_reset \|\| transition ) {
cannam@154	256 for( i = 0; i < psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket; i++ ) {
cannam@154	257 psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i ] = 0;
cannam@154	258 }
cannam@154	259 }
cannam@154	260 psEnc->state_Fxx[ n ].sCmn.inDTX = psEnc->state_Fxx[ n ].sCmn.useDTX;
cannam@154	261 }
cannam@154	262 celt_assert( encControl->nChannelsInternal == 1 \|\| psEnc->state_Fxx[ 0 ].sCmn.fs_kHz == psEnc->state_Fxx[ 1 ].sCmn.fs_kHz );
cannam@154	263
cannam@154	264 /* Input buffering/resampling and encoding */
cannam@154	265 nSamplesToBufferMax =
cannam@154	266 10 * nBlocksOf10ms * psEnc->state_Fxx[ 0 ].sCmn.fs_kHz;
cannam@154	267 nSamplesFromInputMax =
cannam@154	268 silk_DIV32_16( nSamplesToBufferMax *
cannam@154	269 psEnc->state_Fxx[ 0 ].sCmn.API_fs_Hz,
cannam@154	270 psEnc->state_Fxx[ 0 ].sCmn.fs_kHz * 1000 );
cannam@154	271 ALLOC( buf, nSamplesFromInputMax, opus_int16 );
cannam@154	272 while( 1 ) {
cannam@154	273 nSamplesToBuffer = psEnc->state_Fxx[ 0 ].sCmn.frame_length - psEnc->state_Fxx[ 0 ].sCmn.inputBufIx;
cannam@154	274 nSamplesToBuffer = silk_min( nSamplesToBuffer, nSamplesToBufferMax );
cannam@154	275 nSamplesFromInput = silk_DIV32_16( nSamplesToBuffer * psEnc->state_Fxx[ 0 ].sCmn.API_fs_Hz, psEnc->state_Fxx[ 0 ].sCmn.fs_kHz * 1000 );
cannam@154	276 /* Resample and write to buffer */
cannam@154	277 if( encControl->nChannelsAPI == 2 && encControl->nChannelsInternal == 2 ) {
cannam@154	278 opus_int id = psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded;
cannam@154	279 for( n = 0; n < nSamplesFromInput; n++ ) {
cannam@154	280 buf[ n ] = samplesIn[ 2 * n ];
cannam@154	281 }
cannam@154	282 /* Making sure to start both resamplers from the same state when switching from mono to stereo */
cannam@154	283 if( psEnc->nPrevChannelsInternal == 1 && id==0 ) {
cannam@154	284 silk_memcpy( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state, &psEnc->state_Fxx[ 0 ].sCmn.resampler_state, sizeof(psEnc->state_Fxx[ 1 ].sCmn.resampler_state));
cannam@154	285 }
cannam@154	286
cannam@154	287 ret += silk_resampler( &psEnc->state_Fxx[ 0 ].sCmn.resampler_state,
cannam@154	288 &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );
cannam@154	289 psEnc->state_Fxx[ 0 ].sCmn.inputBufIx += nSamplesToBuffer;
cannam@154	290
cannam@154	291 nSamplesToBuffer = psEnc->state_Fxx[ 1 ].sCmn.frame_length - psEnc->state_Fxx[ 1 ].sCmn.inputBufIx;
cannam@154	292 nSamplesToBuffer = silk_min( nSamplesToBuffer, 10 * nBlocksOf10ms * psEnc->state_Fxx[ 1 ].sCmn.fs_kHz );
cannam@154	293 for( n = 0; n < nSamplesFromInput; n++ ) {
cannam@154	294 buf[ n ] = samplesIn[ 2 * n + 1 ];
cannam@154	295 }
cannam@154	296 ret += silk_resampler( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state,
cannam@154	297 &psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ psEnc->state_Fxx[ 1 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );
cannam@154	298
cannam@154	299 psEnc->state_Fxx[ 1 ].sCmn.inputBufIx += nSamplesToBuffer;
cannam@154	300 } else if( encControl->nChannelsAPI == 2 && encControl->nChannelsInternal == 1 ) {
cannam@154	301 /* Combine left and right channels before resampling */
cannam@154	302 for( n = 0; n < nSamplesFromInput; n++ ) {
cannam@154	303 sum = samplesIn[ 2 * n ] + samplesIn[ 2 * n + 1 ];
cannam@154	304 buf[ n ] = (opus_int16)silk_RSHIFT_ROUND( sum, 1 );
cannam@154	305 }
cannam@154	306 ret += silk_resampler( &psEnc->state_Fxx[ 0 ].sCmn.resampler_state,
cannam@154	307 &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );
cannam@154	308 /* On the first mono frame, average the results for the two resampler states */
cannam@154	309 if( psEnc->nPrevChannelsInternal == 2 && psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded == 0 ) {
cannam@154	310 ret += silk_resampler( &psEnc->state_Fxx[ 1 ].sCmn.resampler_state,
cannam@154	311 &psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ psEnc->state_Fxx[ 1 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );
cannam@154	312 for( n = 0; n < psEnc->state_Fxx[ 0 ].sCmn.frame_length; n++ ) {
cannam@154	313 psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx+n+2 ] =
cannam@154	314 silk_RSHIFT(psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx+n+2 ]
cannam@154	315 + psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ psEnc->state_Fxx[ 1 ].sCmn.inputBufIx+n+2 ], 1);
cannam@154	316 }
cannam@154	317 }
cannam@154	318 psEnc->state_Fxx[ 0 ].sCmn.inputBufIx += nSamplesToBuffer;
cannam@154	319 } else {
cannam@154	320 celt_assert( encControl->nChannelsAPI == 1 && encControl->nChannelsInternal == 1 );
cannam@154	321 silk_memcpy(buf, samplesIn, nSamplesFromInput*sizeof(opus_int16));
cannam@154	322 ret += silk_resampler( &psEnc->state_Fxx[ 0 ].sCmn.resampler_state,
cannam@154	323 &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.inputBufIx + 2 ], buf, nSamplesFromInput );
cannam@154	324 psEnc->state_Fxx[ 0 ].sCmn.inputBufIx += nSamplesToBuffer;
cannam@154	325 }
cannam@154	326
cannam@154	327 samplesIn += nSamplesFromInput * encControl->nChannelsAPI;
cannam@154	328 nSamplesIn -= nSamplesFromInput;
cannam@154	329
cannam@154	330 /* Default */
cannam@154	331 psEnc->allowBandwidthSwitch = 0;
cannam@154	332
cannam@154	333 /* Silk encoder */
cannam@154	334 if( psEnc->state_Fxx[ 0 ].sCmn.inputBufIx >= psEnc->state_Fxx[ 0 ].sCmn.frame_length ) {
cannam@154	335 /* Enough data in input buffer, so encode */
cannam@154	336 celt_assert( psEnc->state_Fxx[ 0 ].sCmn.inputBufIx == psEnc->state_Fxx[ 0 ].sCmn.frame_length );
cannam@154	337 celt_assert( encControl->nChannelsInternal == 1 \|\| psEnc->state_Fxx[ 1 ].sCmn.inputBufIx == psEnc->state_Fxx[ 1 ].sCmn.frame_length );
cannam@154	338
cannam@154	339 /* Deal with LBRR data */
cannam@154	340 if( psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded == 0 && !prefillFlag ) {
cannam@154	341 /* Create space at start of payload for VAD and FEC flags */
cannam@154	342 opus_uint8 iCDF[ 2 ] = { 0, 0 };
cannam@154	343 iCDF[ 0 ] = 256 - silk_RSHIFT( 256, ( psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket + 1 ) * encControl->nChannelsInternal );
cannam@154	344 ec_enc_icdf( psRangeEnc, 0, iCDF, 8 );
cannam@154	345
cannam@154	346 /* Encode any LBRR data from previous packet */
cannam@154	347 /* Encode LBRR flags */
cannam@154	348 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	349 LBRR_symbol = 0;
cannam@154	350 for( i = 0; i < psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket; i++ ) {
cannam@154	351 LBRR_symbol \|= silk_LSHIFT( psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i ], i );
cannam@154	352 }
cannam@154	353 psEnc->state_Fxx[ n ].sCmn.LBRR_flag = LBRR_symbol > 0 ? 1 : 0;
cannam@154	354 if( LBRR_symbol && psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket > 1 ) {
cannam@154	355 ec_enc_icdf( psRangeEnc, LBRR_symbol - 1, silk_LBRR_flags_iCDF_ptr[ psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket - 2 ], 8 );
cannam@154	356 }
cannam@154	357 }
cannam@154	358
cannam@154	359 /* Code LBRR indices and excitation signals */
cannam@154	360 for( i = 0; i < psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket; i++ ) {
cannam@154	361 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	362 if( psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i ] ) {
cannam@154	363 opus_int condCoding;
cannam@154	364
cannam@154	365 if( encControl->nChannelsInternal == 2 && n == 0 ) {
cannam@154	366 silk_stereo_encode_pred( psRangeEnc, psEnc->sStereo.predIx[ i ] );
cannam@154	367 /* For LBRR data there's no need to code the mid-only flag if the side-channel LBRR flag is set */
cannam@154	368 if( psEnc->state_Fxx[ 1 ].sCmn.LBRR_flags[ i ] == 0 ) {
cannam@154	369 silk_stereo_encode_mid_only( psRangeEnc, psEnc->sStereo.mid_only_flags[ i ] );
cannam@154	370 }
cannam@154	371 }
cannam@154	372 /* Use conditional coding if previous frame available */
cannam@154	373 if( i > 0 && psEnc->state_Fxx[ n ].sCmn.LBRR_flags[ i - 1 ] ) {
cannam@154	374 condCoding = CODE_CONDITIONALLY;
cannam@154	375 } else {
cannam@154	376 condCoding = CODE_INDEPENDENTLY;
cannam@154	377 }
cannam@154	378 silk_encode_indices( &psEnc->state_Fxx[ n ].sCmn, psRangeEnc, i, 1, condCoding );
cannam@154	379 silk_encode_pulses( psRangeEnc, psEnc->state_Fxx[ n ].sCmn.indices_LBRR[i].signalType, psEnc->state_Fxx[ n ].sCmn.indices_LBRR[i].quantOffsetType,
cannam@154	380 psEnc->state_Fxx[ n ].sCmn.pulses_LBRR[ i ], psEnc->state_Fxx[ n ].sCmn.frame_length );
cannam@154	381 }
cannam@154	382 }
cannam@154	383 }
cannam@154	384
cannam@154	385 /* Reset LBRR flags */
cannam@154	386 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	387 silk_memset( psEnc->state_Fxx[ n ].sCmn.LBRR_flags, 0, sizeof( psEnc->state_Fxx[ n ].sCmn.LBRR_flags ) );
cannam@154	388 }
cannam@154	389
cannam@154	390 psEnc->nBitsUsedLBRR = ec_tell( psRangeEnc );
cannam@154	391 }
cannam@154	392
cannam@154	393 silk_HP_variable_cutoff( psEnc->state_Fxx );
cannam@154	394
cannam@154	395 /* Total target bits for packet */
cannam@154	396 nBits = silk_DIV32_16( silk_MUL( encControl->bitRate, encControl->payloadSize_ms ), 1000 );
cannam@154	397 /* Subtract bits used for LBRR */
cannam@154	398 if( !prefillFlag ) {
cannam@154	399 nBits -= psEnc->nBitsUsedLBRR;
cannam@154	400 }
cannam@154	401 /* Divide by number of uncoded frames left in packet */
cannam@154	402 nBits = silk_DIV32_16( nBits, psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket );
cannam@154	403 /* Convert to bits/second */
cannam@154	404 if( encControl->payloadSize_ms == 10 ) {
cannam@154	405 TargetRate_bps = silk_SMULBB( nBits, 100 );
cannam@154	406 } else {
cannam@154	407 TargetRate_bps = silk_SMULBB( nBits, 50 );
cannam@154	408 }
cannam@154	409 /* Subtract fraction of bits in excess of target in previous frames and packets */
cannam@154	410 TargetRate_bps -= silk_DIV32_16( silk_MUL( psEnc->nBitsExceeded, 1000 ), BITRESERVOIR_DECAY_TIME_MS );
cannam@154	411 if( !prefillFlag && psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded > 0 ) {
cannam@154	412 /* Compare actual vs target bits so far in this packet */
cannam@154	413 opus_int32 bitsBalance = ec_tell( psRangeEnc ) - psEnc->nBitsUsedLBRR - nBits * psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded;
cannam@154	414 TargetRate_bps -= silk_DIV32_16( silk_MUL( bitsBalance, 1000 ), BITRESERVOIR_DECAY_TIME_MS );
cannam@154	415 }
cannam@154	416 /* Never exceed input bitrate */
cannam@154	417 TargetRate_bps = silk_LIMIT( TargetRate_bps, encControl->bitRate, 5000 );
cannam@154	418
cannam@154	419 /* Convert Left/Right to Mid/Side */
cannam@154	420 if( encControl->nChannelsInternal == 2 ) {
cannam@154	421 silk_stereo_LR_to_MS( &psEnc->sStereo, &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ 2 ], &psEnc->state_Fxx[ 1 ].sCmn.inputBuf[ 2 ],
cannam@154	422 psEnc->sStereo.predIx[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ], &psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ],
cannam@154	423 MStargetRates_bps, TargetRate_bps, psEnc->state_Fxx[ 0 ].sCmn.speech_activity_Q8, encControl->toMono,
cannam@154	424 psEnc->state_Fxx[ 0 ].sCmn.fs_kHz, psEnc->state_Fxx[ 0 ].sCmn.frame_length );
cannam@154	425 if( psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] == 0 ) {
cannam@154	426 /* Reset side channel encoder memory for first frame with side coding */
cannam@154	427 if( psEnc->prev_decode_only_middle == 1 ) {
cannam@154	428 silk_memset( &psEnc->state_Fxx[ 1 ].sShape, 0, sizeof( psEnc->state_Fxx[ 1 ].sShape ) );
cannam@154	429 silk_memset( &psEnc->state_Fxx[ 1 ].sCmn.sNSQ, 0, sizeof( psEnc->state_Fxx[ 1 ].sCmn.sNSQ ) );
cannam@154	430 silk_memset( psEnc->state_Fxx[ 1 ].sCmn.prev_NLSFq_Q15, 0, sizeof( psEnc->state_Fxx[ 1 ].sCmn.prev_NLSFq_Q15 ) );
cannam@154	431 silk_memset( &psEnc->state_Fxx[ 1 ].sCmn.sLP.In_LP_State, 0, sizeof( psEnc->state_Fxx[ 1 ].sCmn.sLP.In_LP_State ) );
cannam@154	432 psEnc->state_Fxx[ 1 ].sCmn.prevLag = 100;
cannam@154	433 psEnc->state_Fxx[ 1 ].sCmn.sNSQ.lagPrev = 100;
cannam@154	434 psEnc->state_Fxx[ 1 ].sShape.LastGainIndex = 10;
cannam@154	435 psEnc->state_Fxx[ 1 ].sCmn.prevSignalType = TYPE_NO_VOICE_ACTIVITY;
cannam@154	436 psEnc->state_Fxx[ 1 ].sCmn.sNSQ.prev_gain_Q16 = 65536;
cannam@154	437 psEnc->state_Fxx[ 1 ].sCmn.first_frame_after_reset = 1;
cannam@154	438 }
cannam@154	439 silk_encode_do_VAD_Fxx( &psEnc->state_Fxx[ 1 ], activity );
cannam@154	440 } else {
cannam@154	441 psEnc->state_Fxx[ 1 ].sCmn.VAD_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] = 0;
cannam@154	442 }
cannam@154	443 if( !prefillFlag ) {
cannam@154	444 silk_stereo_encode_pred( psRangeEnc, psEnc->sStereo.predIx[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] );
cannam@154	445 if( psEnc->state_Fxx[ 1 ].sCmn.VAD_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] == 0 ) {
cannam@154	446 silk_stereo_encode_mid_only( psRangeEnc, psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded ] );
cannam@154	447 }
cannam@154	448 }
cannam@154	449 } else {
cannam@154	450 /* Buffering */
cannam@154	451 silk_memcpy( psEnc->state_Fxx[ 0 ].sCmn.inputBuf, psEnc->sStereo.sMid, 2 * sizeof( opus_int16 ) );
cannam@154	452 silk_memcpy( psEnc->sStereo.sMid, &psEnc->state_Fxx[ 0 ].sCmn.inputBuf[ psEnc->state_Fxx[ 0 ].sCmn.frame_length ], 2 * sizeof( opus_int16 ) );
cannam@154	453 }
cannam@154	454 silk_encode_do_VAD_Fxx( &psEnc->state_Fxx[ 0 ], activity );
cannam@154	455
cannam@154	456 /* Encode */
cannam@154	457 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	458 opus_int maxBits, useCBR;
cannam@154	459
cannam@154	460 /* Handling rate constraints */
cannam@154	461 maxBits = encControl->maxBits;
cannam@154	462 if( tot_blocks == 2 && curr_block == 0 ) {
cannam@154	463 maxBits = maxBits * 3 / 5;
cannam@154	464 } else if( tot_blocks == 3 ) {
cannam@154	465 if( curr_block == 0 ) {
cannam@154	466 maxBits = maxBits * 2 / 5;
cannam@154	467 } else if( curr_block == 1 ) {
cannam@154	468 maxBits = maxBits * 3 / 4;
cannam@154	469 }
cannam@154	470 }
cannam@154	471 useCBR = encControl->useCBR && curr_block == tot_blocks - 1;
cannam@154	472
cannam@154	473 if( encControl->nChannelsInternal == 1 ) {
cannam@154	474 channelRate_bps = TargetRate_bps;
cannam@154	475 } else {
cannam@154	476 channelRate_bps = MStargetRates_bps[ n ];
cannam@154	477 if( n == 0 && MStargetRates_bps[ 1 ] > 0 ) {
cannam@154	478 useCBR = 0;
cannam@154	479 /* Give mid up to 1/2 of the max bits for that frame */
cannam@154	480 maxBits -= encControl->maxBits / ( tot_blocks * 2 );
cannam@154	481 }
cannam@154	482 }
cannam@154	483
cannam@154	484 if( channelRate_bps > 0 ) {
cannam@154	485 opus_int condCoding;
cannam@154	486
cannam@154	487 silk_control_SNR( &psEnc->state_Fxx[ n ].sCmn, channelRate_bps );
cannam@154	488
cannam@154	489 /* Use independent coding if no previous frame available */
cannam@154	490 if( psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded - n <= 0 ) {
cannam@154	491 condCoding = CODE_INDEPENDENTLY;
cannam@154	492 } else if( n > 0 && psEnc->prev_decode_only_middle ) {
cannam@154	493 /* If we skipped a side frame in this packet, we don't
cannam@154	494 need LTP scaling; the LTP state is well-defined. */
cannam@154	495 condCoding = CODE_INDEPENDENTLY_NO_LTP_SCALING;
cannam@154	496 } else {
cannam@154	497 condCoding = CODE_CONDITIONALLY;
cannam@154	498 }
cannam@154	499 if( ( ret = silk_encode_frame_Fxx( &psEnc->state_Fxx[ n ], nBytesOut, psRangeEnc, condCoding, maxBits, useCBR ) ) != 0 ) {
cannam@154	500 silk_assert( 0 );
cannam@154	501 }
cannam@154	502 }
cannam@154	503 psEnc->state_Fxx[ n ].sCmn.controlled_since_last_payload = 0;
cannam@154	504 psEnc->state_Fxx[ n ].sCmn.inputBufIx = 0;
cannam@154	505 psEnc->state_Fxx[ n ].sCmn.nFramesEncoded++;
cannam@154	506 }
cannam@154	507 psEnc->prev_decode_only_middle = psEnc->sStereo.mid_only_flags[ psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded - 1 ];
cannam@154	508
cannam@154	509 /* Insert VAD and FEC flags at beginning of bitstream */
cannam@154	510 if( *nBytesOut > 0 && psEnc->state_Fxx[ 0 ].sCmn.nFramesEncoded == psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket) {
cannam@154	511 flags = 0;
cannam@154	512 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	513 for( i = 0; i < psEnc->state_Fxx[ n ].sCmn.nFramesPerPacket; i++ ) {
cannam@154	514 flags = silk_LSHIFT( flags, 1 );
cannam@154	515 flags \|= psEnc->state_Fxx[ n ].sCmn.VAD_flags[ i ];
cannam@154	516 }
cannam@154	517 flags = silk_LSHIFT( flags, 1 );
cannam@154	518 flags \|= psEnc->state_Fxx[ n ].sCmn.LBRR_flag;
cannam@154	519 }
cannam@154	520 if( !prefillFlag ) {
cannam@154	521 ec_enc_patch_initial_bits( psRangeEnc, flags, ( psEnc->state_Fxx[ 0 ].sCmn.nFramesPerPacket + 1 ) * encControl->nChannelsInternal );
cannam@154	522 }
cannam@154	523
cannam@154	524 /* Return zero bytes if all channels DTXed */
cannam@154	525 if( psEnc->state_Fxx[ 0 ].sCmn.inDTX && ( encControl->nChannelsInternal == 1 \|\| psEnc->state_Fxx[ 1 ].sCmn.inDTX ) ) {
cannam@154	526 *nBytesOut = 0;
cannam@154	527 }
cannam@154	528
cannam@154	529 psEnc->nBitsExceeded += nBytesOut 8;
cannam@154	530 psEnc->nBitsExceeded -= silk_DIV32_16( silk_MUL( encControl->bitRate, encControl->payloadSize_ms ), 1000 );
cannam@154	531 psEnc->nBitsExceeded = silk_LIMIT( psEnc->nBitsExceeded, 0, 10000 );
cannam@154	532
cannam@154	533 /* Update flag indicating if bandwidth switching is allowed */
cannam@154	534 speech_act_thr_for_switch_Q8 = silk_SMLAWB( SILK_FIX_CONST( SPEECH_ACTIVITY_DTX_THRES, 8 ),
cannam@154	535 SILK_FIX_CONST( ( 1 - SPEECH_ACTIVITY_DTX_THRES ) / MAX_BANDWIDTH_SWITCH_DELAY_MS, 16 + 8 ), psEnc->timeSinceSwitchAllowed_ms );
cannam@154	536 if( psEnc->state_Fxx[ 0 ].sCmn.speech_activity_Q8 < speech_act_thr_for_switch_Q8 ) {
cannam@154	537 psEnc->allowBandwidthSwitch = 1;
cannam@154	538 psEnc->timeSinceSwitchAllowed_ms = 0;
cannam@154	539 } else {
cannam@154	540 psEnc->allowBandwidthSwitch = 0;
cannam@154	541 psEnc->timeSinceSwitchAllowed_ms += encControl->payloadSize_ms;
cannam@154	542 }
cannam@154	543 }
cannam@154	544
cannam@154	545 if( nSamplesIn == 0 ) {
cannam@154	546 break;
cannam@154	547 }
cannam@154	548 } else {
cannam@154	549 break;
cannam@154	550 }
cannam@154	551 curr_block++;
cannam@154	552 }
cannam@154	553
cannam@154	554 psEnc->nPrevChannelsInternal = encControl->nChannelsInternal;
cannam@154	555
cannam@154	556 encControl->allowBandwidthSwitch = psEnc->allowBandwidthSwitch;
cannam@154	557 encControl->inWBmodeWithoutVariableLP = psEnc->state_Fxx[ 0 ].sCmn.fs_kHz == 16 && psEnc->state_Fxx[ 0 ].sCmn.sLP.mode == 0;
cannam@154	558 encControl->internalSampleRate = silk_SMULBB( psEnc->state_Fxx[ 0 ].sCmn.fs_kHz, 1000 );
cannam@154	559 encControl->stereoWidth_Q14 = encControl->toMono ? 0 : psEnc->sStereo.smth_width_Q14;
cannam@154	560 if( prefillFlag ) {
cannam@154	561 encControl->payloadSize_ms = tmp_payloadSize_ms;
cannam@154	562 encControl->complexity = tmp_complexity;
cannam@154	563 for( n = 0; n < encControl->nChannelsInternal; n++ ) {
cannam@154	564 psEnc->state_Fxx[ n ].sCmn.controlled_since_last_payload = 0;
cannam@154	565 psEnc->state_Fxx[ n ].sCmn.prefillFlag = 0;
cannam@154	566 }
cannam@154	567 }
cannam@154	568
cannam@154	569 encControl->signalType = psEnc->state_Fxx[0].sCmn.indices.signalType;
cannam@154	570 encControl->offset = silk_Quantization_Offsets_Q10
cannam@154	571 [ psEnc->state_Fxx[0].sCmn.indices.signalType >> 1 ]
cannam@154	572 [ psEnc->state_Fxx[0].sCmn.indices.quantOffsetType ];
cannam@154	573 RESTORE_STACK;
cannam@154	574 return ret;
cannam@154	575 }
cannam@154	576

Mercurial > hg > sv-dependency-builds

annotate src/opus-1.3/silk/enc_API.c @ 169:223a55898ab9 tip default