pmhd: ffmpeg/libavcodec/aaccoder.c annotate

annotate ffmpeg/libavcodec/aaccoder.c @ 13:844d341cf643 tip

Back up before ISMIR

author	Yading Song <yading.song@eecs.qmul.ac.uk>
date	Thu, 31 Oct 2013 13:17:06 +0000
parents	6840f77b83aa
children

rev	line source
yading@10	1 /*
yading@10	2 * AAC coefficients encoder
yading@10	3 * Copyright (C) 2008-2009 Konstantin Shishkov
yading@10	4 *
yading@10	5 * This file is part of FFmpeg.
yading@10	6 *
yading@10	7 * FFmpeg is free software; you can redistribute it and/or
yading@10	8 * modify it under the terms of the GNU Lesser General Public
yading@10	9 * License as published by the Free Software Foundation; either
yading@10	10 * version 2.1 of the License, or (at your option) any later version.
yading@10	11 *
yading@10	12 * FFmpeg is distributed in the hope that it will be useful,
yading@10	13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
yading@10	14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
yading@10	15 * Lesser General Public License for more details.
yading@10	16 *
yading@10	17 * You should have received a copy of the GNU Lesser General Public
yading@10	18 * License along with FFmpeg; if not, write to the Free Software
yading@10	19 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
yading@10	20 */
yading@10	21
yading@10	22 /**
yading@10	23 * @file
yading@10	24 * AAC coefficients encoder
yading@10	25 */
yading@10	26
yading@10	27 /***********************************
yading@10	28 * TODOs:
yading@10	29 * speedup quantizer selection
yading@10	30 * add sane pulse detection
yading@10	31 ***********************************/
yading@10	32
yading@10	33 #include "libavutil/libm.h" // brought forward to work around cygwin header breakage
yading@10	34
yading@10	35 #include <float.h>
yading@10	36 #include "libavutil/mathematics.h"
yading@10	37 #include "avcodec.h"
yading@10	38 #include "put_bits.h"
yading@10	39 #include "aac.h"
yading@10	40 #include "aacenc.h"
yading@10	41 #include "aactab.h"
yading@10	42
yading@10	43 /** bits needed to code codebook run value for long windows */
yading@10	44 static const uint8_t run_value_bits_long[64] = {
yading@10	45 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5,
yading@10	46 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 10,
yading@10	47 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10,
yading@10	48 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 15
yading@10	49 };
yading@10	50
yading@10	51 /** bits needed to code codebook run value for short windows */
yading@10	52 static const uint8_t run_value_bits_short[16] = {
yading@10	53 3, 3, 3, 3, 3, 3, 3, 6, 6, 6, 6, 6, 6, 6, 6, 9
yading@10	54 };
yading@10	55
yading@10	56 static const uint8_t *run_value_bits[2] = {
yading@10	57 run_value_bits_long, run_value_bits_short
yading@10	58 };
yading@10	59
yading@10	60
yading@10	61 /**
yading@10	62 * Quantize one coefficient.
yading@10	63 * @return absolute value of the quantized coefficient
yading@10	64 * @see 3GPP TS26.403 5.6.2 "Scalefactor determination"
yading@10	65 */
yading@10	66 static av_always_inline int quant(float coef, const float Q)
yading@10	67 {
yading@10	68 float a = coef * Q;
yading@10	69 return sqrtf(a * sqrtf(a)) + 0.4054;
yading@10	70 }
yading@10	71
yading@10	72 static void quantize_bands(int out, const float in, const float *scaled,
yading@10	73 int size, float Q34, int is_signed, int maxval)
yading@10	74 {
yading@10	75 int i;
yading@10	76 double qc;
yading@10	77 for (i = 0; i < size; i++) {
yading@10	78 qc = scaled[i] * Q34;
yading@10	79 out[i] = (int)FFMIN(qc + 0.4054, (double)maxval);
yading@10	80 if (is_signed && in[i] < 0.0f) {
yading@10	81 out[i] = -out[i];
yading@10	82 }
yading@10	83 }
yading@10	84 }
yading@10	85
yading@10	86 static void abs_pow34_v(float out, const float in, const int size)
yading@10	87 {
yading@10	88 #ifndef USE_REALLY_FULL_SEARCH
yading@10	89 int i;
yading@10	90 for (i = 0; i < size; i++) {
yading@10	91 float a = fabsf(in[i]);
yading@10	92 out[i] = sqrtf(a * sqrtf(a));
yading@10	93 }
yading@10	94 #endif /* USE_REALLY_FULL_SEARCH */
yading@10	95 }
yading@10	96
yading@10	97 static const uint8_t aac_cb_range [12] = {0, 3, 3, 3, 3, 9, 9, 8, 8, 13, 13, 17};
yading@10	98 static const uint8_t aac_cb_maxval[12] = {0, 1, 1, 2, 2, 4, 4, 7, 7, 12, 12, 16};
yading@10	99
yading@10	100 /**
yading@10	101 * Calculate rate distortion cost for quantizing with given codebook
yading@10	102 *
yading@10	103 * @return quantization distortion
yading@10	104 */
yading@10	105 static av_always_inline float quantize_and_encode_band_cost_template(
yading@10	106 struct AACEncContext *s,
yading@10	107 PutBitContext pb, const float in,
yading@10	108 const float *scaled, int size, int scale_idx,
yading@10	109 int cb, const float lambda, const float uplim,
yading@10	110 int *bits, int BT_ZERO, int BT_UNSIGNED,
yading@10	111 int BT_PAIR, int BT_ESC)
yading@10	112 {
yading@10	113 const int q_idx = POW_SF2_ZERO - scale_idx + SCALE_ONE_POS - SCALE_DIV_512;
yading@10	114 const float Q = ff_aac_pow2sf_tab [q_idx];
yading@10	115 const float Q34 = ff_aac_pow34sf_tab[q_idx];
yading@10	116 const float IQ = ff_aac_pow2sf_tab [POW_SF2_ZERO + scale_idx - SCALE_ONE_POS + SCALE_DIV_512];
yading@10	117 const float CLIPPED_ESCAPE = 165140.0f*IQ;
yading@10	118 int i, j;
yading@10	119 float cost = 0;
yading@10	120 const int dim = BT_PAIR ? 2 : 4;
yading@10	121 int resbits = 0;
yading@10	122 const int range = aac_cb_range[cb];
yading@10	123 const int maxval = aac_cb_maxval[cb];
yading@10	124 int off;
yading@10	125
yading@10	126 if (BT_ZERO) {
yading@10	127 for (i = 0; i < size; i++)
yading@10	128 cost += in[i]*in[i];
yading@10	129 if (bits)
yading@10	130 *bits = 0;
yading@10	131 return cost * lambda;
yading@10	132 }
yading@10	133 if (!scaled) {
yading@10	134 abs_pow34_v(s->scoefs, in, size);
yading@10	135 scaled = s->scoefs;
yading@10	136 }
yading@10	137 quantize_bands(s->qcoefs, in, scaled, size, Q34, !BT_UNSIGNED, maxval);
yading@10	138 if (BT_UNSIGNED) {
yading@10	139 off = 0;
yading@10	140 } else {
yading@10	141 off = maxval;
yading@10	142 }
yading@10	143 for (i = 0; i < size; i += dim) {
yading@10	144 const float *vec;
yading@10	145 int *quants = s->qcoefs + i;
yading@10	146 int curidx = 0;
yading@10	147 int curbits;
yading@10	148 float rd = 0.0f;
yading@10	149 for (j = 0; j < dim; j++) {
yading@10	150 curidx *= range;
yading@10	151 curidx += quants[j] + off;
yading@10	152 }
yading@10	153 curbits = ff_aac_spectral_bits[cb-1][curidx];
yading@10	154 vec = &ff_aac_codebook_vectors[cb-1][curidx*dim];
yading@10	155 if (BT_UNSIGNED) {
yading@10	156 for (j = 0; j < dim; j++) {
yading@10	157 float t = fabsf(in[i+j]);
yading@10	158 float di;
yading@10	159 if (BT_ESC && vec[j] == 64.0f) { //FIXME: slow
yading@10	160 if (t >= CLIPPED_ESCAPE) {
yading@10	161 di = t - CLIPPED_ESCAPE;
yading@10	162 curbits += 21;
yading@10	163 } else {
yading@10	164 int c = av_clip(quant(t, Q), 0, 8191);
yading@10	165 di = t - ccbrtf(c)IQ;
yading@10	166 curbits += av_log2(c)*2 - 4 + 1;
yading@10	167 }
yading@10	168 } else {
yading@10	169 di = t - vec[j]*IQ;
yading@10	170 }
yading@10	171 if (vec[j] != 0.0f)
yading@10	172 curbits++;
yading@10	173 rd += di*di;
yading@10	174 }
yading@10	175 } else {
yading@10	176 for (j = 0; j < dim; j++) {
yading@10	177 float di = in[i+j] - vec[j]*IQ;
yading@10	178 rd += di*di;
yading@10	179 }
yading@10	180 }
yading@10	181 cost += rd * lambda + curbits;
yading@10	182 resbits += curbits;
yading@10	183 if (cost >= uplim)
yading@10	184 return uplim;
yading@10	185 if (pb) {
yading@10	186 put_bits(pb, ff_aac_spectral_bits[cb-1][curidx], ff_aac_spectral_codes[cb-1][curidx]);
yading@10	187 if (BT_UNSIGNED)
yading@10	188 for (j = 0; j < dim; j++)
yading@10	189 if (ff_aac_codebook_vectors[cb-1][curidx*dim+j] != 0.0f)
yading@10	190 put_bits(pb, 1, in[i+j] < 0.0f);
yading@10	191 if (BT_ESC) {
yading@10	192 for (j = 0; j < 2; j++) {
yading@10	193 if (ff_aac_codebook_vectors[cb-1][curidx*2+j] == 64.0f) {
yading@10	194 int coef = av_clip(quant(fabsf(in[i+j]), Q), 0, 8191);
yading@10	195 int len = av_log2(coef);
yading@10	196
yading@10	197 put_bits(pb, len - 4 + 1, (1 << (len - 4 + 1)) - 2);
yading@10	198 put_bits(pb, len, coef & ((1 << len) - 1));
yading@10	199 }
yading@10	200 }
yading@10	201 }
yading@10	202 }
yading@10	203 }
yading@10	204
yading@10	205 if (bits)
yading@10	206 *bits = resbits;
yading@10	207 return cost;
yading@10	208 }
yading@10	209
yading@10	210 #define QUANTIZE_AND_ENCODE_BAND_COST_FUNC(NAME, BT_ZERO, BT_UNSIGNED, BT_PAIR, BT_ESC) \
yading@10	211 static float quantize_and_encode_band_cost_ ## NAME( \
yading@10	212 struct AACEncContext *s, \
yading@10	213 PutBitContext pb, const float in, \
yading@10	214 const float *scaled, int size, int scale_idx, \
yading@10	215 int cb, const float lambda, const float uplim, \
yading@10	216 int *bits) { \
yading@10	217 return quantize_and_encode_band_cost_template( \
yading@10	218 s, pb, in, scaled, size, scale_idx, \
yading@10	219 BT_ESC ? ESC_BT : cb, lambda, uplim, bits, \
yading@10	220 BT_ZERO, BT_UNSIGNED, BT_PAIR, BT_ESC); \
yading@10	221 }
yading@10	222
yading@10	223 QUANTIZE_AND_ENCODE_BAND_COST_FUNC(ZERO, 1, 0, 0, 0)
yading@10	224 QUANTIZE_AND_ENCODE_BAND_COST_FUNC(SQUAD, 0, 0, 0, 0)
yading@10	225 QUANTIZE_AND_ENCODE_BAND_COST_FUNC(UQUAD, 0, 1, 0, 0)
yading@10	226 QUANTIZE_AND_ENCODE_BAND_COST_FUNC(SPAIR, 0, 0, 1, 0)
yading@10	227 QUANTIZE_AND_ENCODE_BAND_COST_FUNC(UPAIR, 0, 1, 1, 0)
yading@10	228 QUANTIZE_AND_ENCODE_BAND_COST_FUNC(ESC, 0, 1, 1, 1)
yading@10	229
yading@10	230 static float (*const quantize_and_encode_band_cost_arr[])(
yading@10	231 struct AACEncContext *s,
yading@10	232 PutBitContext pb, const float in,
yading@10	233 const float *scaled, int size, int scale_idx,
yading@10	234 int cb, const float lambda, const float uplim,
yading@10	235 int *bits) = {
yading@10	236 quantize_and_encode_band_cost_ZERO,
yading@10	237 quantize_and_encode_band_cost_SQUAD,
yading@10	238 quantize_and_encode_band_cost_SQUAD,
yading@10	239 quantize_and_encode_band_cost_UQUAD,
yading@10	240 quantize_and_encode_band_cost_UQUAD,
yading@10	241 quantize_and_encode_band_cost_SPAIR,
yading@10	242 quantize_and_encode_band_cost_SPAIR,
yading@10	243 quantize_and_encode_band_cost_UPAIR,
yading@10	244 quantize_and_encode_band_cost_UPAIR,
yading@10	245 quantize_and_encode_band_cost_UPAIR,
yading@10	246 quantize_and_encode_band_cost_UPAIR,
yading@10	247 quantize_and_encode_band_cost_ESC,
yading@10	248 };
yading@10	249
yading@10	250 #define quantize_and_encode_band_cost( \
yading@10	251 s, pb, in, scaled, size, scale_idx, cb, \
yading@10	252 lambda, uplim, bits) \
yading@10	253 quantize_and_encode_band_cost_arr[cb]( \
yading@10	254 s, pb, in, scaled, size, scale_idx, cb, \
yading@10	255 lambda, uplim, bits)
yading@10	256
yading@10	257 static float quantize_band_cost(struct AACEncContext s, const float in,
yading@10	258 const float *scaled, int size, int scale_idx,
yading@10	259 int cb, const float lambda, const float uplim,
yading@10	260 int *bits)
yading@10	261 {
yading@10	262 return quantize_and_encode_band_cost(s, NULL, in, scaled, size, scale_idx,
yading@10	263 cb, lambda, uplim, bits);
yading@10	264 }
yading@10	265
yading@10	266 static void quantize_and_encode_band(struct AACEncContext s, PutBitContext pb,
yading@10	267 const float *in, int size, int scale_idx,
yading@10	268 int cb, const float lambda)
yading@10	269 {
yading@10	270 quantize_and_encode_band_cost(s, pb, in, NULL, size, scale_idx, cb, lambda,
yading@10	271 INFINITY, NULL);
yading@10	272 }
yading@10	273
yading@10	274 static float find_max_val(int group_len, int swb_size, const float *scaled) {
yading@10	275 float maxval = 0.0f;
yading@10	276 int w2, i;
yading@10	277 for (w2 = 0; w2 < group_len; w2++) {
yading@10	278 for (i = 0; i < swb_size; i++) {
yading@10	279 maxval = FFMAX(maxval, scaled[w2*128+i]);
yading@10	280 }
yading@10	281 }
yading@10	282 return maxval;
yading@10	283 }
yading@10	284
yading@10	285 static int find_min_book(float maxval, int sf) {
yading@10	286 float Q = ff_aac_pow2sf_tab[POW_SF2_ZERO - sf + SCALE_ONE_POS - SCALE_DIV_512];
yading@10	287 float Q34 = sqrtf(Q * sqrtf(Q));
yading@10	288 int qmaxval, cb;
yading@10	289 qmaxval = maxval * Q34 + 0.4054f;
yading@10	290 if (qmaxval == 0) cb = 0;
yading@10	291 else if (qmaxval == 1) cb = 1;
yading@10	292 else if (qmaxval == 2) cb = 3;
yading@10	293 else if (qmaxval <= 4) cb = 5;
yading@10	294 else if (qmaxval <= 7) cb = 7;
yading@10	295 else if (qmaxval <= 12) cb = 9;
yading@10	296 else cb = 11;
yading@10	297 return cb;
yading@10	298 }
yading@10	299
yading@10	300 /**
yading@10	301 * structure used in optimal codebook search
yading@10	302 */
yading@10	303 typedef struct BandCodingPath {
yading@10	304 int prev_idx; ///< pointer to the previous path point
yading@10	305 float cost; ///< path cost
yading@10	306 int run;
yading@10	307 } BandCodingPath;
yading@10	308
yading@10	309 /**
yading@10	310 * Encode band info for single window group bands.
yading@10	311 */
yading@10	312 static void encode_window_bands_info(AACEncContext s, SingleChannelElement sce,
yading@10	313 int win, int group_len, const float lambda)
yading@10	314 {
yading@10	315 BandCodingPath path[120][12];
yading@10	316 int w, swb, cb, start, size;
yading@10	317 int i, j;
yading@10	318 const int max_sfb = sce->ics.max_sfb;
yading@10	319 const int run_bits = sce->ics.num_windows == 1 ? 5 : 3;
yading@10	320 const int run_esc = (1 << run_bits) - 1;
yading@10	321 int idx, ppos, count;
yading@10	322 int stackrun[120], stackcb[120], stack_len;
yading@10	323 float next_minrd = INFINITY;
yading@10	324 int next_mincb = 0;
yading@10	325
yading@10	326 abs_pow34_v(s->scoefs, sce->coeffs, 1024);
yading@10	327 start = win*128;
yading@10	328 for (cb = 0; cb < 12; cb++) {
yading@10	329 path[0][cb].cost = 0.0f;
yading@10	330 path[0][cb].prev_idx = -1;
yading@10	331 path[0][cb].run = 0;
yading@10	332 }
yading@10	333 for (swb = 0; swb < max_sfb; swb++) {
yading@10	334 size = sce->ics.swb_sizes[swb];
yading@10	335 if (sce->zeroes[win*16 + swb]) {
yading@10	336 for (cb = 0; cb < 12; cb++) {
yading@10	337 path[swb+1][cb].prev_idx = cb;
yading@10	338 path[swb+1][cb].cost = path[swb][cb].cost;
yading@10	339 path[swb+1][cb].run = path[swb][cb].run + 1;
yading@10	340 }
yading@10	341 } else {
yading@10	342 float minrd = next_minrd;
yading@10	343 int mincb = next_mincb;
yading@10	344 next_minrd = INFINITY;
yading@10	345 next_mincb = 0;
yading@10	346 for (cb = 0; cb < 12; cb++) {
yading@10	347 float cost_stay_here, cost_get_here;
yading@10	348 float rd = 0.0f;
yading@10	349 for (w = 0; w < group_len; w++) {
yading@10	350 FFPsyBand band = &s->psy.ch[s->cur_channel].psy_bands[(win+w)16+swb];
yading@10	351 rd += quantize_band_cost(s, sce->coeffs + start + w*128,
yading@10	352 s->scoefs + start + w*128, size,
yading@10	353 sce->sf_idx[(win+w)*16+swb], cb,
yading@10	354 lambda / band->threshold, INFINITY, NULL);
yading@10	355 }
yading@10	356 cost_stay_here = path[swb][cb].cost + rd;
yading@10	357 cost_get_here = minrd + rd + run_bits + 4;
yading@10	358 if ( run_value_bits[sce->ics.num_windows == 8][path[swb][cb].run]
yading@10	359 != run_value_bits[sce->ics.num_windows == 8][path[swb][cb].run+1])
yading@10	360 cost_stay_here += run_bits;
yading@10	361 if (cost_get_here < cost_stay_here) {
yading@10	362 path[swb+1][cb].prev_idx = mincb;
yading@10	363 path[swb+1][cb].cost = cost_get_here;
yading@10	364 path[swb+1][cb].run = 1;
yading@10	365 } else {
yading@10	366 path[swb+1][cb].prev_idx = cb;
yading@10	367 path[swb+1][cb].cost = cost_stay_here;
yading@10	368 path[swb+1][cb].run = path[swb][cb].run + 1;
yading@10	369 }
yading@10	370 if (path[swb+1][cb].cost < next_minrd) {
yading@10	371 next_minrd = path[swb+1][cb].cost;
yading@10	372 next_mincb = cb;
yading@10	373 }
yading@10	374 }
yading@10	375 }
yading@10	376 start += sce->ics.swb_sizes[swb];
yading@10	377 }
yading@10	378
yading@10	379 //convert resulting path from backward-linked list
yading@10	380 stack_len = 0;
yading@10	381 idx = 0;
yading@10	382 for (cb = 1; cb < 12; cb++)
yading@10	383 if (path[max_sfb][cb].cost < path[max_sfb][idx].cost)
yading@10	384 idx = cb;
yading@10	385 ppos = max_sfb;
yading@10	386 while (ppos > 0) {
yading@10	387 cb = idx;
yading@10	388 stackrun[stack_len] = path[ppos][cb].run;
yading@10	389 stackcb [stack_len] = cb;
yading@10	390 idx = path[ppos-path[ppos][cb].run+1][cb].prev_idx;
yading@10	391 ppos -= path[ppos][cb].run;
yading@10	392 stack_len++;
yading@10	393 }
yading@10	394 //perform actual band info encoding
yading@10	395 start = 0;
yading@10	396 for (i = stack_len - 1; i >= 0; i--) {
yading@10	397 put_bits(&s->pb, 4, stackcb[i]);
yading@10	398 count = stackrun[i];
yading@10	399 memset(sce->zeroes + win*16 + start, !stackcb[i], count);
yading@10	400 //XXX: memset when band_type is also uint8_t
yading@10	401 for (j = 0; j < count; j++) {
yading@10	402 sce->band_type[win*16 + start] = stackcb[i];
yading@10	403 start++;
yading@10	404 }
yading@10	405 while (count >= run_esc) {
yading@10	406 put_bits(&s->pb, run_bits, run_esc);
yading@10	407 count -= run_esc;
yading@10	408 }
yading@10	409 put_bits(&s->pb, run_bits, count);
yading@10	410 }
yading@10	411 }
yading@10	412
yading@10	413 static void codebook_trellis_rate(AACEncContext s, SingleChannelElement sce,
yading@10	414 int win, int group_len, const float lambda)
yading@10	415 {
yading@10	416 BandCodingPath path[120][12];
yading@10	417 int w, swb, cb, start, size;
yading@10	418 int i, j;
yading@10	419 const int max_sfb = sce->ics.max_sfb;
yading@10	420 const int run_bits = sce->ics.num_windows == 1 ? 5 : 3;
yading@10	421 const int run_esc = (1 << run_bits) - 1;
yading@10	422 int idx, ppos, count;
yading@10	423 int stackrun[120], stackcb[120], stack_len;
yading@10	424 float next_minbits = INFINITY;
yading@10	425 int next_mincb = 0;
yading@10	426
yading@10	427 abs_pow34_v(s->scoefs, sce->coeffs, 1024);
yading@10	428 start = win*128;
yading@10	429 for (cb = 0; cb < 12; cb++) {
yading@10	430 path[0][cb].cost = run_bits+4;
yading@10	431 path[0][cb].prev_idx = -1;
yading@10	432 path[0][cb].run = 0;
yading@10	433 }
yading@10	434 for (swb = 0; swb < max_sfb; swb++) {
yading@10	435 size = sce->ics.swb_sizes[swb];
yading@10	436 if (sce->zeroes[win*16 + swb]) {
yading@10	437 float cost_stay_here = path[swb][0].cost;
yading@10	438 float cost_get_here = next_minbits + run_bits + 4;
yading@10	439 if ( run_value_bits[sce->ics.num_windows == 8][path[swb][0].run]
yading@10	440 != run_value_bits[sce->ics.num_windows == 8][path[swb][0].run+1])
yading@10	441 cost_stay_here += run_bits;
yading@10	442 if (cost_get_here < cost_stay_here) {
yading@10	443 path[swb+1][0].prev_idx = next_mincb;
yading@10	444 path[swb+1][0].cost = cost_get_here;
yading@10	445 path[swb+1][0].run = 1;
yading@10	446 } else {
yading@10	447 path[swb+1][0].prev_idx = 0;
yading@10	448 path[swb+1][0].cost = cost_stay_here;
yading@10	449 path[swb+1][0].run = path[swb][0].run + 1;
yading@10	450 }
yading@10	451 next_minbits = path[swb+1][0].cost;
yading@10	452 next_mincb = 0;
yading@10	453 for (cb = 1; cb < 12; cb++) {
yading@10	454 path[swb+1][cb].cost = 61450;
yading@10	455 path[swb+1][cb].prev_idx = -1;
yading@10	456 path[swb+1][cb].run = 0;
yading@10	457 }
yading@10	458 } else {
yading@10	459 float minbits = next_minbits;
yading@10	460 int mincb = next_mincb;
yading@10	461 int startcb = sce->band_type[win*16+swb];
yading@10	462 next_minbits = INFINITY;
yading@10	463 next_mincb = 0;
yading@10	464 for (cb = 0; cb < startcb; cb++) {
yading@10	465 path[swb+1][cb].cost = 61450;
yading@10	466 path[swb+1][cb].prev_idx = -1;
yading@10	467 path[swb+1][cb].run = 0;
yading@10	468 }
yading@10	469 for (cb = startcb; cb < 12; cb++) {
yading@10	470 float cost_stay_here, cost_get_here;
yading@10	471 float bits = 0.0f;
yading@10	472 for (w = 0; w < group_len; w++) {
yading@10	473 bits += quantize_band_cost(s, sce->coeffs + start + w*128,
yading@10	474 s->scoefs + start + w*128, size,
yading@10	475 sce->sf_idx[(win+w)*16+swb], cb,
yading@10	476 0, INFINITY, NULL);
yading@10	477 }
yading@10	478 cost_stay_here = path[swb][cb].cost + bits;
yading@10	479 cost_get_here = minbits + bits + run_bits + 4;
yading@10	480 if ( run_value_bits[sce->ics.num_windows == 8][path[swb][cb].run]
yading@10	481 != run_value_bits[sce->ics.num_windows == 8][path[swb][cb].run+1])
yading@10	482 cost_stay_here += run_bits;
yading@10	483 if (cost_get_here < cost_stay_here) {
yading@10	484 path[swb+1][cb].prev_idx = mincb;
yading@10	485 path[swb+1][cb].cost = cost_get_here;
yading@10	486 path[swb+1][cb].run = 1;
yading@10	487 } else {
yading@10	488 path[swb+1][cb].prev_idx = cb;
yading@10	489 path[swb+1][cb].cost = cost_stay_here;
yading@10	490 path[swb+1][cb].run = path[swb][cb].run + 1;
yading@10	491 }
yading@10	492 if (path[swb+1][cb].cost < next_minbits) {
yading@10	493 next_minbits = path[swb+1][cb].cost;
yading@10	494 next_mincb = cb;
yading@10	495 }
yading@10	496 }
yading@10	497 }
yading@10	498 start += sce->ics.swb_sizes[swb];
yading@10	499 }
yading@10	500
yading@10	501 //convert resulting path from backward-linked list
yading@10	502 stack_len = 0;
yading@10	503 idx = 0;
yading@10	504 for (cb = 1; cb < 12; cb++)
yading@10	505 if (path[max_sfb][cb].cost < path[max_sfb][idx].cost)
yading@10	506 idx = cb;
yading@10	507 ppos = max_sfb;
yading@10	508 while (ppos > 0) {
yading@10	509 av_assert1(idx >= 0);
yading@10	510 cb = idx;
yading@10	511 stackrun[stack_len] = path[ppos][cb].run;
yading@10	512 stackcb [stack_len] = cb;
yading@10	513 idx = path[ppos-path[ppos][cb].run+1][cb].prev_idx;
yading@10	514 ppos -= path[ppos][cb].run;
yading@10	515 stack_len++;
yading@10	516 }
yading@10	517 //perform actual band info encoding
yading@10	518 start = 0;
yading@10	519 for (i = stack_len - 1; i >= 0; i--) {
yading@10	520 put_bits(&s->pb, 4, stackcb[i]);
yading@10	521 count = stackrun[i];
yading@10	522 memset(sce->zeroes + win*16 + start, !stackcb[i], count);
yading@10	523 //XXX: memset when band_type is also uint8_t
yading@10	524 for (j = 0; j < count; j++) {
yading@10	525 sce->band_type[win*16 + start] = stackcb[i];
yading@10	526 start++;
yading@10	527 }
yading@10	528 while (count >= run_esc) {
yading@10	529 put_bits(&s->pb, run_bits, run_esc);
yading@10	530 count -= run_esc;
yading@10	531 }
yading@10	532 put_bits(&s->pb, run_bits, count);
yading@10	533 }
yading@10	534 }
yading@10	535
yading@10	536 /** Return the minimum scalefactor where the quantized coef does not clip. */
yading@10	537 static av_always_inline uint8_t coef2minsf(float coef) {
yading@10	538 return av_clip_uint8(log2f(coef)*4 - 69 + SCALE_ONE_POS - SCALE_DIV_512);
yading@10	539 }
yading@10	540
yading@10	541 /** Return the maximum scalefactor where the quantized coef is not zero. */
yading@10	542 static av_always_inline uint8_t coef2maxsf(float coef) {
yading@10	543 return av_clip_uint8(log2f(coef)*4 + 6 + SCALE_ONE_POS - SCALE_DIV_512);
yading@10	544 }
yading@10	545
yading@10	546 typedef struct TrellisPath {
yading@10	547 float cost;
yading@10	548 int prev;
yading@10	549 } TrellisPath;
yading@10	550
yading@10	551 #define TRELLIS_STAGES 121
yading@10	552 #define TRELLIS_STATES (SCALE_MAX_DIFF+1)
yading@10	553
yading@10	554 static void search_for_quantizers_anmr(AVCodecContext avctx, AACEncContext s,
yading@10	555 SingleChannelElement *sce,
yading@10	556 const float lambda)
yading@10	557 {
yading@10	558 int q, w, w2, g, start = 0;
yading@10	559 int i, j;
yading@10	560 int idx;
yading@10	561 TrellisPath paths[TRELLIS_STAGES][TRELLIS_STATES];
yading@10	562 int bandaddr[TRELLIS_STAGES];
yading@10	563 int minq;
yading@10	564 float mincost;
yading@10	565 float q0f = FLT_MAX, q1f = 0.0f, qnrgf = 0.0f;
yading@10	566 int q0, q1, qcnt = 0;
yading@10	567
yading@10	568 for (i = 0; i < 1024; i++) {
yading@10	569 float t = fabsf(sce->coeffs[i]);
yading@10	570 if (t > 0.0f) {
yading@10	571 q0f = FFMIN(q0f, t);
yading@10	572 q1f = FFMAX(q1f, t);
yading@10	573 qnrgf += t*t;
yading@10	574 qcnt++;
yading@10	575 }
yading@10	576 }
yading@10	577
yading@10	578 if (!qcnt) {
yading@10	579 memset(sce->sf_idx, 0, sizeof(sce->sf_idx));
yading@10	580 memset(sce->zeroes, 1, sizeof(sce->zeroes));
yading@10	581 return;
yading@10	582 }
yading@10	583
yading@10	584 //minimum scalefactor index is when minimum nonzero coefficient after quantizing is not clipped
yading@10	585 q0 = coef2minsf(q0f);
yading@10	586 //maximum scalefactor index is when maximum coefficient after quantizing is still not zero
yading@10	587 q1 = coef2maxsf(q1f);
yading@10	588 if (q1 - q0 > 60) {
yading@10	589 int q0low = q0;
yading@10	590 int q1high = q1;
yading@10	591 //minimum scalefactor index is when maximum nonzero coefficient after quantizing is not clipped
yading@10	592 int qnrg = av_clip_uint8(log2f(sqrtf(qnrgf/qcnt))*4 - 31 + SCALE_ONE_POS - SCALE_DIV_512);
yading@10	593 q1 = qnrg + 30;
yading@10	594 q0 = qnrg - 30;
yading@10	595 if (q0 < q0low) {
yading@10	596 q1 += q0low - q0;
yading@10	597 q0 = q0low;
yading@10	598 } else if (q1 > q1high) {
yading@10	599 q0 -= q1 - q1high;
yading@10	600 q1 = q1high;
yading@10	601 }
yading@10	602 }
yading@10	603
yading@10	604 for (i = 0; i < TRELLIS_STATES; i++) {
yading@10	605 paths[0][i].cost = 0.0f;
yading@10	606 paths[0][i].prev = -1;
yading@10	607 }
yading@10	608 for (j = 1; j < TRELLIS_STAGES; j++) {
yading@10	609 for (i = 0; i < TRELLIS_STATES; i++) {
yading@10	610 paths[j][i].cost = INFINITY;
yading@10	611 paths[j][i].prev = -2;
yading@10	612 }
yading@10	613 }
yading@10	614 idx = 1;
yading@10	615 abs_pow34_v(s->scoefs, sce->coeffs, 1024);
yading@10	616 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	617 start = w*128;
yading@10	618 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	619 const float *coefs = sce->coeffs + start;
yading@10	620 float qmin, qmax;
yading@10	621 int nz = 0;
yading@10	622
yading@10	623 bandaddr[idx] = w * 16 + g;
yading@10	624 qmin = INT_MAX;
yading@10	625 qmax = 0.0f;
yading@10	626 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	627 FFPsyBand band = &s->psy.ch[s->cur_channel].psy_bands[(w+w2)16+g];
yading@10	628 if (band->energy <= band->threshold \|\| band->threshold == 0.0f) {
yading@10	629 sce->zeroes[(w+w2)*16+g] = 1;
yading@10	630 continue;
yading@10	631 }
yading@10	632 sce->zeroes[(w+w2)*16+g] = 0;
yading@10	633 nz = 1;
yading@10	634 for (i = 0; i < sce->ics.swb_sizes[g]; i++) {
yading@10	635 float t = fabsf(coefs[w2*128+i]);
yading@10	636 if (t > 0.0f)
yading@10	637 qmin = FFMIN(qmin, t);
yading@10	638 qmax = FFMAX(qmax, t);
yading@10	639 }
yading@10	640 }
yading@10	641 if (nz) {
yading@10	642 int minscale, maxscale;
yading@10	643 float minrd = INFINITY;
yading@10	644 float maxval;
yading@10	645 //minimum scalefactor index is when minimum nonzero coefficient after quantizing is not clipped
yading@10	646 minscale = coef2minsf(qmin);
yading@10	647 //maximum scalefactor index is when maximum coefficient after quantizing is still not zero
yading@10	648 maxscale = coef2maxsf(qmax);
yading@10	649 minscale = av_clip(minscale - q0, 0, TRELLIS_STATES - 1);
yading@10	650 maxscale = av_clip(maxscale - q0, 0, TRELLIS_STATES);
yading@10	651 maxval = find_max_val(sce->ics.group_len[w], sce->ics.swb_sizes[g], s->scoefs+start);
yading@10	652 for (q = minscale; q < maxscale; q++) {
yading@10	653 float dist = 0;
yading@10	654 int cb = find_min_book(maxval, sce->sf_idx[w*16+g]);
yading@10	655 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	656 FFPsyBand band = &s->psy.ch[s->cur_channel].psy_bands[(w+w2)16+g];
yading@10	657 dist += quantize_band_cost(s, coefs + w2128, s->scoefs + start + w2128, sce->ics.swb_sizes[g],
yading@10	658 q + q0, cb, lambda / band->threshold, INFINITY, NULL);
yading@10	659 }
yading@10	660 minrd = FFMIN(minrd, dist);
yading@10	661
yading@10	662 for (i = 0; i < q1 - q0; i++) {
yading@10	663 float cost;
yading@10	664 cost = paths[idx - 1][i].cost + dist
yading@10	665 + ff_aac_scalefactor_bits[q - i + SCALE_DIFF_ZERO];
yading@10	666 if (cost < paths[idx][q].cost) {
yading@10	667 paths[idx][q].cost = cost;
yading@10	668 paths[idx][q].prev = i;
yading@10	669 }
yading@10	670 }
yading@10	671 }
yading@10	672 } else {
yading@10	673 for (q = 0; q < q1 - q0; q++) {
yading@10	674 paths[idx][q].cost = paths[idx - 1][q].cost + 1;
yading@10	675 paths[idx][q].prev = q;
yading@10	676 }
yading@10	677 }
yading@10	678 sce->zeroes[w*16+g] = !nz;
yading@10	679 start += sce->ics.swb_sizes[g];
yading@10	680 idx++;
yading@10	681 }
yading@10	682 }
yading@10	683 idx--;
yading@10	684 mincost = paths[idx][0].cost;
yading@10	685 minq = 0;
yading@10	686 for (i = 1; i < TRELLIS_STATES; i++) {
yading@10	687 if (paths[idx][i].cost < mincost) {
yading@10	688 mincost = paths[idx][i].cost;
yading@10	689 minq = i;
yading@10	690 }
yading@10	691 }
yading@10	692 while (idx) {
yading@10	693 sce->sf_idx[bandaddr[idx]] = minq + q0;
yading@10	694 minq = paths[idx][minq].prev;
yading@10	695 idx--;
yading@10	696 }
yading@10	697 //set the same quantizers inside window groups
yading@10	698 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w])
yading@10	699 for (g = 0; g < sce->ics.num_swb; g++)
yading@10	700 for (w2 = 1; w2 < sce->ics.group_len[w]; w2++)
yading@10	701 sce->sf_idx[(w+w2)16+g] = sce->sf_idx[w16+g];
yading@10	702 }
yading@10	703
yading@10	704 /**
yading@10	705 * two-loop quantizers search taken from ISO 13818-7 Appendix C
yading@10	706 */
yading@10	707 static void search_for_quantizers_twoloop(AVCodecContext *avctx,
yading@10	708 AACEncContext *s,
yading@10	709 SingleChannelElement *sce,
yading@10	710 const float lambda)
yading@10	711 {
yading@10	712 int start = 0, i, w, w2, g;
yading@10	713 int destbits = avctx->bit_rate * 1024.0 / avctx->sample_rate / avctx->channels;
yading@10	714 float dists[128] = { 0 }, uplims[128];
yading@10	715 float maxvals[128];
yading@10	716 int fflag, minscaler;
yading@10	717 int its = 0;
yading@10	718 int allz = 0;
yading@10	719 float minthr = INFINITY;
yading@10	720
yading@10	721 // for values above this the decoder might end up in an endless loop
yading@10	722 // due to always having more bits than what can be encoded.
yading@10	723 destbits = FFMIN(destbits, 5800);
yading@10	724 //XXX: some heuristic to determine initial quantizers will reduce search time
yading@10	725 //determine zero bands and upper limits
yading@10	726 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	727 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	728 int nz = 0;
yading@10	729 float uplim = 0.0f;
yading@10	730 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	731 FFPsyBand band = &s->psy.ch[s->cur_channel].psy_bands[(w+w2)16+g];
yading@10	732 uplim += band->threshold;
yading@10	733 if (band->energy <= band->threshold \|\| band->threshold == 0.0f) {
yading@10	734 sce->zeroes[(w+w2)*16+g] = 1;
yading@10	735 continue;
yading@10	736 }
yading@10	737 nz = 1;
yading@10	738 }
yading@10	739 uplims[w16+g] = uplim 512;
yading@10	740 sce->zeroes[w*16+g] = !nz;
yading@10	741 if (nz)
yading@10	742 minthr = FFMIN(minthr, uplim);
yading@10	743 allz \|= nz;
yading@10	744 }
yading@10	745 }
yading@10	746 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	747 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	748 if (sce->zeroes[w*16+g]) {
yading@10	749 sce->sf_idx[w*16+g] = SCALE_ONE_POS;
yading@10	750 continue;
yading@10	751 }
yading@10	752 sce->sf_idx[w16+g] = SCALE_ONE_POS + FFMIN(log2f(uplims[w16+g]/minthr)*4,59);
yading@10	753 }
yading@10	754 }
yading@10	755
yading@10	756 if (!allz)
yading@10	757 return;
yading@10	758 abs_pow34_v(s->scoefs, sce->coeffs, 1024);
yading@10	759
yading@10	760 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	761 start = w*128;
yading@10	762 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	763 const float *scaled = s->scoefs + start;
yading@10	764 maxvals[w*16+g] = find_max_val(sce->ics.group_len[w], sce->ics.swb_sizes[g], scaled);
yading@10	765 start += sce->ics.swb_sizes[g];
yading@10	766 }
yading@10	767 }
yading@10	768
yading@10	769 //perform two-loop search
yading@10	770 //outer loop - improve quality
yading@10	771 do {
yading@10	772 int tbits, qstep;
yading@10	773 minscaler = sce->sf_idx[0];
yading@10	774 //inner loop - quantize spectrum to fit into given number of bits
yading@10	775 qstep = its ? 1 : 32;
yading@10	776 do {
yading@10	777 int prev = -1;
yading@10	778 tbits = 0;
yading@10	779 fflag = 0;
yading@10	780 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	781 start = w*128;
yading@10	782 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	783 const float *coefs = sce->coeffs + start;
yading@10	784 const float *scaled = s->scoefs + start;
yading@10	785 int bits = 0;
yading@10	786 int cb;
yading@10	787 float dist = 0.0f;
yading@10	788
yading@10	789 if (sce->zeroes[w16+g] \|\| sce->sf_idx[w16+g] >= 218) {
yading@10	790 start += sce->ics.swb_sizes[g];
yading@10	791 continue;
yading@10	792 }
yading@10	793 minscaler = FFMIN(minscaler, sce->sf_idx[w*16+g]);
yading@10	794 cb = find_min_book(maxvals[w16+g], sce->sf_idx[w16+g]);
yading@10	795 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	796 int b;
yading@10	797 dist += quantize_band_cost(s, coefs + w2*128,
yading@10	798 scaled + w2*128,
yading@10	799 sce->ics.swb_sizes[g],
yading@10	800 sce->sf_idx[w*16+g],
yading@10	801 cb,
yading@10	802 1.0f,
yading@10	803 INFINITY,
yading@10	804 &b);
yading@10	805 bits += b;
yading@10	806 }
yading@10	807 dists[w*16+g] = dist - bits;
yading@10	808 if (prev != -1) {
yading@10	809 bits += ff_aac_scalefactor_bits[sce->sf_idx[w*16+g] - prev + SCALE_DIFF_ZERO];
yading@10	810 }
yading@10	811 tbits += bits;
yading@10	812 start += sce->ics.swb_sizes[g];
yading@10	813 prev = sce->sf_idx[w*16+g];
yading@10	814 }
yading@10	815 }
yading@10	816 if (tbits > destbits) {
yading@10	817 for (i = 0; i < 128; i++)
yading@10	818 if (sce->sf_idx[i] < 218 - qstep)
yading@10	819 sce->sf_idx[i] += qstep;
yading@10	820 } else {
yading@10	821 for (i = 0; i < 128; i++)
yading@10	822 if (sce->sf_idx[i] > 60 - qstep)
yading@10	823 sce->sf_idx[i] -= qstep;
yading@10	824 }
yading@10	825 qstep >>= 1;
yading@10	826 if (!qstep && tbits > destbits*1.02 && sce->sf_idx[0] < 217)
yading@10	827 qstep = 1;
yading@10	828 } while (qstep);
yading@10	829
yading@10	830 fflag = 0;
yading@10	831 minscaler = av_clip(minscaler, 60, 255 - SCALE_MAX_DIFF);
yading@10	832 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	833 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	834 int prevsc = sce->sf_idx[w*16+g];
yading@10	835 if (dists[w16+g] > uplims[w16+g] && sce->sf_idx[w*16+g] > 60) {
yading@10	836 if (find_min_book(maxvals[w16+g], sce->sf_idx[w16+g]-1))
yading@10	837 sce->sf_idx[w*16+g]--;
yading@10	838 else //Try to make sure there is some energy in every band
yading@10	839 sce->sf_idx[w*16+g]-=2;
yading@10	840 }
yading@10	841 sce->sf_idx[w16+g] = av_clip(sce->sf_idx[w16+g], minscaler, minscaler + SCALE_MAX_DIFF);
yading@10	842 sce->sf_idx[w16+g] = FFMIN(sce->sf_idx[w16+g], 219);
yading@10	843 if (sce->sf_idx[w*16+g] != prevsc)
yading@10	844 fflag = 1;
yading@10	845 sce->band_type[w16+g] = find_min_book(maxvals[w16+g], sce->sf_idx[w*16+g]);
yading@10	846 }
yading@10	847 }
yading@10	848 its++;
yading@10	849 } while (fflag && its < 10);
yading@10	850 }
yading@10	851
yading@10	852 static void search_for_quantizers_faac(AVCodecContext avctx, AACEncContext s,
yading@10	853 SingleChannelElement *sce,
yading@10	854 const float lambda)
yading@10	855 {
yading@10	856 int start = 0, i, w, w2, g;
yading@10	857 float uplim[128], maxq[128];
yading@10	858 int minq, maxsf;
yading@10	859 float distfact = ((sce->ics.num_windows > 1) ? 85.80 : 147.84) / lambda;
yading@10	860 int last = 0, lastband = 0, curband = 0;
yading@10	861 float avg_energy = 0.0;
yading@10	862 if (sce->ics.num_windows == 1) {
yading@10	863 start = 0;
yading@10	864 for (i = 0; i < 1024; i++) {
yading@10	865 if (i - start >= sce->ics.swb_sizes[curband]) {
yading@10	866 start += sce->ics.swb_sizes[curband];
yading@10	867 curband++;
yading@10	868 }
yading@10	869 if (sce->coeffs[i]) {
yading@10	870 avg_energy += sce->coeffs[i] * sce->coeffs[i];
yading@10	871 last = i;
yading@10	872 lastband = curband;
yading@10	873 }
yading@10	874 }
yading@10	875 } else {
yading@10	876 for (w = 0; w < 8; w++) {
yading@10	877 const float coeffs = sce->coeffs + w128;
yading@10	878 curband = start = 0;
yading@10	879 for (i = 0; i < 128; i++) {
yading@10	880 if (i - start >= sce->ics.swb_sizes[curband]) {
yading@10	881 start += sce->ics.swb_sizes[curband];
yading@10	882 curband++;
yading@10	883 }
yading@10	884 if (coeffs[i]) {
yading@10	885 avg_energy += coeffs[i] * coeffs[i];
yading@10	886 last = FFMAX(last, i);
yading@10	887 lastband = FFMAX(lastband, curband);
yading@10	888 }
yading@10	889 }
yading@10	890 }
yading@10	891 }
yading@10	892 last++;
yading@10	893 avg_energy /= last;
yading@10	894 if (avg_energy == 0.0f) {
yading@10	895 for (i = 0; i < FF_ARRAY_ELEMS(sce->sf_idx); i++)
yading@10	896 sce->sf_idx[i] = SCALE_ONE_POS;
yading@10	897 return;
yading@10	898 }
yading@10	899 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	900 start = w*128;
yading@10	901 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	902 float *coefs = sce->coeffs + start;
yading@10	903 const int size = sce->ics.swb_sizes[g];
yading@10	904 int start2 = start, end2 = start + size, peakpos = start;
yading@10	905 float maxval = -1, thr = 0.0f, t;
yading@10	906 maxq[w*16+g] = 0.0f;
yading@10	907 if (g > lastband) {
yading@10	908 maxq[w*16+g] = 0.0f;
yading@10	909 start += size;
yading@10	910 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++)
yading@10	911 memset(coefs + w2128, 0, sizeof(coefs[0])size);
yading@10	912 continue;
yading@10	913 }
yading@10	914 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	915 for (i = 0; i < size; i++) {
yading@10	916 float t = coefs[w2128+i]coefs[w2*128+i];
yading@10	917 maxq[w16+g] = FFMAX(maxq[w16+g], fabsf(coefs[w2*128 + i]));
yading@10	918 thr += t;
yading@10	919 if (sce->ics.num_windows == 1 && maxval < t) {
yading@10	920 maxval = t;
yading@10	921 peakpos = start+i;
yading@10	922 }
yading@10	923 }
yading@10	924 }
yading@10	925 if (sce->ics.num_windows == 1) {
yading@10	926 start2 = FFMAX(peakpos - 2, start2);
yading@10	927 end2 = FFMIN(peakpos + 3, end2);
yading@10	928 } else {
yading@10	929 start2 -= start;
yading@10	930 end2 -= start;
yading@10	931 }
yading@10	932 start += size;
yading@10	933 thr = pow(thr / (avg_energy * (end2 - start2)), 0.3 + 0.1*(lastband - g) / lastband);
yading@10	934 t = 1.0 - (1.0 * start2 / last);
yading@10	935 uplim[w16+g] = distfact / (1.4 thr + ttt + 0.075);
yading@10	936 }
yading@10	937 }
yading@10	938 memset(sce->sf_idx, 0, sizeof(sce->sf_idx));
yading@10	939 abs_pow34_v(s->scoefs, sce->coeffs, 1024);
yading@10	940 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	941 start = w*128;
yading@10	942 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	943 const float *coefs = sce->coeffs + start;
yading@10	944 const float *scaled = s->scoefs + start;
yading@10	945 const int size = sce->ics.swb_sizes[g];
yading@10	946 int scf, prev_scf, step;
yading@10	947 int min_scf = -1, max_scf = 256;
yading@10	948 float curdiff;
yading@10	949 if (maxq[w*16+g] < 21.544) {
yading@10	950 sce->zeroes[w*16+g] = 1;
yading@10	951 start += size;
yading@10	952 continue;
yading@10	953 }
yading@10	954 sce->zeroes[w*16+g] = 0;
yading@10	955 scf = prev_scf = av_clip(SCALE_ONE_POS - SCALE_DIV_512 - log2f(1/maxq[w16+g])16/3, 60, 218);
yading@10	956 step = 16;
yading@10	957 for (;;) {
yading@10	958 float dist = 0.0f;
yading@10	959 int quant_max;
yading@10	960
yading@10	961 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	962 int b;
yading@10	963 dist += quantize_band_cost(s, coefs + w2*128,
yading@10	964 scaled + w2*128,
yading@10	965 sce->ics.swb_sizes[g],
yading@10	966 scf,
yading@10	967 ESC_BT,
yading@10	968 lambda,
yading@10	969 INFINITY,
yading@10	970 &b);
yading@10	971 dist -= b;
yading@10	972 }
yading@10	973 dist *= 1.0f / 512.0f / lambda;
yading@10	974 quant_max = quant(maxq[w*16+g], ff_aac_pow2sf_tab[POW_SF2_ZERO - scf + SCALE_ONE_POS - SCALE_DIV_512]);
yading@10	975 if (quant_max >= 8191) { // too much, return to the previous quantizer
yading@10	976 sce->sf_idx[w*16+g] = prev_scf;
yading@10	977 break;
yading@10	978 }
yading@10	979 prev_scf = scf;
yading@10	980 curdiff = fabsf(dist - uplim[w*16+g]);
yading@10	981 if (curdiff <= 1.0f)
yading@10	982 step = 0;
yading@10	983 else
yading@10	984 step = log2f(curdiff);
yading@10	985 if (dist > uplim[w*16+g])
yading@10	986 step = -step;
yading@10	987 scf += step;
yading@10	988 scf = av_clip_uint8(scf);
yading@10	989 step = scf - prev_scf;
yading@10	990 if (FFABS(step) <= 1 \|\| (step > 0 && scf >= max_scf) \|\| (step < 0 && scf <= min_scf)) {
yading@10	991 sce->sf_idx[w*16+g] = av_clip(scf, min_scf, max_scf);
yading@10	992 break;
yading@10	993 }
yading@10	994 if (step > 0)
yading@10	995 min_scf = prev_scf;
yading@10	996 else
yading@10	997 max_scf = prev_scf;
yading@10	998 }
yading@10	999 start += size;
yading@10	1000 }
yading@10	1001 }
yading@10	1002 minq = sce->sf_idx[0] ? sce->sf_idx[0] : INT_MAX;
yading@10	1003 for (i = 1; i < 128; i++) {
yading@10	1004 if (!sce->sf_idx[i])
yading@10	1005 sce->sf_idx[i] = sce->sf_idx[i-1];
yading@10	1006 else
yading@10	1007 minq = FFMIN(minq, sce->sf_idx[i]);
yading@10	1008 }
yading@10	1009 if (minq == INT_MAX)
yading@10	1010 minq = 0;
yading@10	1011 minq = FFMIN(minq, SCALE_MAX_POS);
yading@10	1012 maxsf = FFMIN(minq + SCALE_MAX_DIFF, SCALE_MAX_POS);
yading@10	1013 for (i = 126; i >= 0; i--) {
yading@10	1014 if (!sce->sf_idx[i])
yading@10	1015 sce->sf_idx[i] = sce->sf_idx[i+1];
yading@10	1016 sce->sf_idx[i] = av_clip(sce->sf_idx[i], minq, maxsf);
yading@10	1017 }
yading@10	1018 }
yading@10	1019
yading@10	1020 static void search_for_quantizers_fast(AVCodecContext avctx, AACEncContext s,
yading@10	1021 SingleChannelElement *sce,
yading@10	1022 const float lambda)
yading@10	1023 {
yading@10	1024 int i, w, w2, g;
yading@10	1025 int minq = 255;
yading@10	1026
yading@10	1027 memset(sce->sf_idx, 0, sizeof(sce->sf_idx));
yading@10	1028 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w]) {
yading@10	1029 for (g = 0; g < sce->ics.num_swb; g++) {
yading@10	1030 for (w2 = 0; w2 < sce->ics.group_len[w]; w2++) {
yading@10	1031 FFPsyBand band = &s->psy.ch[s->cur_channel].psy_bands[(w+w2)16+g];
yading@10	1032 if (band->energy <= band->threshold) {
yading@10	1033 sce->sf_idx[(w+w2)*16+g] = 218;
yading@10	1034 sce->zeroes[(w+w2)*16+g] = 1;
yading@10	1035 } else {
yading@10	1036 sce->sf_idx[(w+w2)*16+g] = av_clip(SCALE_ONE_POS - SCALE_DIV_512 + log2f(band->threshold), 80, 218);
yading@10	1037 sce->zeroes[(w+w2)*16+g] = 0;
yading@10	1038 }
yading@10	1039 minq = FFMIN(minq, sce->sf_idx[(w+w2)*16+g]);
yading@10	1040 }
yading@10	1041 }
yading@10	1042 }
yading@10	1043 for (i = 0; i < 128; i++) {
yading@10	1044 sce->sf_idx[i] = 140;
yading@10	1045 //av_clip(sce->sf_idx[i], minq, minq + SCALE_MAX_DIFF - 1);
yading@10	1046 }
yading@10	1047 //set the same quantizers inside window groups
yading@10	1048 for (w = 0; w < sce->ics.num_windows; w += sce->ics.group_len[w])
yading@10	1049 for (g = 0; g < sce->ics.num_swb; g++)
yading@10	1050 for (w2 = 1; w2 < sce->ics.group_len[w]; w2++)
yading@10	1051 sce->sf_idx[(w+w2)16+g] = sce->sf_idx[w16+g];
yading@10	1052 }
yading@10	1053
yading@10	1054 static void search_for_ms(AACEncContext s, ChannelElement cpe,
yading@10	1055 const float lambda)
yading@10	1056 {
yading@10	1057 int start = 0, i, w, w2, g;
yading@10	1058 float M[128], S[128];
yading@10	1059 float L34 = s->scoefs, R34 = s->scoefs + 128, M34 = s->scoefs + 1282, S34 = s->scoefs + 1283;
yading@10	1060 SingleChannelElement *sce0 = &cpe->ch[0];
yading@10	1061 SingleChannelElement *sce1 = &cpe->ch[1];
yading@10	1062 if (!cpe->common_window)
yading@10	1063 return;
yading@10	1064 for (w = 0; w < sce0->ics.num_windows; w += sce0->ics.group_len[w]) {
yading@10	1065 for (g = 0; g < sce0->ics.num_swb; g++) {
yading@10	1066 if (!cpe->ch[0].zeroes[w16+g] && !cpe->ch[1].zeroes[w16+g]) {
yading@10	1067 float dist1 = 0.0f, dist2 = 0.0f;
yading@10	1068 for (w2 = 0; w2 < sce0->ics.group_len[w]; w2++) {
yading@10	1069 FFPsyBand band0 = &s->psy.ch[s->cur_channel+0].psy_bands[(w+w2)16+g];
yading@10	1070 FFPsyBand band1 = &s->psy.ch[s->cur_channel+1].psy_bands[(w+w2)16+g];
yading@10	1071 float minthr = FFMIN(band0->threshold, band1->threshold);
yading@10	1072 float maxthr = FFMAX(band0->threshold, band1->threshold);
yading@10	1073 for (i = 0; i < sce0->ics.swb_sizes[g]; i++) {
yading@10	1074 M[i] = (sce0->coeffs[start+w2*128+i]
yading@10	1075 + sce1->coeffs[start+w2128+i]) 0.5;
yading@10	1076 S[i] = M[i]
yading@10	1077 - sce1->coeffs[start+w2*128+i];
yading@10	1078 }
yading@10	1079 abs_pow34_v(L34, sce0->coeffs+start+w2*128, sce0->ics.swb_sizes[g]);
yading@10	1080 abs_pow34_v(R34, sce1->coeffs+start+w2*128, sce0->ics.swb_sizes[g]);
yading@10	1081 abs_pow34_v(M34, M, sce0->ics.swb_sizes[g]);
yading@10	1082 abs_pow34_v(S34, S, sce0->ics.swb_sizes[g]);
yading@10	1083 dist1 += quantize_band_cost(s, sce0->coeffs + start + w2*128,
yading@10	1084 L34,
yading@10	1085 sce0->ics.swb_sizes[g],
yading@10	1086 sce0->sf_idx[(w+w2)*16+g],
yading@10	1087 sce0->band_type[(w+w2)*16+g],
yading@10	1088 lambda / band0->threshold, INFINITY, NULL);
yading@10	1089 dist1 += quantize_band_cost(s, sce1->coeffs + start + w2*128,
yading@10	1090 R34,
yading@10	1091 sce1->ics.swb_sizes[g],
yading@10	1092 sce1->sf_idx[(w+w2)*16+g],
yading@10	1093 sce1->band_type[(w+w2)*16+g],
yading@10	1094 lambda / band1->threshold, INFINITY, NULL);
yading@10	1095 dist2 += quantize_band_cost(s, M,
yading@10	1096 M34,
yading@10	1097 sce0->ics.swb_sizes[g],
yading@10	1098 sce0->sf_idx[(w+w2)*16+g],
yading@10	1099 sce0->band_type[(w+w2)*16+g],
yading@10	1100 lambda / maxthr, INFINITY, NULL);
yading@10	1101 dist2 += quantize_band_cost(s, S,
yading@10	1102 S34,
yading@10	1103 sce1->ics.swb_sizes[g],
yading@10	1104 sce1->sf_idx[(w+w2)*16+g],
yading@10	1105 sce1->band_type[(w+w2)*16+g],
yading@10	1106 lambda / minthr, INFINITY, NULL);
yading@10	1107 }
yading@10	1108 cpe->ms_mask[w*16+g] = dist2 < dist1;
yading@10	1109 }
yading@10	1110 start += sce0->ics.swb_sizes[g];
yading@10	1111 }
yading@10	1112 }
yading@10	1113 }
yading@10	1114
yading@10	1115 AACCoefficientsEncoder ff_aac_coders[AAC_CODER_NB] = {
yading@10	1116 {
yading@10	1117 search_for_quantizers_faac,
yading@10	1118 encode_window_bands_info,
yading@10	1119 quantize_and_encode_band,
yading@10	1120 search_for_ms,
yading@10	1121 },
yading@10	1122 {
yading@10	1123 search_for_quantizers_anmr,
yading@10	1124 encode_window_bands_info,
yading@10	1125 quantize_and_encode_band,
yading@10	1126 search_for_ms,
yading@10	1127 },
yading@10	1128 {
yading@10	1129 search_for_quantizers_twoloop,
yading@10	1130 codebook_trellis_rate,
yading@10	1131 quantize_and_encode_band,
yading@10	1132 search_for_ms,
yading@10	1133 },
yading@10	1134 {
yading@10	1135 search_for_quantizers_fast,
yading@10	1136 encode_window_bands_info,
yading@10	1137 quantize_and_encode_band,
yading@10	1138 search_for_ms,
yading@10	1139 },
yading@10	1140 };

Mercurial > hg > pmhd

annotate ffmpeg/libavcodec/aaccoder.c @ 13:844d341cf643 tip