pmhd: ffmpeg/libavcodec/faandct.c annotate

annotate ffmpeg/libavcodec/faandct.c @ 13:844d341cf643 tip

Back up before ISMIR

author	Yading Song <yading.song@eecs.qmul.ac.uk>
date	Thu, 31 Oct 2013 13:17:06 +0000
parents	6840f77b83aa
children

rev	line source
yading@10	1 /*
yading@10	2 * Floating point AAN DCT
yading@10	3 * this implementation is based upon the IJG integer AAN DCT (see jfdctfst.c)
yading@10	4 *
yading@10	5 * Copyright (c) 2003 Michael Niedermayer <michaelni@gmx.at>
yading@10	6 * Copyright (c) 2003 Roman Shaposhnik
yading@10	7 *
yading@10	8 * Permission to use, copy, modify, and/or distribute this software for any
yading@10	9 * purpose with or without fee is hereby granted, provided that the above
yading@10	10 * copyright notice and this permission notice appear in all copies.
yading@10	11 *
yading@10	12 * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
yading@10	13 * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
yading@10	14 * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
yading@10	15 * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
yading@10	16 * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
yading@10	17 * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
yading@10	18 * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
yading@10	19 */
yading@10	20
yading@10	21 /**
yading@10	22 * @file
yading@10	23 * @brief
yading@10	24 * Floating point AAN DCT
yading@10	25 * @author Michael Niedermayer <michaelni@gmx.at>
yading@10	26 */
yading@10	27
yading@10	28 #include "faandct.h"
yading@10	29 #include "libavutil/internal.h"
yading@10	30 #include "libavutil/libm.h"
yading@10	31
yading@10	32 #define FLOAT float
yading@10	33
yading@10	34 //numbers generated by simple c code (not as accurate as they could be)
yading@10	35 /*
yading@10	36 for(i=0; i<8; i++){
yading@10	37 printf("#define B%d %1.20llf\n", i, (long double)1.0/(cosl(iacosl(-1.0)/(long double)16.0)sqrtl(2)));
yading@10	38 }
yading@10	39 */
yading@10	40 #define B0 1.00000000000000000000
yading@10	41 #define B1 0.72095982200694791383 // (cos(pi*1/16)sqrt(2))^-1
yading@10	42 #define B2 0.76536686473017954350 // (cos(pi*2/16)sqrt(2))^-1
yading@10	43 #define B3 0.85043009476725644878 // (cos(pi*3/16)sqrt(2))^-1
yading@10	44 #define B4 1.00000000000000000000 // (cos(pi*4/16)sqrt(2))^-1
yading@10	45 #define B5 1.27275858057283393842 // (cos(pi*5/16)sqrt(2))^-1
yading@10	46 #define B6 1.84775906502257351242 // (cos(pi*6/16)sqrt(2))^-1
yading@10	47 #define B7 3.62450978541155137218 // (cos(pi*7/16)sqrt(2))^-1
yading@10	48
yading@10	49
yading@10	50 #define A1 0.70710678118654752438 // cos(pi*4/16)
yading@10	51 #define A2 0.54119610014619698435 // cos(pi*6/16)sqrt(2)
yading@10	52 #define A5 0.38268343236508977170 // cos(pi*6/16)
yading@10	53 #define A4 1.30656296487637652774 // cos(pi*2/16)sqrt(2)
yading@10	54
yading@10	55 static const FLOAT postscale[64]={
yading@10	56 B0B0, B0B1, B0B2, B0B3, B0B4, B0B5, B0B6, B0B7,
yading@10	57 B1B0, B1B1, B1B2, B1B3, B1B4, B1B5, B1B6, B1B7,
yading@10	58 B2B0, B2B1, B2B2, B2B3, B2B4, B2B5, B2B6, B2B7,
yading@10	59 B3B0, B3B1, B3B2, B3B3, B3B4, B3B5, B3B6, B3B7,
yading@10	60 B4B0, B4B1, B4B2, B4B3, B4B4, B4B5, B4B6, B4B7,
yading@10	61 B5B0, B5B1, B5B2, B5B3, B5B4, B5B5, B5B6, B5B7,
yading@10	62 B6B0, B6B1, B6B2, B6B3, B6B4, B6B5, B6B6, B6B7,
yading@10	63 B7B0, B7B1, B7B2, B7B3, B7B4, B7B5, B7B6, B7B7,
yading@10	64 };
yading@10	65
yading@10	66 static av_always_inline void row_fdct(FLOAT temp[64], int16_t *data)
yading@10	67 {
yading@10	68 FLOAT tmp0, tmp1, tmp2, tmp3, tmp4, tmp5, tmp6, tmp7;
yading@10	69 FLOAT tmp10, tmp11, tmp12, tmp13;
yading@10	70 FLOAT z2, z4, z11, z13;
yading@10	71 FLOAT av_unused z5;
yading@10	72 int i;
yading@10	73
yading@10	74 for (i=0; i<8*8; i+=8) {
yading@10	75 tmp0= data[0 + i] + data[7 + i];
yading@10	76 tmp7= data[0 + i] - data[7 + i];
yading@10	77 tmp1= data[1 + i] + data[6 + i];
yading@10	78 tmp6= data[1 + i] - data[6 + i];
yading@10	79 tmp2= data[2 + i] + data[5 + i];
yading@10	80 tmp5= data[2 + i] - data[5 + i];
yading@10	81 tmp3= data[3 + i] + data[4 + i];
yading@10	82 tmp4= data[3 + i] - data[4 + i];
yading@10	83
yading@10	84 tmp10= tmp0 + tmp3;
yading@10	85 tmp13= tmp0 - tmp3;
yading@10	86 tmp11= tmp1 + tmp2;
yading@10	87 tmp12= tmp1 - tmp2;
yading@10	88
yading@10	89 temp[0 + i]= tmp10 + tmp11;
yading@10	90 temp[4 + i]= tmp10 - tmp11;
yading@10	91
yading@10	92 tmp12 += tmp13;
yading@10	93 tmp12 *= A1;
yading@10	94 temp[2 + i]= tmp13 + tmp12;
yading@10	95 temp[6 + i]= tmp13 - tmp12;
yading@10	96
yading@10	97 tmp4 += tmp5;
yading@10	98 tmp5 += tmp6;
yading@10	99 tmp6 += tmp7;
yading@10	100
yading@10	101 #if 0
yading@10	102 z5= (tmp4 - tmp6) * A5;
yading@10	103 z2= tmp4*A2 + z5;
yading@10	104 z4= tmp6*A4 + z5;
yading@10	105 #else
yading@10	106 z2= tmp4(A2+A5) - tmp6A5;
yading@10	107 z4= tmp6(A4-A5) + tmp4A5;
yading@10	108 #endif
yading@10	109 tmp5*=A1;
yading@10	110
yading@10	111 z11= tmp7 + tmp5;
yading@10	112 z13= tmp7 - tmp5;
yading@10	113
yading@10	114 temp[5 + i]= z13 + z2;
yading@10	115 temp[3 + i]= z13 - z2;
yading@10	116 temp[1 + i]= z11 + z4;
yading@10	117 temp[7 + i]= z11 - z4;
yading@10	118 }
yading@10	119 }
yading@10	120
yading@10	121 void ff_faandct(int16_t *data)
yading@10	122 {
yading@10	123 FLOAT tmp0, tmp1, tmp2, tmp3, tmp4, tmp5, tmp6, tmp7;
yading@10	124 FLOAT tmp10, tmp11, tmp12, tmp13;
yading@10	125 FLOAT z2, z4, z11, z13;
yading@10	126 FLOAT av_unused z5;
yading@10	127 FLOAT temp[64];
yading@10	128 int i;
yading@10	129
yading@10	130 emms_c();
yading@10	131
yading@10	132 row_fdct(temp, data);
yading@10	133
yading@10	134 for (i=0; i<8; i++) {
yading@10	135 tmp0= temp[80 + i] + temp[87 + i];
yading@10	136 tmp7= temp[80 + i] - temp[87 + i];
yading@10	137 tmp1= temp[81 + i] + temp[86 + i];
yading@10	138 tmp6= temp[81 + i] - temp[86 + i];
yading@10	139 tmp2= temp[82 + i] + temp[85 + i];
yading@10	140 tmp5= temp[82 + i] - temp[85 + i];
yading@10	141 tmp3= temp[83 + i] + temp[84 + i];
yading@10	142 tmp4= temp[83 + i] - temp[84 + i];
yading@10	143
yading@10	144 tmp10= tmp0 + tmp3;
yading@10	145 tmp13= tmp0 - tmp3;
yading@10	146 tmp11= tmp1 + tmp2;
yading@10	147 tmp12= tmp1 - tmp2;
yading@10	148
yading@10	149 data[80 + i]= lrintf(postscale[80 + i] * (tmp10 + tmp11));
yading@10	150 data[84 + i]= lrintf(postscale[84 + i] * (tmp10 - tmp11));
yading@10	151
yading@10	152 tmp12 += tmp13;
yading@10	153 tmp12 *= A1;
yading@10	154 data[82 + i]= lrintf(postscale[82 + i] * (tmp13 + tmp12));
yading@10	155 data[86 + i]= lrintf(postscale[86 + i] * (tmp13 - tmp12));
yading@10	156
yading@10	157 tmp4 += tmp5;
yading@10	158 tmp5 += tmp6;
yading@10	159 tmp6 += tmp7;
yading@10	160
yading@10	161 #if 0
yading@10	162 z5= (tmp4 - tmp6) * A5;
yading@10	163 z2= tmp4*A2 + z5;
yading@10	164 z4= tmp6*A4 + z5;
yading@10	165 #else
yading@10	166 z2= tmp4(A2+A5) - tmp6A5;
yading@10	167 z4= tmp6(A4-A5) + tmp4A5;
yading@10	168 #endif
yading@10	169 tmp5*=A1;
yading@10	170
yading@10	171 z11= tmp7 + tmp5;
yading@10	172 z13= tmp7 - tmp5;
yading@10	173
yading@10	174 data[85 + i]= lrintf(postscale[85 + i] * (z13 + z2));
yading@10	175 data[83 + i]= lrintf(postscale[83 + i] * (z13 - z2));
yading@10	176 data[81 + i]= lrintf(postscale[81 + i] * (z11 + z4));
yading@10	177 data[87 + i]= lrintf(postscale[87 + i] * (z11 - z4));
yading@10	178 }
yading@10	179 }
yading@10	180
yading@10	181 void ff_faandct248(int16_t *data)
yading@10	182 {
yading@10	183 FLOAT tmp0, tmp1, tmp2, tmp3, tmp4, tmp5, tmp6, tmp7;
yading@10	184 FLOAT tmp10, tmp11, tmp12, tmp13;
yading@10	185 FLOAT temp[64];
yading@10	186 int i;
yading@10	187
yading@10	188 emms_c();
yading@10	189
yading@10	190 row_fdct(temp, data);
yading@10	191
yading@10	192 for (i=0; i<8; i++) {
yading@10	193 tmp0 = temp[80 + i] + temp[81 + i];
yading@10	194 tmp1 = temp[82 + i] + temp[83 + i];
yading@10	195 tmp2 = temp[84 + i] + temp[85 + i];
yading@10	196 tmp3 = temp[86 + i] + temp[87 + i];
yading@10	197 tmp4 = temp[80 + i] - temp[81 + i];
yading@10	198 tmp5 = temp[82 + i] - temp[83 + i];
yading@10	199 tmp6 = temp[84 + i] - temp[85 + i];
yading@10	200 tmp7 = temp[86 + i] - temp[87 + i];
yading@10	201
yading@10	202 tmp10 = tmp0 + tmp3;
yading@10	203 tmp11 = tmp1 + tmp2;
yading@10	204 tmp12 = tmp1 - tmp2;
yading@10	205 tmp13 = tmp0 - tmp3;
yading@10	206
yading@10	207 data[80 + i] = lrintf(postscale[80 + i] * (tmp10 + tmp11));
yading@10	208 data[84 + i] = lrintf(postscale[84 + i] * (tmp10 - tmp11));
yading@10	209
yading@10	210 tmp12 += tmp13;
yading@10	211 tmp12 *= A1;
yading@10	212 data[82 + i] = lrintf(postscale[82 + i] * (tmp13 + tmp12));
yading@10	213 data[86 + i] = lrintf(postscale[86 + i] * (tmp13 - tmp12));
yading@10	214
yading@10	215 tmp10 = tmp4 + tmp7;
yading@10	216 tmp11 = tmp5 + tmp6;
yading@10	217 tmp12 = tmp5 - tmp6;
yading@10	218 tmp13 = tmp4 - tmp7;
yading@10	219
yading@10	220 data[81 + i] = lrintf(postscale[80 + i] * (tmp10 + tmp11));
yading@10	221 data[85 + i] = lrintf(postscale[84 + i] * (tmp10 - tmp11));
yading@10	222
yading@10	223 tmp12 += tmp13;
yading@10	224 tmp12 *= A1;
yading@10	225 data[83 + i] = lrintf(postscale[82 + i] * (tmp13 + tmp12));
yading@10	226 data[87 + i] = lrintf(postscale[86 + i] * (tmp13 - tmp12));
yading@10	227 }
yading@10	228 }

Mercurial > hg > pmhd

annotate ffmpeg/libavcodec/faandct.c @ 13:844d341cf643 tip