pmhd: ffmpeg/libavcodec/h264qpel

annotate ffmpeg/libavcodec/h264qpel_template.c @ 13:844d341cf643 tip

Back up before ISMIR

author	Yading Song <yading.song@eecs.qmul.ac.uk>
date	Thu, 31 Oct 2013 13:17:06 +0000
parents	6840f77b83aa
children

rev	line source
yading@10	1 /*
yading@10	2 * H.26L/H.264/AVC/JVT/14496-10/... encoder/decoder
yading@10	3 * Copyright (c) 2003-2010 Michael Niedermayer <michaelni@gmx.at>
yading@10	4 *
yading@10	5 * This file is part of FFmpeg.
yading@10	6 *
yading@10	7 * FFmpeg is free software; you can redistribute it and/or
yading@10	8 * modify it under the terms of the GNU Lesser General Public
yading@10	9 * License as published by the Free Software Foundation; either
yading@10	10 * version 2.1 of the License, or (at your option) any later version.
yading@10	11 *
yading@10	12 * FFmpeg is distributed in the hope that it will be useful,
yading@10	13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
yading@10	14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
yading@10	15 * Lesser General Public License for more details.
yading@10	16 *
yading@10	17 * You should have received a copy of the GNU Lesser General Public
yading@10	18 * License along with FFmpeg; if not, write to the Free Software
yading@10	19 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
yading@10	20 */
yading@10	21
yading@10	22 #include "libavutil/common.h"
yading@10	23 #include "bit_depth_template.c"
yading@10	24 #include "hpel_template.c"
yading@10	25
yading@10	26 static inline void FUNC(copy_block2)(uint8_t dst, const uint8_t src, int dstStride, int srcStride, int h)
yading@10	27 {
yading@10	28 int i;
yading@10	29 for(i=0; i<h; i++)
yading@10	30 {
yading@10	31 AV_WN2P(dst , AV_RN2P(src ));
yading@10	32 dst+=dstStride;
yading@10	33 src+=srcStride;
yading@10	34 }
yading@10	35 }
yading@10	36
yading@10	37 static inline void FUNC(copy_block4)(uint8_t dst, const uint8_t src, int dstStride, int srcStride, int h)
yading@10	38 {
yading@10	39 int i;
yading@10	40 for(i=0; i<h; i++)
yading@10	41 {
yading@10	42 AV_WN4P(dst , AV_RN4P(src ));
yading@10	43 dst+=dstStride;
yading@10	44 src+=srcStride;
yading@10	45 }
yading@10	46 }
yading@10	47
yading@10	48 static inline void FUNC(copy_block8)(uint8_t dst, const uint8_t src, int dstStride, int srcStride, int h)
yading@10	49 {
yading@10	50 int i;
yading@10	51 for(i=0; i<h; i++)
yading@10	52 {
yading@10	53 AV_WN4P(dst , AV_RN4P(src ));
yading@10	54 AV_WN4P(dst+4sizeof(pixel), AV_RN4P(src+4sizeof(pixel)));
yading@10	55 dst+=dstStride;
yading@10	56 src+=srcStride;
yading@10	57 }
yading@10	58 }
yading@10	59
yading@10	60 static inline void FUNC(copy_block16)(uint8_t dst, const uint8_t src, int dstStride, int srcStride, int h)
yading@10	61 {
yading@10	62 int i;
yading@10	63 for(i=0; i<h; i++)
yading@10	64 {
yading@10	65 AV_WN4P(dst , AV_RN4P(src ));
yading@10	66 AV_WN4P(dst+ 4sizeof(pixel), AV_RN4P(src+ 4sizeof(pixel)));
yading@10	67 AV_WN4P(dst+ 8sizeof(pixel), AV_RN4P(src+ 8sizeof(pixel)));
yading@10	68 AV_WN4P(dst+12sizeof(pixel), AV_RN4P(src+12sizeof(pixel)));
yading@10	69 dst+=dstStride;
yading@10	70 src+=srcStride;
yading@10	71 }
yading@10	72 }
yading@10	73
yading@10	74 #define H264_LOWPASS(OPNAME, OP, OP2) \
yading@10	75 static av_unused void FUNC(OPNAME ## h264_qpel2_h_lowpass)(uint8_t p_dst, uint8_t p_src, int dstStride, int srcStride){\
yading@10	76 const int h=2;\
yading@10	77 INIT_CLIP\
yading@10	78 int i;\
yading@10	79 pixel dst = (pixel)p_dst;\
yading@10	80 pixel src = (pixel)p_src;\
yading@10	81 dstStride >>= sizeof(pixel)-1;\
yading@10	82 srcStride >>= sizeof(pixel)-1;\
yading@10	83 for(i=0; i<h; i++)\
yading@10	84 {\
yading@10	85 OP(dst[0], (src[0]+src[1])20 - (src[-1]+src[2])5 + (src[-2]+src[3]));\
yading@10	86 OP(dst[1], (src[1]+src[2])20 - (src[0 ]+src[3])5 + (src[-1]+src[4]));\
yading@10	87 dst+=dstStride;\
yading@10	88 src+=srcStride;\
yading@10	89 }\
yading@10	90 }\
yading@10	91 \
yading@10	92 static av_unused void FUNC(OPNAME ## h264_qpel2_v_lowpass)(uint8_t p_dst, uint8_t p_src, int dstStride, int srcStride){\
yading@10	93 const int w=2;\
yading@10	94 INIT_CLIP\
yading@10	95 int i;\
yading@10	96 pixel dst = (pixel)p_dst;\
yading@10	97 pixel src = (pixel)p_src;\
yading@10	98 dstStride >>= sizeof(pixel)-1;\
yading@10	99 srcStride >>= sizeof(pixel)-1;\
yading@10	100 for(i=0; i<w; i++)\
yading@10	101 {\
yading@10	102 const int srcB= src[-2*srcStride];\
yading@10	103 const int srcA= src[-1*srcStride];\
yading@10	104 const int src0= src[0 *srcStride];\
yading@10	105 const int src1= src[1 *srcStride];\
yading@10	106 const int src2= src[2 *srcStride];\
yading@10	107 const int src3= src[3 *srcStride];\
yading@10	108 const int src4= src[4 *srcStride];\
yading@10	109 OP(dst[0dstStride], (src0+src1)20 - (srcA+src2)*5 + (srcB+src3));\
yading@10	110 OP(dst[1dstStride], (src1+src2)20 - (src0+src3)*5 + (srcA+src4));\
yading@10	111 dst++;\
yading@10	112 src++;\
yading@10	113 }\
yading@10	114 }\
yading@10	115 \
yading@10	116 static av_unused void FUNC(OPNAME ## h264_qpel2_hv_lowpass)(uint8_t p_dst, pixeltmp tmp, uint8_t *p_src, int dstStride, int tmpStride, int srcStride){\
yading@10	117 const int h=2;\
yading@10	118 const int w=2;\
yading@10	119 const int pad = (BIT_DEPTH == 10) ? (-10 * ((1<<BIT_DEPTH)-1)) : 0;\
yading@10	120 INIT_CLIP\
yading@10	121 int i;\
yading@10	122 pixel dst = (pixel)p_dst;\
yading@10	123 pixel src = (pixel)p_src;\
yading@10	124 dstStride >>= sizeof(pixel)-1;\
yading@10	125 srcStride >>= sizeof(pixel)-1;\
yading@10	126 src -= 2*srcStride;\
yading@10	127 for(i=0; i<h+5; i++)\
yading@10	128 {\
yading@10	129 tmp[0]= (src[0]+src[1])20 - (src[-1]+src[2])5 + (src[-2]+src[3]) + pad;\
yading@10	130 tmp[1]= (src[1]+src[2])20 - (src[0 ]+src[3])5 + (src[-1]+src[4]) + pad;\
yading@10	131 tmp+=tmpStride;\
yading@10	132 src+=srcStride;\
yading@10	133 }\
yading@10	134 tmp -= tmpStride*(h+5-2);\
yading@10	135 for(i=0; i<w; i++)\
yading@10	136 {\
yading@10	137 const int tmpB= tmp[-2*tmpStride] - pad;\
yading@10	138 const int tmpA= tmp[-1*tmpStride] - pad;\
yading@10	139 const int tmp0= tmp[0 *tmpStride] - pad;\
yading@10	140 const int tmp1= tmp[1 *tmpStride] - pad;\
yading@10	141 const int tmp2= tmp[2 *tmpStride] - pad;\
yading@10	142 const int tmp3= tmp[3 *tmpStride] - pad;\
yading@10	143 const int tmp4= tmp[4 *tmpStride] - pad;\
yading@10	144 OP2(dst[0dstStride], (tmp0+tmp1)20 - (tmpA+tmp2)*5 + (tmpB+tmp3));\
yading@10	145 OP2(dst[1dstStride], (tmp1+tmp2)20 - (tmp0+tmp3)*5 + (tmpA+tmp4));\
yading@10	146 dst++;\
yading@10	147 tmp++;\
yading@10	148 }\
yading@10	149 }\
yading@10	150 static void FUNC(OPNAME ## h264_qpel4_h_lowpass)(uint8_t p_dst, uint8_t p_src, int dstStride, int srcStride){\
yading@10	151 const int h=4;\
yading@10	152 INIT_CLIP\
yading@10	153 int i;\
yading@10	154 pixel dst = (pixel)p_dst;\
yading@10	155 pixel src = (pixel)p_src;\
yading@10	156 dstStride >>= sizeof(pixel)-1;\
yading@10	157 srcStride >>= sizeof(pixel)-1;\
yading@10	158 for(i=0; i<h; i++)\
yading@10	159 {\
yading@10	160 OP(dst[0], (src[0]+src[1])20 - (src[-1]+src[2])5 + (src[-2]+src[3]));\
yading@10	161 OP(dst[1], (src[1]+src[2])20 - (src[0 ]+src[3])5 + (src[-1]+src[4]));\
yading@10	162 OP(dst[2], (src[2]+src[3])20 - (src[1 ]+src[4])5 + (src[0 ]+src[5]));\
yading@10	163 OP(dst[3], (src[3]+src[4])20 - (src[2 ]+src[5])5 + (src[1 ]+src[6]));\
yading@10	164 dst+=dstStride;\
yading@10	165 src+=srcStride;\
yading@10	166 }\
yading@10	167 }\
yading@10	168 \
yading@10	169 static void FUNC(OPNAME ## h264_qpel4_v_lowpass)(uint8_t p_dst, uint8_t p_src, int dstStride, int srcStride){\
yading@10	170 const int w=4;\
yading@10	171 INIT_CLIP\
yading@10	172 int i;\
yading@10	173 pixel dst = (pixel)p_dst;\
yading@10	174 pixel src = (pixel)p_src;\
yading@10	175 dstStride >>= sizeof(pixel)-1;\
yading@10	176 srcStride >>= sizeof(pixel)-1;\
yading@10	177 for(i=0; i<w; i++)\
yading@10	178 {\
yading@10	179 const int srcB= src[-2*srcStride];\
yading@10	180 const int srcA= src[-1*srcStride];\
yading@10	181 const int src0= src[0 *srcStride];\
yading@10	182 const int src1= src[1 *srcStride];\
yading@10	183 const int src2= src[2 *srcStride];\
yading@10	184 const int src3= src[3 *srcStride];\
yading@10	185 const int src4= src[4 *srcStride];\
yading@10	186 const int src5= src[5 *srcStride];\
yading@10	187 const int src6= src[6 *srcStride];\
yading@10	188 OP(dst[0dstStride], (src0+src1)20 - (srcA+src2)*5 + (srcB+src3));\
yading@10	189 OP(dst[1dstStride], (src1+src2)20 - (src0+src3)*5 + (srcA+src4));\
yading@10	190 OP(dst[2dstStride], (src2+src3)20 - (src1+src4)*5 + (src0+src5));\
yading@10	191 OP(dst[3dstStride], (src3+src4)20 - (src2+src5)*5 + (src1+src6));\
yading@10	192 dst++;\
yading@10	193 src++;\
yading@10	194 }\
yading@10	195 }\
yading@10	196 \
yading@10	197 static void FUNC(OPNAME ## h264_qpel4_hv_lowpass)(uint8_t p_dst, pixeltmp tmp, uint8_t *p_src, int dstStride, int tmpStride, int srcStride){\
yading@10	198 const int h=4;\
yading@10	199 const int w=4;\
yading@10	200 const int pad = (BIT_DEPTH == 10) ? (-10 * ((1<<BIT_DEPTH)-1)) : 0;\
yading@10	201 INIT_CLIP\
yading@10	202 int i;\
yading@10	203 pixel dst = (pixel)p_dst;\
yading@10	204 pixel src = (pixel)p_src;\
yading@10	205 dstStride >>= sizeof(pixel)-1;\
yading@10	206 srcStride >>= sizeof(pixel)-1;\
yading@10	207 src -= 2*srcStride;\
yading@10	208 for(i=0; i<h+5; i++)\
yading@10	209 {\
yading@10	210 tmp[0]= (src[0]+src[1])20 - (src[-1]+src[2])5 + (src[-2]+src[3]) + pad;\
yading@10	211 tmp[1]= (src[1]+src[2])20 - (src[0 ]+src[3])5 + (src[-1]+src[4]) + pad;\
yading@10	212 tmp[2]= (src[2]+src[3])20 - (src[1 ]+src[4])5 + (src[0 ]+src[5]) + pad;\
yading@10	213 tmp[3]= (src[3]+src[4])20 - (src[2 ]+src[5])5 + (src[1 ]+src[6]) + pad;\
yading@10	214 tmp+=tmpStride;\
yading@10	215 src+=srcStride;\
yading@10	216 }\
yading@10	217 tmp -= tmpStride*(h+5-2);\
yading@10	218 for(i=0; i<w; i++)\
yading@10	219 {\
yading@10	220 const int tmpB= tmp[-2*tmpStride] - pad;\
yading@10	221 const int tmpA= tmp[-1*tmpStride] - pad;\
yading@10	222 const int tmp0= tmp[0 *tmpStride] - pad;\
yading@10	223 const int tmp1= tmp[1 *tmpStride] - pad;\
yading@10	224 const int tmp2= tmp[2 *tmpStride] - pad;\
yading@10	225 const int tmp3= tmp[3 *tmpStride] - pad;\
yading@10	226 const int tmp4= tmp[4 *tmpStride] - pad;\
yading@10	227 const int tmp5= tmp[5 *tmpStride] - pad;\
yading@10	228 const int tmp6= tmp[6 *tmpStride] - pad;\
yading@10	229 OP2(dst[0dstStride], (tmp0+tmp1)20 - (tmpA+tmp2)*5 + (tmpB+tmp3));\
yading@10	230 OP2(dst[1dstStride], (tmp1+tmp2)20 - (tmp0+tmp3)*5 + (tmpA+tmp4));\
yading@10	231 OP2(dst[2dstStride], (tmp2+tmp3)20 - (tmp1+tmp4)*5 + (tmp0+tmp5));\
yading@10	232 OP2(dst[3dstStride], (tmp3+tmp4)20 - (tmp2+tmp5)*5 + (tmp1+tmp6));\
yading@10	233 dst++;\
yading@10	234 tmp++;\
yading@10	235 }\
yading@10	236 }\
yading@10	237 \
yading@10	238 static void FUNC(OPNAME ## h264_qpel8_h_lowpass)(uint8_t p_dst, uint8_t p_src, int dstStride, int srcStride){\
yading@10	239 const int h=8;\
yading@10	240 INIT_CLIP\
yading@10	241 int i;\
yading@10	242 pixel dst = (pixel)p_dst;\
yading@10	243 pixel src = (pixel)p_src;\
yading@10	244 dstStride >>= sizeof(pixel)-1;\
yading@10	245 srcStride >>= sizeof(pixel)-1;\
yading@10	246 for(i=0; i<h; i++)\
yading@10	247 {\
yading@10	248 OP(dst[0], (src[0]+src[1])20 - (src[-1]+src[2])5 + (src[-2]+src[3 ]));\
yading@10	249 OP(dst[1], (src[1]+src[2])20 - (src[0 ]+src[3])5 + (src[-1]+src[4 ]));\
yading@10	250 OP(dst[2], (src[2]+src[3])20 - (src[1 ]+src[4])5 + (src[0 ]+src[5 ]));\
yading@10	251 OP(dst[3], (src[3]+src[4])20 - (src[2 ]+src[5])5 + (src[1 ]+src[6 ]));\
yading@10	252 OP(dst[4], (src[4]+src[5])20 - (src[3 ]+src[6])5 + (src[2 ]+src[7 ]));\
yading@10	253 OP(dst[5], (src[5]+src[6])20 - (src[4 ]+src[7])5 + (src[3 ]+src[8 ]));\
yading@10	254 OP(dst[6], (src[6]+src[7])20 - (src[5 ]+src[8])5 + (src[4 ]+src[9 ]));\
yading@10	255 OP(dst[7], (src[7]+src[8])20 - (src[6 ]+src[9])5 + (src[5 ]+src[10]));\
yading@10	256 dst+=dstStride;\
yading@10	257 src+=srcStride;\
yading@10	258 }\
yading@10	259 }\
yading@10	260 \
yading@10	261 static void FUNC(OPNAME ## h264_qpel8_v_lowpass)(uint8_t p_dst, uint8_t p_src, int dstStride, int srcStride){\
yading@10	262 const int w=8;\
yading@10	263 INIT_CLIP\
yading@10	264 int i;\
yading@10	265 pixel dst = (pixel)p_dst;\
yading@10	266 pixel src = (pixel)p_src;\
yading@10	267 dstStride >>= sizeof(pixel)-1;\
yading@10	268 srcStride >>= sizeof(pixel)-1;\
yading@10	269 for(i=0; i<w; i++)\
yading@10	270 {\
yading@10	271 const int srcB= src[-2*srcStride];\
yading@10	272 const int srcA= src[-1*srcStride];\
yading@10	273 const int src0= src[0 *srcStride];\
yading@10	274 const int src1= src[1 *srcStride];\
yading@10	275 const int src2= src[2 *srcStride];\
yading@10	276 const int src3= src[3 *srcStride];\
yading@10	277 const int src4= src[4 *srcStride];\
yading@10	278 const int src5= src[5 *srcStride];\
yading@10	279 const int src6= src[6 *srcStride];\
yading@10	280 const int src7= src[7 *srcStride];\
yading@10	281 const int src8= src[8 *srcStride];\
yading@10	282 const int src9= src[9 *srcStride];\
yading@10	283 const int src10=src[10*srcStride];\
yading@10	284 OP(dst[0dstStride], (src0+src1)20 - (srcA+src2)*5 + (srcB+src3));\
yading@10	285 OP(dst[1dstStride], (src1+src2)20 - (src0+src3)*5 + (srcA+src4));\
yading@10	286 OP(dst[2dstStride], (src2+src3)20 - (src1+src4)*5 + (src0+src5));\
yading@10	287 OP(dst[3dstStride], (src3+src4)20 - (src2+src5)*5 + (src1+src6));\
yading@10	288 OP(dst[4dstStride], (src4+src5)20 - (src3+src6)*5 + (src2+src7));\
yading@10	289 OP(dst[5dstStride], (src5+src6)20 - (src4+src7)*5 + (src3+src8));\
yading@10	290 OP(dst[6dstStride], (src6+src7)20 - (src5+src8)*5 + (src4+src9));\
yading@10	291 OP(dst[7dstStride], (src7+src8)20 - (src6+src9)*5 + (src5+src10));\
yading@10	292 dst++;\
yading@10	293 src++;\
yading@10	294 }\
yading@10	295 }\
yading@10	296 \
yading@10	297 static void FUNC(OPNAME ## h264_qpel8_hv_lowpass)(uint8_t p_dst, pixeltmp tmp, uint8_t *p_src, int dstStride, int tmpStride, int srcStride){\
yading@10	298 const int h=8;\
yading@10	299 const int w=8;\
yading@10	300 const int pad = (BIT_DEPTH == 10) ? (-10 * ((1<<BIT_DEPTH)-1)) : 0;\
yading@10	301 INIT_CLIP\
yading@10	302 int i;\
yading@10	303 pixel dst = (pixel)p_dst;\
yading@10	304 pixel src = (pixel)p_src;\
yading@10	305 dstStride >>= sizeof(pixel)-1;\
yading@10	306 srcStride >>= sizeof(pixel)-1;\
yading@10	307 src -= 2*srcStride;\
yading@10	308 for(i=0; i<h+5; i++)\
yading@10	309 {\
yading@10	310 tmp[0]= (src[0]+src[1])20 - (src[-1]+src[2])5 + (src[-2]+src[3 ]) + pad;\
yading@10	311 tmp[1]= (src[1]+src[2])20 - (src[0 ]+src[3])5 + (src[-1]+src[4 ]) + pad;\
yading@10	312 tmp[2]= (src[2]+src[3])20 - (src[1 ]+src[4])5 + (src[0 ]+src[5 ]) + pad;\
yading@10	313 tmp[3]= (src[3]+src[4])20 - (src[2 ]+src[5])5 + (src[1 ]+src[6 ]) + pad;\
yading@10	314 tmp[4]= (src[4]+src[5])20 - (src[3 ]+src[6])5 + (src[2 ]+src[7 ]) + pad;\
yading@10	315 tmp[5]= (src[5]+src[6])20 - (src[4 ]+src[7])5 + (src[3 ]+src[8 ]) + pad;\
yading@10	316 tmp[6]= (src[6]+src[7])20 - (src[5 ]+src[8])5 + (src[4 ]+src[9 ]) + pad;\
yading@10	317 tmp[7]= (src[7]+src[8])20 - (src[6 ]+src[9])5 + (src[5 ]+src[10]) + pad;\
yading@10	318 tmp+=tmpStride;\
yading@10	319 src+=srcStride;\
yading@10	320 }\
yading@10	321 tmp -= tmpStride*(h+5-2);\
yading@10	322 for(i=0; i<w; i++)\
yading@10	323 {\
yading@10	324 const int tmpB= tmp[-2*tmpStride] - pad;\
yading@10	325 const int tmpA= tmp[-1*tmpStride] - pad;\
yading@10	326 const int tmp0= tmp[0 *tmpStride] - pad;\
yading@10	327 const int tmp1= tmp[1 *tmpStride] - pad;\
yading@10	328 const int tmp2= tmp[2 *tmpStride] - pad;\
yading@10	329 const int tmp3= tmp[3 *tmpStride] - pad;\
yading@10	330 const int tmp4= tmp[4 *tmpStride] - pad;\
yading@10	331 const int tmp5= tmp[5 *tmpStride] - pad;\
yading@10	332 const int tmp6= tmp[6 *tmpStride] - pad;\
yading@10	333 const int tmp7= tmp[7 *tmpStride] - pad;\
yading@10	334 const int tmp8= tmp[8 *tmpStride] - pad;\
yading@10	335 const int tmp9= tmp[9 *tmpStride] - pad;\
yading@10	336 const int tmp10=tmp[10*tmpStride] - pad;\
yading@10	337 OP2(dst[0dstStride], (tmp0+tmp1)20 - (tmpA+tmp2)*5 + (tmpB+tmp3));\
yading@10	338 OP2(dst[1dstStride], (tmp1+tmp2)20 - (tmp0+tmp3)*5 + (tmpA+tmp4));\
yading@10	339 OP2(dst[2dstStride], (tmp2+tmp3)20 - (tmp1+tmp4)*5 + (tmp0+tmp5));\
yading@10	340 OP2(dst[3dstStride], (tmp3+tmp4)20 - (tmp2+tmp5)*5 + (tmp1+tmp6));\
yading@10	341 OP2(dst[4dstStride], (tmp4+tmp5)20 - (tmp3+tmp6)*5 + (tmp2+tmp7));\
yading@10	342 OP2(dst[5dstStride], (tmp5+tmp6)20 - (tmp4+tmp7)*5 + (tmp3+tmp8));\
yading@10	343 OP2(dst[6dstStride], (tmp6+tmp7)20 - (tmp5+tmp8)*5 + (tmp4+tmp9));\
yading@10	344 OP2(dst[7dstStride], (tmp7+tmp8)20 - (tmp6+tmp9)*5 + (tmp5+tmp10));\
yading@10	345 dst++;\
yading@10	346 tmp++;\
yading@10	347 }\
yading@10	348 }\
yading@10	349 \
yading@10	350 static void FUNC(OPNAME ## h264_qpel16_v_lowpass)(uint8_t dst, uint8_t src, int dstStride, int srcStride){\
yading@10	351 FUNC(OPNAME ## h264_qpel8_v_lowpass)(dst , src , dstStride, srcStride);\
yading@10	352 FUNC(OPNAME ## h264_qpel8_v_lowpass)(dst+8sizeof(pixel), src+8sizeof(pixel), dstStride, srcStride);\
yading@10	353 src += 8*srcStride;\
yading@10	354 dst += 8*dstStride;\
yading@10	355 FUNC(OPNAME ## h264_qpel8_v_lowpass)(dst , src , dstStride, srcStride);\
yading@10	356 FUNC(OPNAME ## h264_qpel8_v_lowpass)(dst+8sizeof(pixel), src+8sizeof(pixel), dstStride, srcStride);\
yading@10	357 }\
yading@10	358 \
yading@10	359 static void FUNC(OPNAME ## h264_qpel16_h_lowpass)(uint8_t dst, uint8_t src, int dstStride, int srcStride){\
yading@10	360 FUNC(OPNAME ## h264_qpel8_h_lowpass)(dst , src , dstStride, srcStride);\
yading@10	361 FUNC(OPNAME ## h264_qpel8_h_lowpass)(dst+8sizeof(pixel), src+8sizeof(pixel), dstStride, srcStride);\
yading@10	362 src += 8*srcStride;\
yading@10	363 dst += 8*dstStride;\
yading@10	364 FUNC(OPNAME ## h264_qpel8_h_lowpass)(dst , src , dstStride, srcStride);\
yading@10	365 FUNC(OPNAME ## h264_qpel8_h_lowpass)(dst+8sizeof(pixel), src+8sizeof(pixel), dstStride, srcStride);\
yading@10	366 }\
yading@10	367 \
yading@10	368 static void FUNC(OPNAME ## h264_qpel16_hv_lowpass)(uint8_t dst, pixeltmp tmp, uint8_t *src, int dstStride, int tmpStride, int srcStride){\
yading@10	369 FUNC(OPNAME ## h264_qpel8_hv_lowpass)(dst , tmp , src , dstStride, tmpStride, srcStride);\
yading@10	370 FUNC(OPNAME ## h264_qpel8_hv_lowpass)(dst+8sizeof(pixel), tmp+8, src+8sizeof(pixel), dstStride, tmpStride, srcStride);\
yading@10	371 src += 8*srcStride;\
yading@10	372 dst += 8*dstStride;\
yading@10	373 FUNC(OPNAME ## h264_qpel8_hv_lowpass)(dst , tmp , src , dstStride, tmpStride, srcStride);\
yading@10	374 FUNC(OPNAME ## h264_qpel8_hv_lowpass)(dst+8sizeof(pixel), tmp+8, src+8sizeof(pixel), dstStride, tmpStride, srcStride);\
yading@10	375 }\
yading@10	376
yading@10	377 #define H264_MC(OPNAME, SIZE) \
yading@10	378 static av_unused void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc00)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	379 {\
yading@10	380 FUNCC(OPNAME ## pixels ## SIZE)(dst, src, stride, SIZE);\
yading@10	381 }\
yading@10	382 \
yading@10	383 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc10)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	384 {\
yading@10	385 uint8_t half[SIZESIZEsizeof(pixel)];\
yading@10	386 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(half, src, SIZE*sizeof(pixel), stride);\
yading@10	387 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, src, half, stride, stride, SIZE*sizeof(pixel), SIZE);\
yading@10	388 }\
yading@10	389 \
yading@10	390 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc20)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	391 {\
yading@10	392 FUNC(OPNAME ## h264_qpel ## SIZE ## _h_lowpass)(dst, src, stride, stride);\
yading@10	393 }\
yading@10	394 \
yading@10	395 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc30)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	396 {\
yading@10	397 uint8_t half[SIZESIZEsizeof(pixel)];\
yading@10	398 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(half, src, SIZE*sizeof(pixel), stride);\
yading@10	399 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, src+sizeof(pixel), half, stride, stride, SIZE*sizeof(pixel), SIZE);\
yading@10	400 }\
yading@10	401 \
yading@10	402 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc01)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	403 {\
yading@10	404 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	405 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	406 uint8_t half[SIZESIZEsizeof(pixel)];\
yading@10	407 FUNC(copy_block ## SIZE )(full, src - stride2, SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	408 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(half, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	409 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, full_mid, half, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	410 }\
yading@10	411 \
yading@10	412 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc02)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	413 {\
yading@10	414 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	415 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	416 FUNC(copy_block ## SIZE )(full, src - stride2, SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	417 FUNC(OPNAME ## h264_qpel ## SIZE ## _v_lowpass)(dst, full_mid, stride, SIZE*sizeof(pixel));\
yading@10	418 }\
yading@10	419 \
yading@10	420 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc03)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	421 {\
yading@10	422 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	423 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	424 uint8_t half[SIZESIZEsizeof(pixel)];\
yading@10	425 FUNC(copy_block ## SIZE )(full, src - stride2, SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	426 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(half, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	427 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, full_mid+SIZEsizeof(pixel), half, stride, SIZEsizeof(pixel), SIZE*sizeof(pixel), SIZE);\
yading@10	428 }\
yading@10	429 \
yading@10	430 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc11)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	431 {\
yading@10	432 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	433 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	434 uint8_t halfH[SIZESIZEsizeof(pixel)];\
yading@10	435 uint8_t halfV[SIZESIZEsizeof(pixel)];\
yading@10	436 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(halfH, src, SIZE*sizeof(pixel), stride);\
yading@10	437 FUNC(copy_block ## SIZE )(full, src - stride2, SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	438 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(halfV, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	439 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfH, halfV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	440 }\
yading@10	441 \
yading@10	442 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc31)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	443 {\
yading@10	444 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	445 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	446 uint8_t halfH[SIZESIZEsizeof(pixel)];\
yading@10	447 uint8_t halfV[SIZESIZEsizeof(pixel)];\
yading@10	448 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(halfH, src, SIZE*sizeof(pixel), stride);\
yading@10	449 FUNC(copy_block ## SIZE )(full, src - stride2 + sizeof(pixel), SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	450 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(halfV, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	451 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfH, halfV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	452 }\
yading@10	453 \
yading@10	454 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc13)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	455 {\
yading@10	456 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	457 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	458 uint8_t halfH[SIZESIZEsizeof(pixel)];\
yading@10	459 uint8_t halfV[SIZESIZEsizeof(pixel)];\
yading@10	460 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(halfH, src + stride, SIZE*sizeof(pixel), stride);\
yading@10	461 FUNC(copy_block ## SIZE )(full, src - stride2, SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	462 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(halfV, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	463 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfH, halfV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	464 }\
yading@10	465 \
yading@10	466 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc33)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	467 {\
yading@10	468 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	469 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	470 uint8_t halfH[SIZESIZEsizeof(pixel)];\
yading@10	471 uint8_t halfV[SIZESIZEsizeof(pixel)];\
yading@10	472 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(halfH, src + stride, SIZE*sizeof(pixel), stride);\
yading@10	473 FUNC(copy_block ## SIZE )(full, src - stride2 + sizeof(pixel), SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	474 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(halfV, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	475 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfH, halfV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	476 }\
yading@10	477 \
yading@10	478 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc22)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	479 {\
yading@10	480 pixeltmp tmp[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	481 FUNC(OPNAME ## h264_qpel ## SIZE ## _hv_lowpass)(dst, tmp, src, stride, SIZE*sizeof(pixel), stride);\
yading@10	482 }\
yading@10	483 \
yading@10	484 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc21)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	485 {\
yading@10	486 pixeltmp tmp[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	487 uint8_t halfH[SIZESIZEsizeof(pixel)];\
yading@10	488 uint8_t halfHV[SIZESIZEsizeof(pixel)];\
yading@10	489 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(halfH, src, SIZE*sizeof(pixel), stride);\
yading@10	490 FUNC(put_h264_qpel ## SIZE ## _hv_lowpass)(halfHV, tmp, src, SIZEsizeof(pixel), SIZEsizeof(pixel), stride);\
yading@10	491 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfH, halfHV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	492 }\
yading@10	493 \
yading@10	494 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc23)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	495 {\
yading@10	496 pixeltmp tmp[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	497 uint8_t halfH[SIZESIZEsizeof(pixel)];\
yading@10	498 uint8_t halfHV[SIZESIZEsizeof(pixel)];\
yading@10	499 FUNC(put_h264_qpel ## SIZE ## _h_lowpass)(halfH, src + stride, SIZE*sizeof(pixel), stride);\
yading@10	500 FUNC(put_h264_qpel ## SIZE ## _hv_lowpass)(halfHV, tmp, src, SIZEsizeof(pixel), SIZEsizeof(pixel), stride);\
yading@10	501 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfH, halfHV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	502 }\
yading@10	503 \
yading@10	504 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc12)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	505 {\
yading@10	506 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	507 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	508 pixeltmp tmp[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	509 uint8_t halfV[SIZESIZEsizeof(pixel)];\
yading@10	510 uint8_t halfHV[SIZESIZEsizeof(pixel)];\
yading@10	511 FUNC(copy_block ## SIZE )(full, src - stride2, SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	512 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(halfV, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	513 FUNC(put_h264_qpel ## SIZE ## _hv_lowpass)(halfHV, tmp, src, SIZEsizeof(pixel), SIZEsizeof(pixel), stride);\
yading@10	514 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfV, halfHV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	515 }\
yading@10	516 \
yading@10	517 static void FUNCC(OPNAME ## h264_qpel ## SIZE ## _mc32)(uint8_t dst, uint8_t src, ptrdiff_t stride)\
yading@10	518 {\
yading@10	519 uint8_t full[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	520 uint8_t * const full_mid= full + SIZE2sizeof(pixel);\
yading@10	521 pixeltmp tmp[SIZE(SIZE+5)sizeof(pixel)];\
yading@10	522 uint8_t halfV[SIZESIZEsizeof(pixel)];\
yading@10	523 uint8_t halfHV[SIZESIZEsizeof(pixel)];\
yading@10	524 FUNC(copy_block ## SIZE )(full, src - stride2 + sizeof(pixel), SIZEsizeof(pixel), stride, SIZE + 5);\
yading@10	525 FUNC(put_h264_qpel ## SIZE ## _v_lowpass)(halfV, full_mid, SIZEsizeof(pixel), SIZEsizeof(pixel));\
yading@10	526 FUNC(put_h264_qpel ## SIZE ## _hv_lowpass)(halfHV, tmp, src, SIZEsizeof(pixel), SIZEsizeof(pixel), stride);\
yading@10	527 FUNC(OPNAME ## pixels ## SIZE ## _l2)(dst, halfV, halfHV, stride, SIZEsizeof(pixel), SIZEsizeof(pixel), SIZE);\
yading@10	528 }\
yading@10	529
yading@10	530 #define op_avg(a, b) a = (((a)+CLIP(((b) + 16)>>5)+1)>>1)
yading@10	531 //#define op_avg2(a, b) a = (((a)w1+cm[((b) + 16)>>5]w2 + o + 64)>>7)
yading@10	532 #define op_put(a, b) a = CLIP(((b) + 16)>>5)
yading@10	533 #define op2_avg(a, b) a = (((a)+CLIP(((b) + 512)>>10)+1)>>1)
yading@10	534 #define op2_put(a, b) a = CLIP(((b) + 512)>>10)
yading@10	535
yading@10	536 H264_LOWPASS(put_ , op_put, op2_put)
yading@10	537 H264_LOWPASS(avg_ , op_avg, op2_avg)
yading@10	538 H264_MC(put_, 2)
yading@10	539 H264_MC(put_, 4)
yading@10	540 H264_MC(put_, 8)
yading@10	541 H264_MC(put_, 16)
yading@10	542 H264_MC(avg_, 4)
yading@10	543 H264_MC(avg_, 8)
yading@10	544 H264_MC(avg_, 16)
yading@10	545
yading@10	546 #undef op_avg
yading@10	547 #undef op_put
yading@10	548 #undef op2_avg
yading@10	549 #undef op2_put

Mercurial > hg > pmhd

annotate ffmpeg/libavcodec/h264qpel_template.c @ 13:844d341cf643 tip