Annotation of /xvidcore/src/motion/motion_comp.c

Revision 1.23 - (view) (download)

1 :	edgomez	1.20	/*****************************************************************************
2 :			*
3 :			* XVID MPEG-4 VIDEO CODEC
4 :			* - Motion Compensation related code -
5 :			*
6 :			* Copyright(C) 2002 Peter Ross <pross@xvid.org>
7 :			* 2003 Christoph Lampert <gruel@web.de>
8 :			*
9 :			* This program is free software ; you can redistribute it and/or modify
10 :			* it under the terms of the GNU General Public License as published by
11 :			* the Free Software Foundation ; either version 2 of the License, or
12 :			* (at your option) any later version.
13 :			*
14 :			* This program is distributed in the hope that it will be useful,
15 :			* but WITHOUT ANY WARRANTY ; without even the implied warranty of
16 :			* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
17 :			* GNU General Public License for more details.
18 :			*
19 :			* You should have received a copy of the GNU General Public License
20 :			* along with this program ; if not, write to the Free Software
21 :			* Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
22 :			*
23 :	syskin	1.23	* $Id: motion_comp.c,v 1.22 2004/10/12 21:08:41 edgomez Exp $
24 :	edgomez	1.20	*
25 :			****************************************************************************/
26 :	edgomez	1.17
27 :			#include <stdio.h>
28 :	suxen_drol	1.3
29 :	Isibaar	1.1	#include "../encoder.h"
30 :			#include "../utils/mbfunctions.h"
31 :			#include "../image/interpolate8x8.h"
32 :	edgomez	1.20	#include "../image/qpel.h"
33 :	Isibaar	1.1	#include "../utils/timer.h"
34 :	suxen_drol	1.3	#include "motion.h"
35 :	Isibaar	1.1
36 :	syskin	1.23	/*
37 :	edgomez	1.20	* getref: calculate reference image pointer
38 :			* the decision to use interpolation h/v/hv or the normal image is
39 :			* based on dx & dy.
40 :			*/
41 :
42 :			static __inline const uint8_t *
43 :			get_ref(const uint8_t * const refn,
44 :			const uint8_t * const refh,
45 :			const uint8_t * const refv,
46 :			const uint8_t * const refhv,
47 :			const uint32_t x,
48 :			const uint32_t y,
49 :			const uint32_t block,
50 :			const int32_t dx,
51 :			const int32_t dy,
52 :			const int32_t stride)
53 :			{
54 :			switch (((dx & 1) << 1) + (dy & 1)) {
55 :			case 0:
56 :	edgomez	1.22	return refn + (int) (((int)x * (int)block + dx / 2) + ((int)y * (int)block + dy / 2) * (int)stride);
57 :	edgomez	1.20	case 1:
58 :	edgomez	1.22	return refv + (int) (((int)x * (int)block + dx / 2) + ((int)y * (int)block + (dy - 1) / 2) * (int)stride);
59 :	edgomez	1.20	case 2:
60 :	edgomez	1.22	return refh + (int) (((int)x * (int)block + (dx - 1) / 2) + ((int)y * (int)block + dy / 2) * (int)stride);
61 :	edgomez	1.20	default:
62 :	edgomez	1.22	return refhv + (int) (((int)x * (int)block + (dx - 1) / 2) + ((int)y * (int)block + (dy - 1) / 2) * (int)stride);
63 :	edgomez	1.20	}
64 :			}
65 :	Isibaar	1.1
66 :	edgomez	1.5	static __inline void
67 :	edgomez	1.17	compensate16x16_interpolate(int16_t * const dct_codes,
68 :			uint8_t * const cur,
69 :			const uint8_t * const ref,
70 :			const uint8_t * const refh,
71 :			const uint8_t * const refv,
72 :			const uint8_t * const refhv,
73 :			uint8_t * const tmp,
74 :			uint32_t x,
75 :			uint32_t y,
76 :			const int32_t dx,
77 :			const int32_t dy,
78 :			const int32_t stride,
79 :			const int quarterpel,
80 :			const int32_t rounding)
81 :	Isibaar	1.1	{
82 :	edgomez	1.17	const uint8_t * ptr;
83 :
84 :
85 :	syskin	1.23	if(quarterpel) {
86 :			if ((dx&3) \| (dy&3)) {
87 :			interpolate16x16_quarterpel(tmp - y * stride - x,
88 :			(uint8_t *) ref, tmp + 32,
89 :			tmp + 64, tmp + 96, x, y, dx, dy, stride, rounding);
90 :			ptr = tmp;
91 :			} else ptr = ref + ((int)y + dy/4)(int)stride + (int)x + dx/4; / fullpixel position */
92 :	syskin	1.19
93 :	syskin	1.23	} else ptr = get_ref(ref, refh, refv, refhv, x, y, 1, dx, dy, stride);
94 :	edgomez	1.17
95 :	syskin	1.23	transfer_8to16sub(dct_codes, cur + y * stride + x,
96 :			ptr, stride);
97 :			transfer_8to16sub(dct_codes+64, cur + y * stride + x + 8,
98 :			ptr + 8, stride);
99 :			transfer_8to16sub(dct_codes+128, cur + y * stride + x + 8*stride,
100 :			ptr + 8*stride, stride);
101 :			transfer_8to16sub(dct_codes+192, cur + y * stride + x + 8*stride+8,
102 :			ptr + 8*stride + 8, stride);
103 :	syskin	1.19
104 :	edgomez	1.17	}
105 :
106 :			static __inline void
107 :			compensate8x8_interpolate( int16_t * const dct_codes,
108 :			uint8_t * const cur,
109 :			const uint8_t * const ref,
110 :			const uint8_t * const refh,
111 :			const uint8_t * const refv,
112 :			const uint8_t * const refhv,
113 :			uint8_t * const tmp,
114 :			uint32_t x,
115 :			uint32_t y,
116 :			const int32_t dx,
117 :			const int32_t dy,
118 :			const int32_t stride,
119 :			const int32_t quarterpel,
120 :			const int32_t rounding)
121 :			{
122 :			const uint8_t * ptr;
123 :
124 :	syskin	1.23	if(quarterpel) {
125 :			if ((dx&3) \| (dy&3)) {
126 :			interpolate8x8_quarterpel(tmp - y*stride - x,
127 :			(uint8_t *) ref, tmp + 32,
128 :			tmp + 64, tmp + 96, x, y, dx, dy, stride, rounding);
129 :			ptr = tmp;
130 :			} else ptr = ref + ((int)y + dy/4)(int)stride + (int)x + dx/4; / fullpixel position */
131 :			} else ptr = get_ref(ref, refh, refv, refhv, x, y, 1, dx, dy, stride);
132 :	edgomez	1.17
133 :	syskin	1.23	transfer_8to16sub(dct_codes, cur + y * stride + x, ptr, stride);
134 :	Isibaar	1.1	}
135 :
136 :	edgomez	1.17
137 :			static void
138 :			CompensateChroma( int dx, int dy,
139 :			const int i, const int j,
140 :			IMAGE * const Cur,
141 :			const IMAGE * const Ref,
142 :			uint8_t * const temp,
143 :			int16_t * const coeff,
144 :			const int32_t stride,
145 :	syskin	1.23	const int rounding)
146 :	edgomez	1.17	{ /* uv-block-based compensation */
147 :
148 :	syskin	1.23	transfer_8to16sub(coeff, Cur->u + 8 * j * stride + 8 * i,
149 :			interpolate8x8_switch2(temp, Ref->u, 8 * i, 8 * j,
150 :			dx, dy, stride, rounding),
151 :			stride);
152 :			transfer_8to16sub(coeff + 64, Cur->v + 8 * j * stride + 8 * i,
153 :			interpolate8x8_switch2(temp, Ref->v, 8 * i, 8 * j,
154 :			dx, dy, stride, rounding),
155 :			stride);
156 :	edgomez	1.17	}
157 :	Isibaar	1.1
158 :	edgomez	1.5	void
159 :			MBMotionCompensation(MACROBLOCK * const mb,
160 :	syskin	1.19	const uint32_t i,
161 :			const uint32_t j,
162 :			const IMAGE * const ref,
163 :			const IMAGE * const refh,
164 :			const IMAGE * const refv,
165 :			const IMAGE * const refhv,
166 :			const IMAGE * const refGMC,
167 :			IMAGE * const cur,
168 :			int16_t * dct_codes,
169 :			const uint32_t width,
170 :			const uint32_t height,
171 :			const uint32_t edged_width,
172 :			const int32_t quarterpel,
173 :			const int32_t rounding)
174 :	edgomez	1.17	{
175 :			int32_t dx;
176 :			int32_t dy;
177 :
178 :			uint8_t * const tmp = refv->u;
179 :
180 :	syskin	1.23	if (mb->mode == MODE_NOT_CODED) { /* quick copy for early SKIP */
181 :	edgomez	1.17	/* early SKIP is only activated in P-VOPs, not in S-VOPs, so mcsel can never be 1 */
182 :
183 :			transfer16x16_copy(cur->y + 16 * (i + j * edged_width),
184 :	syskin	1.19	ref->y + 16 * (i + j * edged_width),
185 :			edged_width);
186 :
187 :	edgomez	1.17	transfer8x8_copy(cur->u + 8 * (i + j * edged_width/2),
188 :			ref->u + 8 * (i + j * edged_width/2),
189 :			edged_width / 2);
190 :			transfer8x8_copy(cur->v + 8 * (i + j * edged_width/2),
191 :			ref->v + 8 * (i + j * edged_width/2),
192 :			edged_width / 2);
193 :			return;
194 :			}
195 :
196 :	syskin	1.19	if ((mb->mode == MODE_NOT_CODED \|\| mb->mode == MODE_INTER
197 :	edgomez	1.17	\|\| mb->mode == MODE_INTER_Q)) {
198 :
199 :			if (mb->mcsel) {
200 :	syskin	1.19
201 :	edgomez	1.17	/* call normal routine once, easier than "if (mcsel)"ing all the time */
202 :	syskin	1.19
203 :	edgomez	1.17	transfer_8to16sub(&dct_codes[064], cur->y + 16jedged_width + 16i,
204 :	syskin	1.19	refGMC->y + 16jedged_width + 16*i, edged_width);
205 :	edgomez	1.17	transfer_8to16sub(&dct_codes[164], cur->y + 16jedged_width + 16i+8,
206 :	syskin	1.19	refGMC->y + 16jedged_width + 16*i+8, edged_width);
207 :	edgomez	1.17	transfer_8to16sub(&dct_codes[264], cur->y + (16j+8)edged_width + 16i,
208 :	syskin	1.19	refGMC->y + (16j+8)edged_width + 16*i, edged_width);
209 :	edgomez	1.17	transfer_8to16sub(&dct_codes[364], cur->y + (16j+8)edged_width + 16i+8,
210 :	syskin	1.19	refGMC->y + (16j+8)edged_width + 16*i+8, edged_width);
211 :	edgomez	1.17
212 :			transfer_8to16sub(&dct_codes[4 * 64], cur->u + 8 jedged_width/2 + 8*i,
213 :			refGMC->u + 8 jedged_width/2 + 8*i, edged_width/2);
214 :
215 :			transfer_8to16sub(&dct_codes[5 * 64], cur->v + 8j edged_width/2 + 8*i,
216 :			refGMC->v + 8j edged_width/2 + 8*i, edged_width/2);
217 :
218 :			return;
219 :			}
220 :
221 :			/* ordinary compensation */
222 :	syskin	1.19
223 :	edgomez	1.17	dx = (quarterpel ? mb->qmvs[0].x : mb->mvs[0].x);
224 :			dy = (quarterpel ? mb->qmvs[0].y : mb->mvs[0].y);
225 :
226 :			compensate16x16_interpolate(&dct_codes[0 * 64], cur->y, ref->y, refh->y,
227 :			refv->y, refhv->y, tmp, 16 * i, 16 * j, dx, dy,
228 :	syskin	1.23	edged_width, quarterpel, rounding);
229 :	edgomez	1.17
230 :	syskin	1.19	if (quarterpel) { dx /= 2; dy /= 2; }
231 :
232 :	edgomez	1.17	dx = (dx >> 1) + roundtab_79[dx & 0x3];
233 :			dy = (dy >> 1) + roundtab_79[dy & 0x3];
234 :
235 :	edgomez	1.20	} else { /* mode == MODE_INTER4V */
236 :	edgomez	1.17	int k, sumx = 0, sumy = 0;
237 :			const VECTOR * const mvs = (quarterpel ? mb->qmvs : mb->mvs);
238 :
239 :			for (k = 0; k < 4; k++) {
240 :			dx = mvs[k].x;
241 :			dy = mvs[k].y;
242 :	syskin	1.19	sumx += quarterpel ? dx/2 : dx;
243 :			sumy += quarterpel ? dy/2 : dy;
244 :	edgomez	1.17
245 :			compensate8x8_interpolate(&dct_codes[k * 64], cur->y, ref->y, refh->y,
246 :			refv->y, refhv->y, tmp, 16 * i + 8(k&1), 16 j + 8*(k>>1), dx,
247 :	syskin	1.23	dy, edged_width, quarterpel, rounding);
248 :	edgomez	1.17	}
249 :			dx = (sumx >> 3) + roundtab_76[sumx & 0xf];
250 :			dy = (sumy >> 3) + roundtab_76[sumy & 0xf];
251 :			}
252 :
253 :			CompensateChroma(dx, dy, i, j, cur, ref, tmp,
254 :	syskin	1.23	&dct_codes[4 * 64], edged_width / 2, rounding);
255 :	edgomez	1.17	}
256 :
257 :
258 :			void
259 :			MBMotionCompensationBVOP(MBParam * pParam,
260 :			MACROBLOCK * const mb,
261 :			const uint32_t i,
262 :			const uint32_t j,
263 :			IMAGE * const cur,
264 :			const IMAGE * const f_ref,
265 :			const IMAGE * const f_refh,
266 :			const IMAGE * const f_refv,
267 :			const IMAGE * const f_refhv,
268 :			const IMAGE * const b_ref,
269 :			const IMAGE * const b_refh,
270 :			const IMAGE * const b_refv,
271 :			const IMAGE * const b_refhv,
272 :			int16_t * dct_codes)
273 :			{
274 :			const uint32_t edged_width = pParam->edged_width;
275 :			int32_t dx, dy, b_dx, b_dy, sumx, sumy, b_sumx, b_sumy;
276 :			int k;
277 :	edgomez	1.20	const int quarterpel = pParam->vol_flags & XVID_VOL_QUARTERPEL;
278 :	edgomez	1.17	const uint8_t * ptr1, * ptr2;
279 :			uint8_t * const tmp = f_refv->u;
280 :			const VECTOR * const fmvs = (quarterpel ? mb->qmvs : mb->mvs);
281 :			const VECTOR * const bmvs = (quarterpel ? mb->b_qmvs : mb->b_mvs);
282 :
283 :			switch (mb->mode) {
284 :			case MODE_FORWARD:
285 :			dx = fmvs->x; dy = fmvs->y;
286 :
287 :			compensate16x16_interpolate(&dct_codes[0 * 64], cur->y, f_ref->y, f_refh->y,
288 :			f_refv->y, f_refhv->y, tmp, 16 * i, 16 * j, dx,
289 :	syskin	1.23	dy, edged_width, quarterpel, 0);
290 :	edgomez	1.17
291 :			if (quarterpel) { dx /= 2; dy /= 2; }
292 :
293 :			CompensateChroma( (dx >> 1) + roundtab_79[dx & 0x3],
294 :			(dy >> 1) + roundtab_79[dy & 0x3],
295 :			i, j, cur, f_ref, tmp,
296 :	syskin	1.23	&dct_codes[4 * 64], edged_width / 2, 0);
297 :	edgomez	1.17
298 :			return;
299 :
300 :			case MODE_BACKWARD:
301 :			b_dx = bmvs->x; b_dy = bmvs->y;
302 :
303 :	syskin	1.19	compensate16x16_interpolate(&dct_codes[0 * 64], cur->y, b_ref->y, b_refh->y,
304 :	edgomez	1.17	b_refv->y, b_refhv->y, tmp, 16 * i, 16 * j, b_dx,
305 :	syskin	1.23	b_dy, edged_width, quarterpel, 0);
306 :	edgomez	1.17
307 :			if (quarterpel) { b_dx /= 2; b_dy /= 2; }
308 :
309 :			CompensateChroma( (b_dx >> 1) + roundtab_79[b_dx & 0x3],
310 :			(b_dy >> 1) + roundtab_79[b_dy & 0x3],
311 :			i, j, cur, b_ref, tmp,
312 :	syskin	1.23	&dct_codes[4 * 64], edged_width / 2, 0);
313 :	edgomez	1.17
314 :			return;
315 :
316 :	syskin	1.23	case MODE_INTERPOLATE:
317 :	edgomez	1.17	case MODE_DIRECT_NO4V:
318 :			dx = fmvs->x; dy = fmvs->y;
319 :			b_dx = bmvs->x; b_dy = bmvs->y;
320 :
321 :			if (quarterpel) {
322 :	syskin	1.19
323 :	edgomez	1.17	if ((dx&3) \| (dy&3)) {
324 :			interpolate16x16_quarterpel(tmp - i * 16 - j * 16 * edged_width,
325 :			(uint8_t *) f_ref->y, tmp + 32,
326 :			tmp + 64, tmp + 96, 16i, 16j, dx, dy, edged_width, 0);
327 :			ptr1 = tmp;
328 :	edgomez	1.22	} else ptr1 = f_ref->y + (16(int)j + dy/4)(int)edged_width + 16(int)i + dx/4; / fullpixel position */
329 :	edgomez	1.17
330 :			if ((b_dx&3) \| (b_dy&3)) {
331 :			interpolate16x16_quarterpel(tmp - i * 16 - j * 16 * edged_width + 16,
332 :			(uint8_t *) b_ref->y, tmp + 32,
333 :			tmp + 64, tmp + 96, 16i, 16j, b_dx, b_dy, edged_width, 0);
334 :			ptr2 = tmp + 16;
335 :	edgomez	1.22	} else ptr2 = b_ref->y + (16(int)j + b_dy/4)(int)edged_width + 16(int)i + b_dx/4; / fullpixel position */
336 :	edgomez	1.17
337 :			b_dx /= 2;
338 :			b_dy /= 2;
339 :			dx /= 2;
340 :			dy /= 2;
341 :
342 :			} else {
343 :			ptr1 = get_ref(f_ref->y, f_refh->y, f_refv->y, f_refhv->y,
344 :			i, j, 16, dx, dy, edged_width);
345 :
346 :			ptr2 = get_ref(b_ref->y, b_refh->y, b_refv->y, b_refhv->y,
347 :			i, j, 16, b_dx, b_dy, edged_width);
348 :			}
349 :			for (k = 0; k < 4; k++)
350 :			transfer_8to16sub2(&dct_codes[k * 64],
351 :			cur->y + (i * 16+(k&1)8) + (j 16+((k>>1)8)) edged_width,
352 :			ptr1 + (k&1)8 + (k>>1)8*edged_width,
353 :			ptr2 + (k&1)8 + (k>>1)8*edged_width, edged_width);
354 :
355 :
356 :			dx = (dx >> 1) + roundtab_79[dx & 0x3];
357 :			dy = (dy >> 1) + roundtab_79[dy & 0x3];
358 :
359 :			b_dx = (b_dx >> 1) + roundtab_79[b_dx & 0x3];
360 :			b_dy = (b_dy >> 1) + roundtab_79[b_dy & 0x3];
361 :
362 :			break;
363 :	syskin	1.19
364 :	edgomez	1.20	default: /* MODE_DIRECT (or MODE_DIRECT_NONE_MV in case of bframes decoding) */
365 :	edgomez	1.17	sumx = sumy = b_sumx = b_sumy = 0;
366 :
367 :			for (k = 0; k < 4; k++) {
368 :	syskin	1.19
369 :	edgomez	1.17	dx = fmvs[k].x; dy = fmvs[k].y;
370 :			b_dx = bmvs[k].x; b_dy = bmvs[k].y;
371 :
372 :			if (quarterpel) {
373 :			sumx += dx/2; sumy += dy/2;
374 :			b_sumx += b_dx/2; b_sumy += b_dy/2;
375 :
376 :			if ((dx&3) \| (dy&3)) {
377 :			interpolate8x8_quarterpel(tmp - (i * 16+(k&1)8) - (j 16+((k>>1)8)) edged_width,
378 :	syskin	1.19	(uint8_t *) f_ref->y,
379 :			tmp + 32, tmp + 64, tmp + 96,
380 :	edgomez	1.17	16i + (k&1)8, 16j + (k>>1)8, dx, dy, edged_width, 0);
381 :			ptr1 = tmp;
382 :	edgomez	1.22	} else ptr1 = f_ref->y + (16(int)j + (k>>1)8 + dy/4)(int)edged_width + 16(int)i + (k&1)*8 + dx/4;
383 :	edgomez	1.17
384 :			if ((b_dx&3) \| (b_dy&3)) {
385 :			interpolate8x8_quarterpel(tmp - (i * 16+(k&1)8) - (j 16+((k>>1)8)) edged_width + 16,
386 :			(uint8_t *) b_ref->y,
387 :	syskin	1.19	tmp + 16, tmp + 32, tmp + 48,
388 :	edgomez	1.17	16i + (k&1)8, 16j + (k>>1)8, b_dx, b_dy, edged_width, 0);
389 :			ptr2 = tmp + 16;
390 :	edgomez	1.22	} else ptr2 = b_ref->y + (16(int)j + (k>>1)8 + b_dy/4)(int)edged_width + 16(int)i + (k&1)*8 + b_dx/4;
391 :	edgomez	1.17	} else {
392 :			sumx += dx; sumy += dy;
393 :			b_sumx += b_dx; b_sumy += b_dy;
394 :
395 :	syskin	1.19	ptr1 = get_ref(f_ref->y, f_refh->y, f_refv->y, f_refhv->y,
396 :	edgomez	1.17	2i + (k&1), 2j + (k>>1), 8, dx, dy, edged_width);
397 :	syskin	1.19	ptr2 = get_ref(b_ref->y, b_refh->y, b_refv->y, b_refhv->y,
398 :	edgomez	1.17	2i + (k&1), 2j + (k>>1), 8, b_dx, b_dy, edged_width);
399 :			}
400 :			transfer_8to16sub2(&dct_codes[k * 64],
401 :			cur->y + (i * 16+(k&1)8) + (j 16+((k>>1)8)) edged_width,
402 :			ptr1, ptr2, edged_width);
403 :	syskin	1.19
404 :	edgomez	1.17	}
405 :
406 :			dx = (sumx >> 3) + roundtab_76[sumx & 0xf];
407 :			dy = (sumy >> 3) + roundtab_76[sumy & 0xf];
408 :			b_dx = (b_sumx >> 3) + roundtab_76[b_sumx & 0xf];
409 :			b_dy = (b_sumy >> 3) + roundtab_76[b_sumy & 0xf];
410 :
411 :			break;
412 :			}
413 :
414 :	syskin	1.23	/* block-based chroma interpolation for direct and interpolate modes */
415 :	edgomez	1.17	transfer_8to16sub2(&dct_codes[4 * 64],
416 :			cur->u + (j * 8) * edged_width / 2 + (i * 8),
417 :			interpolate8x8_switch2(tmp, b_ref->u, 8 * i, 8 * j,
418 :			b_dx, b_dy, edged_width / 2, 0),
419 :			interpolate8x8_switch2(tmp + 8, f_ref->u, 8 * i, 8 * j,
420 :			dx, dy, edged_width / 2, 0),
421 :			edged_width / 2);
422 :
423 :			transfer_8to16sub2(&dct_codes[5 * 64],
424 :			cur->v + (j * 8) * edged_width / 2 + (i * 8),
425 :			interpolate8x8_switch2(tmp, b_ref->v, 8 * i, 8 * j,
426 :			b_dx, b_dy, edged_width / 2, 0),
427 :			interpolate8x8_switch2(tmp + 8, f_ref->v, 8 * i, 8 * j,
428 :			dx, dy, edged_width / 2, 0),
429 :			edged_width / 2);
430 :			}

No admin address has been configured	ViewVC Help
Powered by ViewVC 1.0.4