js-dsp-test: fft/fftw/fftw-3.3.4/libbench2/tensor.c annotate

annotate fft/fftw/fftw-3.3.4/libbench2/tensor.c @ 40:223f770b5341 kissfft-double tip

Try a double-precision kissfft

author	Chris Cannam
date	Wed, 07 Sep 2016 10:40:32 +0100
parents	26056e866c29
children

rev	line source
Chris@19	1 /*
Chris@19	2 * Copyright (c) 2001 Matteo Frigo
Chris@19	3 * Copyright (c) 2001 Massachusetts Institute of Technology
Chris@19	4 *
Chris@19	5 * This program is free software; you can redistribute it and/or modify
Chris@19	6 * it under the terms of the GNU General Public License as published by
Chris@19	7 * the Free Software Foundation; either version 2 of the License, or
Chris@19	8 * (at your option) any later version.
Chris@19	9 *
Chris@19	10 * This program is distributed in the hope that it will be useful,
Chris@19	11 * but WITHOUT ANY WARRANTY; without even the implied warranty of
Chris@19	12 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
Chris@19	13 * GNU General Public License for more details.
Chris@19	14 *
Chris@19	15 * You should have received a copy of the GNU General Public License
Chris@19	16 * along with this program; if not, write to the Free Software
Chris@19	17 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
Chris@19	18 *
Chris@19	19 */
Chris@19	20
Chris@19	21 #include "bench.h"
Chris@19	22 #include <stdlib.h>
Chris@19	23
Chris@19	24 bench_tensor *mktensor(int rnk)
Chris@19	25 {
Chris@19	26 bench_tensor *x;
Chris@19	27
Chris@19	28 BENCH_ASSERT(rnk >= 0);
Chris@19	29
Chris@19	30 x = (bench_tensor *)bench_malloc(sizeof(bench_tensor));
Chris@19	31 if (FINITE_RNK(rnk) && rnk > 0)
Chris@19	32 x->dims = (bench_iodim )bench_malloc(sizeof(bench_iodim) rnk);
Chris@19	33 else
Chris@19	34 x->dims = 0;
Chris@19	35
Chris@19	36 x->rnk = rnk;
Chris@19	37 return x;
Chris@19	38 }
Chris@19	39
Chris@19	40 void tensor_destroy(bench_tensor *sz)
Chris@19	41 {
Chris@19	42 bench_free0(sz->dims);
Chris@19	43 bench_free(sz);
Chris@19	44 }
Chris@19	45
Chris@19	46 int tensor_sz(const bench_tensor *sz)
Chris@19	47 {
Chris@19	48 int i, n = 1;
Chris@19	49
Chris@19	50 if (!FINITE_RNK(sz->rnk))
Chris@19	51 return 0;
Chris@19	52
Chris@19	53 for (i = 0; i < sz->rnk; ++i)
Chris@19	54 n *= sz->dims[i].n;
Chris@19	55 return n;
Chris@19	56 }
Chris@19	57
Chris@19	58
Chris@19	59 /* total order among bench_iodim's */
Chris@19	60 static int dimcmp(const bench_iodim a, const bench_iodim b)
Chris@19	61 {
Chris@19	62 if (b->is != a->is)
Chris@19	63 return (b->is - a->is); /* shorter strides go later */
Chris@19	64 if (b->os != a->os)
Chris@19	65 return (b->os - a->os); /* shorter strides go later */
Chris@19	66 return (int)(a->n - b->n); /* larger n's go later */
Chris@19	67 }
Chris@19	68
Chris@19	69 bench_tensor tensor_compress(const bench_tensor sz)
Chris@19	70 {
Chris@19	71 int i, rnk;
Chris@19	72 bench_tensor *x;
Chris@19	73
Chris@19	74 BENCH_ASSERT(FINITE_RNK(sz->rnk));
Chris@19	75 for (i = rnk = 0; i < sz->rnk; ++i) {
Chris@19	76 BENCH_ASSERT(sz->dims[i].n > 0);
Chris@19	77 if (sz->dims[i].n != 1)
Chris@19	78 ++rnk;
Chris@19	79 }
Chris@19	80
Chris@19	81 x = mktensor(rnk);
Chris@19	82 for (i = rnk = 0; i < sz->rnk; ++i) {
Chris@19	83 if (sz->dims[i].n != 1)
Chris@19	84 x->dims[rnk++] = sz->dims[i];
Chris@19	85 }
Chris@19	86
Chris@19	87 if (rnk) {
Chris@19	88 /* God knows how qsort() behaves if n==0 */
Chris@19	89 qsort(x->dims, (size_t)x->rnk, sizeof(bench_iodim),
Chris@19	90 (int ()(const void , const void *))dimcmp);
Chris@19	91 }
Chris@19	92
Chris@19	93 return x;
Chris@19	94 }
Chris@19	95
Chris@19	96 int tensor_unitstridep(bench_tensor *t)
Chris@19	97 {
Chris@19	98 BENCH_ASSERT(FINITE_RNK(t->rnk));
Chris@19	99 return (t->rnk == 0 \|\|
Chris@19	100 (t->dims[t->rnk - 1].is == 1 && t->dims[t->rnk - 1].os == 1));
Chris@19	101 }
Chris@19	102
Chris@19	103 /* detect screwy real padded rowmajor... ugh */
Chris@19	104 int tensor_real_rowmajorp(bench_tensor *t, int sign, int in_place)
Chris@19	105 {
Chris@19	106 int i;
Chris@19	107
Chris@19	108 BENCH_ASSERT(FINITE_RNK(t->rnk));
Chris@19	109
Chris@19	110 i = t->rnk - 1;
Chris@19	111
Chris@19	112 if (--i >= 0) {
Chris@19	113 bench_iodim *d = t->dims + i;
Chris@19	114 if (sign < 0) {
Chris@19	115 if (d[0].is != d[1].is * (in_place ? 2*(d[1].n/2 + 1) : d[1].n))
Chris@19	116 return 0;
Chris@19	117 if (d[0].os != d[1].os * (d[1].n/2 + 1))
Chris@19	118 return 0;
Chris@19	119 }
Chris@19	120 else {
Chris@19	121 if (d[0].is != d[1].is * (d[1].n/2 + 1))
Chris@19	122 return 0;
Chris@19	123 if (d[0].os != d[1].os * (in_place ? 2*(d[1].n/2 + 1) : d[1].n))
Chris@19	124 return 0;
Chris@19	125 }
Chris@19	126 }
Chris@19	127
Chris@19	128 while (--i >= 0) {
Chris@19	129 bench_iodim *d = t->dims + i;
Chris@19	130 if (d[0].is != d[1].is * d[1].n)
Chris@19	131 return 0;
Chris@19	132 if (d[0].os != d[1].os * d[1].n)
Chris@19	133 return 0;
Chris@19	134 }
Chris@19	135 return 1;
Chris@19	136 }
Chris@19	137
Chris@19	138 int tensor_rowmajorp(bench_tensor *t)
Chris@19	139 {
Chris@19	140 int i;
Chris@19	141
Chris@19	142 BENCH_ASSERT(FINITE_RNK(t->rnk));
Chris@19	143
Chris@19	144 i = t->rnk - 1;
Chris@19	145 while (--i >= 0) {
Chris@19	146 bench_iodim *d = t->dims + i;
Chris@19	147 if (d[0].is != d[1].is * d[1].n)
Chris@19	148 return 0;
Chris@19	149 if (d[0].os != d[1].os * d[1].n)
Chris@19	150 return 0;
Chris@19	151 }
Chris@19	152 return 1;
Chris@19	153 }
Chris@19	154
Chris@19	155 static void dimcpy(bench_iodim dst, const bench_iodim src, int rnk)
Chris@19	156 {
Chris@19	157 int i;
Chris@19	158 if (FINITE_RNK(rnk))
Chris@19	159 for (i = 0; i < rnk; ++i)
Chris@19	160 dst[i] = src[i];
Chris@19	161 }
Chris@19	162
Chris@19	163 bench_tensor tensor_append(const bench_tensor a, const bench_tensor *b)
Chris@19	164 {
Chris@19	165 if (!FINITE_RNK(a->rnk) \|\| !FINITE_RNK(b->rnk)) {
Chris@19	166 return mktensor(RNK_MINFTY);
Chris@19	167 } else {
Chris@19	168 bench_tensor *x = mktensor(a->rnk + b->rnk);
Chris@19	169 dimcpy(x->dims, a->dims, a->rnk);
Chris@19	170 dimcpy(x->dims + a->rnk, b->dims, b->rnk);
Chris@19	171 return x;
Chris@19	172 }
Chris@19	173 }
Chris@19	174
Chris@19	175 static int imax(int a, int b)
Chris@19	176 {
Chris@19	177 return (a > b) ? a : b;
Chris@19	178 }
Chris@19	179
Chris@19	180 static int imin(int a, int b)
Chris@19	181 {
Chris@19	182 return (a < b) ? a : b;
Chris@19	183 }
Chris@19	184
Chris@19	185 #define DEFBOUNDS(name, xs) \
Chris@19	186 void name(bench_tensor t, int lbp, int *ubp) \
Chris@19	187 { \
Chris@19	188 int lb = 0; \
Chris@19	189 int ub = 1; \
Chris@19	190 int i; \
Chris@19	191 \
Chris@19	192 BENCH_ASSERT(FINITE_RNK(t->rnk)); \
Chris@19	193 \
Chris@19	194 for (i = 0; i < t->rnk; ++i) { \
Chris@19	195 bench_iodim *d = t->dims + i; \
Chris@19	196 int n = d->n; \
Chris@19	197 int s = d->xs; \
Chris@19	198 lb = imin(lb, lb + s * (n - 1)); \
Chris@19	199 ub = imax(ub, ub + s * (n - 1)); \
Chris@19	200 } \
Chris@19	201 \
Chris@19	202 *lbp = lb; \
Chris@19	203 *ubp = ub; \
Chris@19	204 }
Chris@19	205
Chris@19	206 DEFBOUNDS(tensor_ibounds, is)
Chris@19	207 DEFBOUNDS(tensor_obounds, os)
Chris@19	208
Chris@19	209 bench_tensor tensor_copy(const bench_tensor sz)
Chris@19	210 {
Chris@19	211 bench_tensor *x = mktensor(sz->rnk);
Chris@19	212 dimcpy(x->dims, sz->dims, sz->rnk);
Chris@19	213 return x;
Chris@19	214 }
Chris@19	215
Chris@19	216 /* Like tensor_copy, but copy only rnk dimensions starting with start_dim. */
Chris@19	217 bench_tensor tensor_copy_sub(const bench_tensor sz, int start_dim, int rnk)
Chris@19	218 {
Chris@19	219 bench_tensor *x;
Chris@19	220
Chris@19	221 BENCH_ASSERT(FINITE_RNK(sz->rnk) && start_dim + rnk <= sz->rnk);
Chris@19	222 x = mktensor(rnk);
Chris@19	223 dimcpy(x->dims, sz->dims + start_dim, rnk);
Chris@19	224 return x;
Chris@19	225 }
Chris@19	226
Chris@19	227 bench_tensor tensor_copy_swapio(const bench_tensor sz)
Chris@19	228 {
Chris@19	229 bench_tensor *x = tensor_copy(sz);
Chris@19	230 int i;
Chris@19	231 if (FINITE_RNK(x->rnk))
Chris@19	232 for (i = 0; i < x->rnk; ++i) {
Chris@19	233 int s;
Chris@19	234 s = x->dims[i].is;
Chris@19	235 x->dims[i].is = x->dims[i].os;
Chris@19	236 x->dims[i].os = s;
Chris@19	237 }
Chris@19	238 return x;
Chris@19	239 }

Mercurial > hg > js-dsp-test

annotate fft/fftw/fftw-3.3.4/libbench2/tensor.c @ 40:223f770b5341 kissfft-double tip