LXR qemu/target/m68k/softfloat.c

   1/*
   2 * Ported from a work by Andreas Grabher for Previous, NeXT Computer Emulator,
   3 * derived from NetBSD M68040 FPSP functions,
   4 * derived from release 2a of the SoftFloat IEC/IEEE Floating-point Arithmetic
   5 * Package. Those parts of the code (and some later contributions) are
   6 * provided under that license, as detailed below.
   7 * It has subsequently been modified by contributors to the QEMU Project,
   8 * so some portions are provided under:
   9 *  the SoftFloat-2a license
  10 *  the BSD license
  11 *  GPL-v2-or-later
  12 *
  13 * Any future contributions to this file will be taken to be licensed under
  14 * the Softfloat-2a license unless specifically indicated otherwise.
  15 */
  16
  17/*
  18 * Portions of this work are licensed under the terms of the GNU GPL,
  19 * version 2 or later. See the COPYING file in the top-level directory.
  20 */
  21
  22#include "qemu/osdep.h"
  23#include "softfloat.h"
  24#include "fpu/softfloat-macros.h"
  25#include "softfloat_fpsp_tables.h"
  26
  27#define pi_exp      0x4000
  28#define piby2_exp   0x3FFF
  29#define pi_sig      UINT64_C(0xc90fdaa22168c235)
  30
  31static floatx80 propagateFloatx80NaNOneArg(floatx80 a, float_status *status)
  32{
  33    if (floatx80_is_signaling_nan(a, status)) {
  34        float_raise(float_flag_invalid, status);
  35        a = floatx80_silence_nan(a, status);
  36    }
  37
  38    if (status->default_nan_mode) {
  39        return floatx80_default_nan(status);
  40    }
  41
  42    return a;
  43}
  44
  45/*
  46 * Returns the mantissa of the extended double-precision floating-point
  47 * value `a'.
  48 */
  49
  50floatx80 floatx80_getman(floatx80 a, float_status *status)
  51{
  52    bool aSign;
  53    int32_t aExp;
  54    uint64_t aSig;
  55
  56    aSig = extractFloatx80Frac(a);
  57    aExp = extractFloatx80Exp(a);
  58    aSign = extractFloatx80Sign(a);
  59
  60    if (aExp == 0x7FFF) {
  61        if ((uint64_t) (aSig << 1)) {
  62            return propagateFloatx80NaNOneArg(a , status);
  63        }
  64        float_raise(float_flag_invalid , status);
  65        return floatx80_default_nan(status);
  66    }
  67
  68    if (aExp == 0) {
  69        if (aSig == 0) {
  70            return packFloatx80(aSign, 0, 0);
  71        }
  72        normalizeFloatx80Subnormal(aSig, &aExp, &aSig);
  73    }
  74
  75    return roundAndPackFloatx80(status->floatx80_rounding_precision, aSign,
  76                                0x3FFF, aSig, 0, status);
  77}
  78
  79/*
  80 * Returns the exponent of the extended double-precision floating-point
  81 * value `a' as an extended double-precision value.
  82 */
  83
  84floatx80 floatx80_getexp(floatx80 a, float_status *status)
  85{
  86    bool aSign;
  87    int32_t aExp;
  88    uint64_t aSig;
  89
  90    aSig = extractFloatx80Frac(a);
  91    aExp = extractFloatx80Exp(a);
  92    aSign = extractFloatx80Sign(a);
  93
  94    if (aExp == 0x7FFF) {
  95        if ((uint64_t) (aSig << 1)) {
  96            return propagateFloatx80NaNOneArg(a , status);
  97        }
  98        float_raise(float_flag_invalid , status);
  99        return floatx80_default_nan(status);
 100    }
 101
 102    if (aExp == 0) {
 103        if (aSig == 0) {
 104            return packFloatx80(aSign, 0, 0);
 105        }
 106        normalizeFloatx80Subnormal(aSig, &aExp, &aSig);
 107    }
 108
 109    return int32_to_floatx80(aExp - 0x3FFF, status);
 110}
 111
 112/*
 113 * Scales extended double-precision floating-point value in operand `a' by
 114 * value `b'. The function truncates the value in the second operand 'b' to
 115 * an integral value and adds that value to the exponent of the operand 'a'.
 116 * The operation performed according to the IEC/IEEE Standard for Binary
 117 * Floating-Point Arithmetic.
 118 */
 119
 120floatx80 floatx80_scale(floatx80 a, floatx80 b, float_status *status)
 121{
 122    bool aSign, bSign;
 123    int32_t aExp, bExp, shiftCount;
 124    uint64_t aSig, bSig;
 125
 126    aSig = extractFloatx80Frac(a);
 127    aExp = extractFloatx80Exp(a);
 128    aSign = extractFloatx80Sign(a);
 129    bSig = extractFloatx80Frac(b);
 130    bExp = extractFloatx80Exp(b);
 131    bSign = extractFloatx80Sign(b);
 132
 133    if (bExp == 0x7FFF) {
 134        if ((uint64_t) (bSig << 1) ||
 135            ((aExp == 0x7FFF) && (uint64_t) (aSig << 1))) {
 136            return propagateFloatx80NaN(a, b, status);
 137        }
 138        float_raise(float_flag_invalid , status);
 139        return floatx80_default_nan(status);
 140    }
 141    if (aExp == 0x7FFF) {
 142        if ((uint64_t) (aSig << 1)) {
 143            return propagateFloatx80NaN(a, b, status);
 144        }
 145        return packFloatx80(aSign, floatx80_infinity.high,
 146                            floatx80_infinity.low);
 147    }
 148    if (aExp == 0) {
 149        if (aSig == 0) {
 150            return packFloatx80(aSign, 0, 0);
 151        }
 152        if (bExp < 0x3FFF) {
 153            return a;
 154        }
 155        normalizeFloatx80Subnormal(aSig, &aExp, &aSig);
 156    }
 157
 158    if (bExp < 0x3FFF) {
 159        return a;
 160    }
 161
 162    if (0x400F < bExp) {
 163        aExp = bSign ? -0x6001 : 0xE000;
 164        return roundAndPackFloatx80(status->floatx80_rounding_precision,
 165                                    aSign, aExp, aSig, 0, status);
 166    }
 167
 168    shiftCount = 0x403E - bExp;
 169    bSig >>= shiftCount;
 170    aExp = bSign ? (aExp - bSig) : (aExp + bSig);
 171
 172    return roundAndPackFloatx80(status->floatx80_rounding_precision,
 173                                aSign, aExp, aSig, 0, status);
 174}
 175
 176floatx80 floatx80_move(floatx80 a, float_status *status)
 177{
 178    bool aSign;
 179    int32_t aExp;
 180    uint64_t aSig;
 181
 182    aSig = extractFloatx80Frac(a);
 183    aExp = extractFloatx80Exp(a);
 184    aSign = extractFloatx80Sign(a);
 185
 186    if (aExp == 0x7FFF) {
 187        if ((uint64_t)(aSig << 1)) {
 188            return propagateFloatx80NaNOneArg(a, status);
 189        }
 190        return a;
 191    }
 192    if (aExp == 0) {
 193        if (aSig == 0) {
 194            return a;
 195        }
 196        normalizeRoundAndPackFloatx80(status->floatx80_rounding_precision,
 197                                      aSign, aExp, aSig, 0, status);
 198    }
 199    return roundAndPackFloatx80(status->floatx80_rounding_precision, aSign,
 200                                aExp, aSig, 0, status);
 201}
 202
 203/*
 204 * Algorithms for transcendental functions supported by MC68881 and MC68882
 205 * mathematical coprocessors. The functions are derived from FPSP library.
 206 */
 207
 208#define one_exp     0x3FFF
 209#define one_sig     UINT64_C(0x8000000000000000)
 210
 211/*
 212 * Function for compactifying extended double-precision floating point values.
 213 */
 214
 215static int32_t floatx80_make_compact(int32_t aExp, uint64_t aSig)
 216{
 217    return (aExp << 16) | (aSig >> 48);
 218}
 219
 220/*
 221 * Log base e of x plus 1
 222 */
 223
 224floatx80 floatx80_lognp1(floatx80 a, float_status *status)
 225{
 226    bool aSign;
 227    int32_t aExp;
 228    uint64_t aSig, fSig;
 229
 230    int8_t user_rnd_mode, user_rnd_prec;
 231
 232    int32_t compact, j, k;
 233    floatx80 fp0, fp1, fp2, fp3, f, logof2, klog2, saveu;
 234
 235    aSig = extractFloatx80Frac(a);
 236    aExp = extractFloatx80Exp(a);
 237    aSign = extractFloatx80Sign(a);
 238
 239    if (aExp == 0x7FFF) {
 240        if ((uint64_t) (aSig << 1)) {
 241            propagateFloatx80NaNOneArg(a, status);
 242        }
 243        if (aSign) {
 244            float_raise(float_flag_invalid, status);
 245            return floatx80_default_nan(status);
 246        }
 247        return packFloatx80(0, floatx80_infinity.high, floatx80_infinity.low);
 248    }
 249
 250    if (aExp == 0 && aSig == 0) {
 251        return packFloatx80(aSign, 0, 0);
 252    }
 253
 254    if (aSign && aExp >= one_exp) {
 255        if (aExp == one_exp && aSig == one_sig) {
 256            float_raise(float_flag_divbyzero, status);
 257            return packFloatx80(aSign, floatx80_infinity.high,
 258                                floatx80_infinity.low);
 259        }
 260        float_raise(float_flag_invalid, status);
 261        return floatx80_default_nan(status);
 262    }
 263
 264    if (aExp < 0x3f99 || (aExp == 0x3f99 && aSig == one_sig)) {
 265        /* <= min threshold */
 266        float_raise(float_flag_inexact, status);
 267        return floatx80_move(a, status);
 268    }
 269
 270    user_rnd_mode = status->float_rounding_mode;
 271    user_rnd_prec = status->floatx80_rounding_precision;
 272    status->float_rounding_mode = float_round_nearest_even;
 273    status->floatx80_rounding_precision = 80;
 274
 275    compact = floatx80_make_compact(aExp, aSig);
 276
 277    fp0 = a; /* Z */
 278    fp1 = a;
 279
 280    fp0 = floatx80_add(fp0, float32_to_floatx80(make_float32(0x3F800000),
 281                       status), status); /* X = (1+Z) */
 282
 283    aExp = extractFloatx80Exp(fp0);
 284    aSig = extractFloatx80Frac(fp0);
 285
 286    compact = floatx80_make_compact(aExp, aSig);
 287
 288    if (compact < 0x3FFE8000 || compact > 0x3FFFC000) {
 289        /* |X| < 1/2 or |X| > 3/2 */
 290        k = aExp - 0x3FFF;
 291        fp1 = int32_to_floatx80(k, status);
 292
 293        fSig = (aSig & UINT64_C(0xFE00000000000000)) | UINT64_C(0x0100000000000000);
 294        j = (fSig >> 56) & 0x7E; /* DISPLACEMENT FOR 1/F */
 295
 296        f = packFloatx80(0, 0x3FFF, fSig); /* F */
 297        fp0 = packFloatx80(0, 0x3FFF, aSig); /* Y */
 298
 299        fp0 = floatx80_sub(fp0, f, status); /* Y-F */
 300
 301    lp1cont1:
 302        /* LP1CONT1 */
 303        fp0 = floatx80_mul(fp0, log_tbl[j], status); /* FP0 IS U = (Y-F)/F */
 304        logof2 = packFloatx80(0, 0x3FFE, UINT64_C(0xB17217F7D1CF79AC));
 305        klog2 = floatx80_mul(fp1, logof2, status); /* FP1 IS K*LOG2 */
 306        fp2 = floatx80_mul(fp0, fp0, status); /* FP2 IS V=U*U */
 307
 308        fp3 = fp2;
 309        fp1 = fp2;
 310
 311        fp1 = floatx80_mul(fp1, float64_to_floatx80(
 312                           make_float64(0x3FC2499AB5E4040B), status),
 313                           status); /* V*A6 */
 314        fp2 = floatx80_mul(fp2, float64_to_floatx80(
 315                           make_float64(0xBFC555B5848CB7DB), status),
 316                           status); /* V*A5 */
 317        fp1 = floatx80_add(fp1, float64_to_floatx80(
 318                           make_float64(0x3FC99999987D8730), status),
 319                           status); /* A4+V*A6 */
 320        fp2 = floatx80_add(fp2, float64_to_floatx80(
 321                           make_float64(0xBFCFFFFFFF6F7E97), status),
 322                           status); /* A3+V*A5 */
 323        fp1 = floatx80_mul(fp1, fp3, status); /* V*(A4+V*A6) */
 324        fp2 = floatx80_mul(fp2, fp3, status); /* V*(A3+V*A5) */
 325        fp1 = floatx80_add(fp1, float64_to_floatx80(
 326                           make_float64(0x3FD55555555555A4), status),
 327                           status); /* A2+V*(A4+V*A6) */
 328        fp2 = floatx80_add(fp2, float64_to_floatx80(
 329                           make_float64(0xBFE0000000000008), status),
 330                           status); /* A1+V*(A3+V*A5) */
 331        fp1 = floatx80_mul(fp1, fp3, status); /* V*(A2+V*(A4+V*A6)) */
 332        fp2 = floatx80_mul(fp2, fp3, status); /* V*(A1+V*(A3+V*A5)) */
 333        fp1 = floatx80_mul(fp1, fp0, status); /* U*V*(A2+V*(A4+V*A6)) */
 334        fp0 = floatx80_add(fp0, fp2, status); /* U+V*(A1+V*(A3+V*A5)) */
 335
 336        fp1 = floatx80_add(fp1, log_tbl[j + 1],
 337                           status); /* LOG(F)+U*V*(A2+V*(A4+V*A6)) */
 338        fp0 = floatx80_add(fp0, fp1, status); /* FP0 IS LOG(F) + LOG(1+U) */
 339
 340        status->float_rounding_mode = user_rnd_mode;
 341        status->floatx80_rounding_precision = user_rnd_prec;
 342
 343        a = floatx80_add(fp0, klog2, status);
 344
 345        float_raise(float_flag_inexact, status);
 346
 347        return a;
 348    } else if (compact < 0x3FFEF07D || compact > 0x3FFF8841) {
 349        /* |X| < 1/16 or |X| > -1/16 */
 350        /* LP1CARE */
 351        fSig = (aSig & UINT64_C(0xFE00000000000000)) | UINT64_C(0x0100000000000000);
 352        f = packFloatx80(0, 0x3FFF, fSig); /* F */
 353        j = (fSig >> 56) & 0x7E; /* DISPLACEMENT FOR 1/F */
 354
 355        if (compact >= 0x3FFF8000) { /* 1+Z >= 1 */
 356            /* KISZERO */
 357            fp0 = floatx80_sub(float32_to_floatx80(make_float32(0x3F800000),
 358                               status), f, status); /* 1-F */
 359            fp0 = floatx80_add(fp0, fp1, status); /* FP0 IS Y-F = (1-F)+Z */
 360            fp1 = packFloatx80(0, 0, 0); /* K = 0 */
 361        } else {
 362            /* KISNEG */
 363            fp0 = floatx80_sub(float32_to_floatx80(make_float32(0x40000000),
 364                               status), f, status); /* 2-F */
 365            fp1 = floatx80_add(fp1, fp1, status); /* 2Z */
 366            fp0 = floatx80_add(fp0, fp1, status); /* FP0 IS Y-F = (2-F)+2Z */
 367            fp1 = packFloatx80(1, one_exp, one_sig); /* K = -1 */
 368        }
 369        goto lp1cont1;
 370    } else {
 371        /* LP1ONE16 */
 372        fp1 = floatx80_add(fp1, fp1, status); /* FP1 IS 2Z */
 373        fp0 = floatx80_add(fp0, float32_to_floatx80(make_float32(0x3F800000),
 374                           status), status); /* FP0 IS 1+X */
 375
 376        /* LP1CONT2 */
 377        fp1 = floatx80_div(fp1, fp0, status); /* U */
 378        saveu = fp1;
 379        fp0 = floatx80_mul(fp1, fp1, status); /* FP0 IS V = U*U */
 380        fp1 = floatx80_mul(fp0, fp0, status); /* FP1 IS W = V*V */
 381
 382        fp3 = float64_to_floatx80(make_float64(0x3F175496ADD7DAD6),
 383                                  status); /* B5 */
 384        fp2 = float64_to_floatx80(make_float64(0x3F3C71C2FE80C7E0),
 385                                  status); /* B4 */
 386        fp3 = floatx80_mul(fp3, fp1, status); /* W*B5 */
 387        fp2 = floatx80_mul(fp2, fp1, status); /* W*B4 */
 388        fp3 = floatx80_add(fp3, float64_to_floatx80(
 389                           make_float64(0x3F624924928BCCFF), status),
 390                           status); /* B3+W*B5 */
 391        fp2 = floatx80_add(fp2, float64_to_floatx80(
 392                           make_float64(0x3F899999999995EC), status),
 393                           status); /* B2+W*B4 */
 394        fp1 = floatx80_mul(fp1, fp3, status); /* W*(B3+W*B5) */
 395        fp2 = floatx80_mul(fp2, fp0, status); /* V*(B2+W*B4) */
 396        fp1 = floatx80_add(fp1, float64_to_floatx80(
 397                           make_float64(0x3FB5555555555555), status),
 398                           status); /* B1+W*(B3+W*B5) */
 399
 400        fp0 = floatx80_mul(fp0, saveu, status); /* FP0 IS U*V */
 401        fp1 = floatx80_add(fp1, fp2,
 402                           status); /* B1+W*(B3+W*B5) + V*(B2+W*B4) */
 403        fp0 = floatx80_mul(fp0, fp1,
 404                           status); /* U*V*([B1+W*(B3+W*B5)] + [V*(B2+W*B4)]) */
 405
 406        status->float_rounding_mode = user_rnd_mode;
 407        status->floatx80_rounding_precision = user_rnd_prec;
 408
 409        a = floatx80_add(fp0, saveu, status);
 410
 411        /*if (!floatx80_is_zero(a)) { */
 412            float_raise(float_flag_inexact, status);
 413        /*} */
 414
 415        return a;
 416    }
 417}
 418
 419/*
 420 * Log base e
 421 */
 422
 423floatx80 floatx80_logn(floatx80 a, float_status *status)
 424{
 425    bool aSign;
 426    int32_t aExp;
 427    uint64_t aSig, fSig;
 428
 429    int8_t user_rnd_mode, user_rnd_prec;
 430
 431    int32_t compact, j, k, adjk;
 432    floatx80 fp0, fp1, fp2, fp3, f, logof2, klog2, saveu;
 433
 434    aSig = extractFloatx80Frac(a);
 435    aExp = extractFloatx80Exp(a);
 436    aSign = extractFloatx80Sign(a);
 437
 438    if (aExp == 0x7FFF) {
 439        if ((uint64_t) (aSig << 1)) {
 440            propagateFloatx80NaNOneArg(a, status);
 441        }
 442        if (aSign == 0) {
 443            return packFloatx80(0, floatx80_infinity.high,
 444                                floatx80_infinity.low);
 445        }
 446    }
 447
 448    adjk = 0;
 449
 450    if (aExp == 0) {
 451        if (aSig == 0) { /* zero */
 452            float_raise(float_flag_divbyzero, status);
 453            return packFloatx80(1, floatx80_infinity.high,
 454                                floatx80_infinity.low);
 455        }
 456        if ((aSig & one_sig) == 0) { /* denormal */
 457            normalizeFloatx80Subnormal(aSig, &aExp, &aSig);
 458            adjk = -100;
 459            aExp += 100;
 460            a = packFloatx80(aSign, aExp, aSig);
 461        }
 462    }
 463
 464    if (aSign) {
 465        float_raise(float_flag_invalid, status);
 466        return floatx80_default_nan(status);
 467    }
 468
 469    user_rnd_mode = status->float_rounding_mode;
 470    user_rnd_prec = status->floatx80_rounding_precision;
 471    status->float_rounding_mode = float_round_nearest_even;
 472    status->floatx80_rounding_precision = 80;
 473
 474    compact = floatx80_make_compact(aExp, aSig);
 475
 476    if (compact < 0x3FFEF07D || compact > 0x3FFF8841) {
 477        /* |X| < 15/16 or |X| > 17/16 */
 478        k = aExp - 0x3FFF;
 479        k += adjk;
 480        fp1 = int32_to_floatx80(k, status);
 481
 482        fSig = (aSig & UINT64_C(0xFE00000000000000)) | UINT64_C(0x0100000000000000);
 483        j = (fSig >> 56) & 0x7E; /* DISPLACEMENT FOR 1/F */
 484
 485        f = packFloatx80(0, 0x3FFF, fSig); /* F */
 486        fp0 = packFloatx80(0, 0x3FFF, aSig); /* Y */
 487
 488        fp0 = floatx80_sub(fp0, f, status); /* Y-F */
 489
 490        /* LP1CONT1 */
 491        fp0 = floatx80_mul(fp0, log_tbl[j], status); /* FP0 IS U = (Y-F)/F */
 492        logof2 = packFloatx80(0, 0x3FFE, UINT64_C(0xB17217F7D1CF79AC));
 493        klog2 = floatx80_mul(fp1, logof2, status); /* FP1 IS K*LOG2 */
 494        fp2 = floatx80_mul(fp0, fp0, status); /* FP2 IS V=U*U */
 495
 496        fp3 = fp2;
 497        fp1 = fp2;
 498
 499        fp1 = floatx80_mul(fp1, float64_to_floatx80(
 500                           make_float64(0x3FC2499AB5E4040B), status),
 501                           status); /* V*A6 */
 502        fp2 = floatx80_mul(fp2, float64_to_floatx80(
 503                           make_float64(0xBFC555B5848CB7DB), status),
 504                           status); /* V*A5 */
 505        fp1 = floatx80_add(fp1, float64_to_floatx80(
 506                           make_float64(0x3FC99999987D8730), status),
 507                           status); /* A4+V*A6 */
 508        fp2 = floatx80_add(fp2, float64_to_floatx80(
 509                           make_float64(0xBFCFFFFFFF6F7E97), status),
 510                           status); /* A3+V*A5 */
 511        fp1 = floatx80_mul(fp1, fp3, status); /* V*(A4+V*A6) */
 512        fp2 = floatx80_mul(fp2, fp3, status); /* V*(A3+V*A5) */
 513        fp1 = floatx80_add(fp1, float64_to_floatx80(
 514                           make_float64(0x3FD55555555555A4), status),
 515                           status); /* A2+V*(A4+V*A6) */
 516        fp2 = floatx80_add(fp2, float64_to_floatx80(
 517                           make_float64(0xBFE0000000000008), status),
 518                           status); /* A1+V*(A3+V*A5) */
 519        fp1 = floatx80_mul(fp1, fp3, status); /* V*(A2+V*(A4+V*A6)) */
 520        fp2 = floatx80_mul(fp2, fp3, status); /* V*(A1+V*(A3+V*A5)) */
 521        fp1 = floatx80_mul(fp1, fp0, status); /* U*V*(A2+V*(A4+V*A6)) */
 522        fp0 = floatx80_add(fp0, fp2, status); /* U+V*(A1+V*(A3+V*A5)) */
 523
 524        fp1 = floatx80_add(fp1, log_tbl[j + 1],
 525                           status); /* LOG(F)+U*V*(A2+V*(A4+V*A6)) */
 526        fp0 = floatx80_add(fp0, fp1, status); /* FP0 IS LOG(F) + LOG(1+U) */
 527
 528        status->float_rounding_mode = user_rnd_mode;
 529        status->floatx80_rounding_precision = user_rnd_prec;
 530
 531        a = floatx80_add(fp0, klog2, status);
 532
 533        float_raise(float_flag_inexact, status);
 534
 535        return a;
 536    } else { /* |X-1| >= 1/16 */
 537        fp0 = a;
 538        fp1 = a;
 539        fp1 = floatx80_sub(fp1, float32_to_floatx80(make_float32(0x3F800000),
 540                           status), status); /* FP1 IS X-1 */
 541        fp0 = floatx80_add(fp0, float32_to_floatx80(make_float32(0x3F800000),
 542                           status), status); /* FP0 IS X+1 */
 543        fp1 = floatx80_add(fp1, fp1, status); /* FP1 IS 2(X-1) */
 544
 545        /* LP1CONT2 */
 546        fp1 = floatx80_div(fp1, fp0, status); /* U */
 547        saveu = fp1;
 548        fp0 = floatx80_mul(fp1, fp1, status); /* FP0 IS V = U*U */
 549        fp1 = floatx80_mul(fp0, fp0, status); /* FP1 IS W = V*V */
 550
 551        fp3 = float64_to_floatx80(make_float64(0x3F175496ADD7DAD6),
 552                                  status); /* B5 */
 553        fp2 = float64_to_floatx80(make_float64(0x3F3C71C2FE80C7E0),
 554                                  status); /* B4 */
 555        fp3 = floatx80_mul(fp3, fp1, status); /* W*B5 */
 556        fp2 = floatx80_mul(fp2, fp1, status); /* W*B4 */
 557        fp3 = floatx80_add(fp3, float64_to_floatx80(
 558                           make_float64(0x3F624924928BCCFF), status),
 559                           status); /* B3+W*B5 */
 560        fp2 = floatx80_add(fp2, float64_to_floatx80(
 561                           make_float64(0x3F899999999995EC), status),
 562                           status); /* B2+W*B4 */
 563        fp1 = floatx80_mul(fp1, fp3, status); /* W*(B3+W*B5) */
 564        fp2 = floatx80_mul(fp2, fp0, status); /* V*(B2+W*B4) */
 565        fp1 = floatx80_add(fp1, float64_to_floatx80(
 566                           make_float64(0x3FB5555555555555), status),
 567                           status); /* B1+W*(B3+W*B5) */
 568
 569        fp0 = floatx80_mul(fp0, saveu, status); /* FP0 IS U*V */
 570        fp1 = floatx80_add(fp1, fp2, status); /* B1+W*(B3+W*B5) + V*(B2+W*B4) */
 571        fp0 = floatx80_mul(fp0, fp1,
 572                           status); /* U*V*([B1+W*(B3+W*B5)] + [V*(B2+W*B4)]) */
 573
 574        status->float_rounding_mode = user_rnd_mode;
 575        status->floatx80_rounding_precision = user_rnd_prec;
 576
 577        a = floatx80_add(fp0, saveu, status);
 578
 579        /*if (!floatx80_is_zero(a)) { */
 580            float_raise(float_flag_inexact, status);
 581        /*} */
 582
 583        return a;
 584    }
 585}
 586
 587/*
 588 * Log base 10
 589 */
 590
 591floatx80 floatx80_log10(floatx80 a, float_status *status)
 592{
 593    bool aSign;
 594    int32_t aExp;
 595    uint64_t aSig;
 596
 597    int8_t user_rnd_mode, user_rnd_prec;
 598
 599    floatx80 fp0, fp1;
 600
 601    aSig = extractFloatx80Frac(a);
 602    aExp = extractFloatx80Exp(a);
 603    aSign = extractFloatx80Sign(a);
 604
 605    if (aExp == 0x7FFF) {
 606        if ((uint64_t) (aSig << 1)) {
 607            propagateFloatx80NaNOneArg(a, status);
 608        }
 609        if (aSign == 0) {
 610            return packFloatx80(0, floatx80_infinity.high,
 611                                floatx80_infinity.low);
 612        }
 613    }
 614
 615    if (aExp == 0 && aSig == 0) {
 616        float_raise(float_flag_divbyzero, status);
 617        return packFloatx80(1, floatx80_infinity.high,
 618                            floatx80_infinity.low);
 619    }
 620
 621    if (aSign) {
 622        float_raise(float_flag_invalid, status);
 623        return floatx80_default_nan(status);
 624    }
 625
 626    user_rnd_mode = status->float_rounding_mode;
 627    user_rnd_prec = status->floatx80_rounding_precision;
 628    status->float_rounding_mode = float_round_nearest_even;
 629    status->floatx80_rounding_precision = 80;
 630
 631    fp0 = floatx80_logn(a, status);
 632    fp1 = packFloatx80(0, 0x3FFD, UINT64_C(0xDE5BD8A937287195)); /* INV_L10 */
 633
 634    status->float_rounding_mode = user_rnd_mode;
 635    status->floatx80_rounding_precision = user_rnd_prec;
 636
 637    a = floatx80_mul(fp0, fp1, status); /* LOGN(X)*INV_L10 */
 638
 639    float_raise(float_flag_inexact, status);
 640
 641    return a;
 642}
 643
 644/*
 645 * Log base 2
 646 */
 647
 648floatx80 floatx80_log2(floatx80 a, float_status *status)
 649{
 650    bool aSign;
 651    int32_t aExp;
 652    uint64_t aSig;
 653
 654    int8_t user_rnd_mode, user_rnd_prec;
 655
 656    floatx80 fp0, fp1;
 657
 658    aSig = extractFloatx80Frac(a);
 659    aExp = extractFloatx80Exp(a);
 660    aSign = extractFloatx80Sign(a);
 661
 662    if (aExp == 0x7FFF) {
 663        if ((uint64_t) (aSig << 1)) {
 664            propagateFloatx80NaNOneArg(a, status);
 665        }
 666        if (aSign == 0) {
 667            return packFloatx80(0, floatx80_infinity.high,
 668                                floatx80_infinity.low);
 669        }
 670    }
 671
 672    if (aExp == 0) {
 673        if (aSig == 0) {
 674            float_raise(float_flag_divbyzero, status);
 675            return packFloatx80(1, floatx80_infinity.high,
 676                                floatx80_infinity.low);
 677        }
 678        normalizeFloatx80Subnormal(aSig, &aExp, &aSig);
 679    }
 680
 681    if (aSign) {
 682        float_raise(float_flag_invalid, status);
 683        return floatx80_default_nan(status);
 684    }
 685
 686    user_rnd_mode = status->float_rounding_mode;
 687    user_rnd_prec = status->floatx80_rounding_precision;
 688    status->float_rounding_mode = float_round_nearest_even;
 689    status->floatx80_rounding_precision = 80;
 690
 691    if (aSig == one_sig) { /* X is 2^k */
 692        status->float_rounding_mode = user_rnd_mode;
 693        status->floatx80_rounding_precision = user_rnd_prec;
 694
 695        a = int32_to_floatx80(aExp - 0x3FFF, status);
 696    } else {
 697        fp0 = floatx80_logn(a, status);
 698        fp1 = packFloatx80(0, 0x3FFF, UINT64_C(0xB8AA3B295C17F0BC)); /* INV_L2 */
 699
 700        status->float_rounding_mode = user_rnd_mode;
 701        status->floatx80_rounding_precision = user_rnd_prec;
 702
 703        a = floatx80_mul(fp0, fp1, status); /* LOGN(X)*INV_L2 */
 704    }
 705
 706    float_raise(float_flag_inexact, status);
 707
 708    return a;
 709}
 710
 711/*
 712 * e to x
 713 */
 714
 715floatx80 floatx80_etox(floatx80 a, float_status *status)
 716{
 717    bool aSign;
 718    int32_t aExp;
 719    uint64_t aSig;
 720
 721    int8_t user_rnd_mode, user_rnd_prec;
 722
 723    int32_t compact, n, j, k, m, m1;
 724    floatx80 fp0, fp1, fp2, fp3, l2, scale, adjscale;
 725    bool adjflag;
 726
 727    aSig = extractFloatx80Frac(a);
 728    aExp = extractFloatx80Exp(a);
 729    aSign = extractFloatx80Sign(a);
 730
 731    if (aExp == 0x7FFF) {
 732        if ((uint64_t) (aSig << 1)) {
 733            return propagateFloatx80NaNOneArg(a, status);
 734        }
 735        if (aSign) {
 736            return packFloatx80(0, 0, 0);
 737        }
 738        return packFloatx80(0, floatx80_infinity.high,
 739                            floatx80_infinity.low);
 740    }
 741
 742    if (aExp == 0 && aSig == 0) {
 743        return packFloatx80(0, one_exp, one_sig);
 744    }
 745
 746    user_rnd_mode = status->float_rounding_mode;
 747    user_rnd_prec = status->floatx80_rounding_precision;
 748    status->float_rounding_mode = float_round_nearest_even;
 749    status->floatx80_rounding_precision = 80;
 750
 751    adjflag = 0;
 752
 753    if (aExp >= 0x3FBE) { /* |X| >= 2^(-65) */
 754        compact = floatx80_make_compact(aExp, aSig);
 755
 756        if (compact < 0x400CB167) { /* |X| < 16380 log2 */
 757            fp0 = a;
 758            fp1 = a;
 759            fp0 = floatx80_mul(fp0, float32_to_floatx80(
 760                               make_float32(0x42B8AA3B), status),
 761                               status); /* 64/log2 * X */
 762            adjflag = 0;
 763            n = floatx80_to_int32(fp0, status); /* int(64/log2*X) */
 764            fp0 = int32_to_floatx80(n, status);
 765
 766            j = n & 0x3F; /* J = N mod 64 */
 767            m = n / 64; /* NOTE: this is really arithmetic right shift by 6 */
 768            if (n < 0 && j) {
 769                /*
 770                 * arithmetic right shift is division and
 771                 * round towards minus infinity
 772                 */
 773                m--;
 774            }
 775            m += 0x3FFF; /* biased exponent of 2^(M) */
 776
 777        expcont1:
 778            fp2 = fp0; /* N */
 779            fp0 = floatx80_mul(fp0, float32_to_floatx80(
 780                               make_float32(0xBC317218), status),
 781                               status); /* N * L1, L1 = lead(-log2/64) */
 782            l2 = packFloatx80(0, 0x3FDC, UINT64_C(0x82E308654361C4C6));
 783            fp2 = floatx80_mul(fp2, l2, status); /* N * L2, L1+L2 = -log2/64 */
 784            fp0 = floatx80_add(fp0, fp1, status); /* X + N*L1 */
 785            fp0 = floatx80_add(fp0, fp2, status); /* R */
 786
 787            fp1 = floatx80_mul(fp0, fp0, status); /* S = R*R */
 788            fp2 = float32_to_floatx80(make_float32(0x3AB60B70),
 789                                      status); /* A5 */
 790            fp2 = floatx80_mul(fp2, fp1, status); /* fp2 is S*A5 */
 791            fp3 = floatx80_mul(float32_to_floatx80(make_float32(0x3C088895),
 792                               status), fp1,
 793                               status); /* fp3 is S*A4 */
 794            fp2 = floatx80_add(fp2, float64_to_floatx80(make_float64(
 795                               0x3FA5555555554431), status),
 796                               status); /* fp2 is A3+S*A5 */
 797            fp3 = floatx80_add(fp3, float64_to_floatx80(make_float64(
 798                               0x3FC5555555554018), status),
 799                               status); /* fp3 is A2+S*A4 */
 800            fp2 = floatx80_mul(fp2, fp1, status); /* fp2 is S*(A3+S*A5) */
 801            fp3 = floatx80_mul(fp3, fp1, status); /* fp3 is S*(A2+S*A4) */
 802            fp2 = floatx80_add(fp2, float32_to_floatx80(
 803                               make_float32(0x3F000000), status),
 804                               status); /* fp2 is A1+S*(A3+S*A5) */
 805            fp3 = floatx80_mul(fp3, fp0, status); /* fp3 IS R*S*(A2+S*A4) */
 806            fp2 = floatx80_mul(fp2, fp1,
 807                               status); /* fp2 IS S*(A1+S*(A3+S*A5)) */
 808            fp0 = floatx80_add(fp0, fp3, status); /* fp0 IS R+R*S*(A2+S*A4) */
 809            fp0 = floatx80_add(fp0, fp2, status); /* fp0 IS EXP(R) - 1 */
 810
 811            fp1 = exp_tbl[j];
 812            fp0 = floatx80_mul(fp0, fp1, status); /* 2^(J/64)*(Exp(R)-1) */
 813            fp0 = floatx80_add(fp0, float32_to_floatx80(exp_tbl2[j], status),
 814                               status); /* accurate 2^(J/64) */
 815            fp0 = floatx80_add(fp0, fp1,
 816                               status); /* 2^(J/64) + 2^(J/64)*(Exp(R)-1) */
 817
 818            scale = packFloatx80(0, m, one_sig);
 819            if (adjflag) {
 820                adjscale = packFloatx80(0, m1, one_sig);
 821                fp0 = floatx80_mul(fp0, adjscale, status);
 822            }
 823
 824            status->float_rounding_mode = user_rnd_mode;
 825            status->floatx80_rounding_precision = user_rnd_prec;
 826
 827            a = floatx80_mul(fp0, scale, status);
 828
 829            float_raise(float_flag_inexact, status);
 830
 831            return a;
 832        } else { /* |X| >= 16380 log2 */
 833            if (compact > 0x400CB27C) { /* |X| >= 16480 log2 */
 834                status->float_rounding_mode = user_rnd_mode;
 835                status->floatx80_rounding_precision = user_rnd_prec;
 836                if (aSign) {
 837                    a = roundAndPackFloatx80(
 838                                           status->floatx80_rounding_precision,
 839                                           0, -0x1000, aSig, 0, status);
 840                } else {
 841                    a = roundAndPackFloatx80(
 842                                           status->floatx80_rounding_precision,
 843                                           0, 0x8000, aSig, 0, status);
 844                }
 845                float_raise(float_flag_inexact, status);
 846
 847                return a;
 848            } else {
 849                fp0 = a;
 850                fp1 = a;
 851                fp0 = floatx80_mul(fp0, float32_to_floatx80(
 852                                   make_float32(0x42B8AA3B), status),
 853                                   status); /* 64/log2 * X */
 854                adjflag = 1;
 855                n = floatx80_to_int32(fp0, status); /* int(64/log2*X) */
 856                fp0 = int32_to_floatx80(n, status);
 857
 858                j = n & 0x3F; /* J = N mod 64 */
 859                /* NOTE: this is really arithmetic right shift by 6 */
 860                k = n / 64;
 861                if (n < 0 && j) {
 862                    /* arithmetic right shift is division and
 863                     * round towards minus infinity
 864                     */
 865                    k--;
 866                }
 867                /* NOTE: this is really arithmetic right shift by 1 */
 868                m1 = k / 2;
 869                if (k < 0 && (k & 1)) {
 870                    /* arithmetic right shift is division and
 871                     * round towards minus infinity
 872                     */
 873                    m1--;
 874                }
 875                m = k - m1;
 876                m1 += 0x3FFF; /* biased exponent of 2^(M1) */
 877                m += 0x3FFF; /* biased exponent of 2^(M) */
 878
 879                goto expcont1;
 880            }
 881        }
 882    } else { /* |X| < 2^(-65) */
 883        status->float_rounding_mode = user_rnd_mode;
 884        status->floatx80_rounding_precision = user_rnd_prec;
 885
 886        a = floatx80_add(a, float32_to_floatx80(make_float32(0x3F800000),
 887                         status), status); /* 1 + X */
 888
 889        float_raise(float_flag_inexact, status);
 890
 891        return a;
 892    }
 893}
 894
 895/*
 896 * 2 to x
 897 */
 898
 899floatx80 floatx80_twotox(floatx80 a, float_status *status)
 900{
 901    bool aSign;
 902    int32_t aExp;
 903    uint64_t aSig;
 904
 905    int8_t user_rnd_mode, user_rnd_prec;
 906
 907    int32_t compact, n, j, l, m, m1;
 908    floatx80 fp0, fp1, fp2, fp3, adjfact, fact1, fact2;
 909
 910    aSig = extractFloatx80Frac(a);
 911    aExp = extractFloatx80Exp(a);
 912    aSign = extractFloatx80Sign(a);
 913
 914    if (aExp == 0x7FFF) {
 915        if ((uint64_t) (aSig << 1)) {
 916            return propagateFloatx80NaNOneArg(a, status);
 917        }
 918        if (aSign) {
 919            return packFloatx80(0, 0, 0);
 920        }
 921        return packFloatx80(0, floatx80_infinity.high,
 922                            floatx80_infinity.low);
 923    }
 924
 925    if (aExp == 0 && aSig == 0) {
 926        return packFloatx80(0, one_exp, one_sig);
 927    }
 928
 929    user_rnd_mode = status->float_rounding_mode;
 930    user_rnd_prec = status->floatx80_rounding_precision;
 931    status->float_rounding_mode = float_round_nearest_even;
 932    status->floatx80_rounding_precision = 80;
 933
 934    fp0 = a;
 935
 936    compact = floatx80_make_compact(aExp, aSig);
 937
 938    if (compact < 0x3FB98000 || compact > 0x400D80C0) {
 939        /* |X| > 16480 or |X| < 2^(-70) */
 940        if (compact > 0x3FFF8000) { /* |X| > 16480 */
 941            status->float_rounding_mode = user_rnd_mode;
 942            status->floatx80_rounding_precision = user_rnd_prec;
 943
 944            if (aSign) {
 945                return roundAndPackFloatx80(status->floatx80_rounding_precision,
 946                                            0, -0x1000, aSig, 0, status);
 947            } else {
 948                return roundAndPackFloatx80(status->floatx80_rounding_precision,
 949                                            0, 0x8000, aSig, 0, status);
 950            }
 951        } else { /* |X| < 2^(-70) */
 952            status->float_rounding_mode = user_rnd_mode;
 953            status->floatx80_rounding_precision = user_rnd_prec;
 954
 955            a = floatx80_add(fp0, float32_to_floatx80(
 956                             make_float32(0x3F800000), status),
 957                             status); /* 1 + X */
 958
 959            float_raise(float_flag_inexact, status);
 960
 961            return a;
 962        }
 963    } else { /* 2^(-70) <= |X| <= 16480 */
 964        fp1 = fp0; /* X */
 965        fp1 = floatx80_mul(fp1, float32_to_floatx80(
 966                           make_float32(0x42800000), status),
 967                           status); /* X * 64 */
 968        n = floatx80_to_int32(fp1, status);
 969        fp1 = int32_to_floatx80(n, status);
 970        j = n & 0x3F;
 971        l = n / 64; /* NOTE: this is really arithmetic right shift by 6 */
 972        if (n < 0 && j) {
 973            /*
 974             * arithmetic right shift is division and
 975             * round towards minus infinity
 976             */
 977            l--;
 978        }
 979        m = l / 2; /* NOTE: this is really arithmetic right shift by 1 */
 980        if (l < 0 && (l & 1)) {
 981            /*
 982             * arithmetic right shift is division and
 983             * round towards minus infinity
 984             */
 985            m--;
 986        }
 987        m1 = l - m;
 988        m1 += 0x3FFF; /* ADJFACT IS 2^(M') */
 989
 990        adjfact = packFloatx80(0, m1, one_sig);
 991        fact1 = exp2_tbl[j];
 992        fact1.high += m;
 993        fact2.high = exp2_tbl2[j] >> 16;
 994        fact2.high += m;
 995        fact2.low = (uint64_t)(exp2_tbl2[j] & 0xFFFF);
 996        fact2.low <<= 48;
 997
 998        fp1 = floatx80_mul(fp1, float32_to_floatx80(
 999                           make_float32(0x3C800000), status),
1000                           status); /* (1/64)*N */

1001        fp0 = floatx80_sub(fp0, fp1, status); /* X - (1/64)*INT(64 X) */
1002        fp2 = packFloatx80(0, 0x3FFE, UINT64_C(0xB17217F7D1CF79AC)); /* LOG2 */
1003        fp0 = floatx80_mul(fp0, fp2, status); /* R */
1004
1005        /* EXPR */
1006        fp1 = floatx80_mul(fp0, fp0, status); /* S = R*R */
1007        fp2 = float64_to_floatx80(make_float64(0x3F56C16D6F7BD0B2),
1008                                  status); /* A5 */
1009        fp3 = float64_to_floatx80(make_float64(0x3F811112302C712C),
1010                                  status); /* A4 */
1011        fp2 = floatx80_mul(fp2, fp1, status); /* S*A5 */
1012        fp3 = floatx80_mul(fp3, fp1, status); /* S*A4 */
1013        fp2 = floatx80_add(fp2, float64_to_floatx80(
1014                           make_float64(0x3FA5555555554CC1), status),
1015                           status); /* A3+S*A5 */
1016        fp3 = floatx80_add(fp3, float64_to_floatx80(
1017                           make_float64(0x3FC5555555554A54), status),
1018                           status); /* A2+S*A4 */
1019        fp2 = floatx80_mul(fp2, fp1, status); /* S*(A3+S*A5) */
1020        fp3 = floatx80_mul(fp3, fp1, status); /* S*(A2+S*A4) */
1021        fp2 = floatx80_add(fp2, float64_to_floatx80(
1022                           make_float64(0x3FE0000000000000), status),
1023                           status); /* A1+S*(A3+S*A5) */
1024        fp3 = floatx80_mul(fp3, fp0, status); /* R*S*(A2+S*A4) */
1025
1026        fp2 = floatx80_mul(fp2, fp1, status); /* S*(A1+S*(A3+S*A5)) */
1027        fp0 = floatx80_add(fp0, fp3, status); /* R+R*S*(A2+S*A4) */
1028        fp0 = floatx80_add(fp0, fp2, status); /* EXP(R) - 1 */
1029
1030        fp0 = floatx80_mul(fp0, fact1, status);
1031        fp0 = floatx80_add(fp0, fact2, status);
1032        fp0 = floatx80_add(fp0, fact1, status);
1033
1034        status->float_rounding_mode = user_rnd_mode;
1035        status->floatx80_rounding_precision = user_rnd_prec;
1036
1037        a = floatx80_mul(fp0, adjfact, status);
1038
1039        float_raise(float_flag_inexact, status);
1040
1041        return a;
1042    }
1043}
1044
1045/*
1046 * 10 to x
1047 */
1048
1049floatx80 floatx80_tentox(floatx80 a, float_status *status)
1050{
1051    bool aSign;
1052    int32_t aExp;
1053    uint64_t aSig;
1054
1055    int8_t user_rnd_mode, user_rnd_prec;
1056
1057    int32_t compact, n, j, l, m, m1;
1058    floatx80 fp0, fp1, fp2, fp3, adjfact, fact1, fact2;
1059
1060    aSig = extractFloatx80Frac(a);
1061    aExp = extractFloatx80Exp(a);
1062    aSign = extractFloatx80Sign(a);
1063
1064    if (aExp == 0x7FFF) {
1065        if ((uint64_t) (aSig << 1)) {
1066            return propagateFloatx80NaNOneArg(a, status);
1067        }
1068        if (aSign) {
1069            return packFloatx80(0, 0, 0);
1070        }
1071        return packFloatx80(0, floatx80_infinity.high,
1072                            floatx80_infinity.low);
1073    }
1074
1075    if (aExp == 0 && aSig == 0) {
1076        return packFloatx80(0, one_exp, one_sig);
1077    }
1078
1079    user_rnd_mode = status->float_rounding_mode;
1080    user_rnd_prec = status->floatx80_rounding_precision;
1081    status->float_rounding_mode = float_round_nearest_even;
1082    status->floatx80_rounding_precision = 80;
1083
1084    fp0 = a;
1085
1086    compact = floatx80_make_compact(aExp, aSig);
1087
1088    if (compact < 0x3FB98000 || compact > 0x400B9B07) {
1089        /* |X| > 16480 LOG2/LOG10 or |X| < 2^(-70) */
1090        if (compact > 0x3FFF8000) { /* |X| > 16480 */
1091            status->float_rounding_mode = user_rnd_mode;
1092            status->floatx80_rounding_precision = user_rnd_prec;
1093
1094            if (aSign) {
1095                return roundAndPackFloatx80(status->floatx80_rounding_precision,
1096                                            0, -0x1000, aSig, 0, status);
1097            } else {
1098                return roundAndPackFloatx80(status->floatx80_rounding_precision,
1099                                            0, 0x8000, aSig, 0, status);
1100            }
1101        } else { /* |X| < 2^(-70) */
1102            status->float_rounding_mode = user_rnd_mode;
1103            status->floatx80_rounding_precision = user_rnd_prec;
1104
1105            a = floatx80_add(fp0, float32_to_floatx80(
1106                             make_float32(0x3F800000), status),
1107                             status); /* 1 + X */
1108
1109            float_raise(float_flag_inexact, status);
1110
1111            return a;
1112        }
1113    } else { /* 2^(-70) <= |X| <= 16480 LOG 2 / LOG 10 */
1114        fp1 = fp0; /* X */
1115        fp1 = floatx80_mul(fp1, float64_to_floatx80(
1116                           make_float64(0x406A934F0979A371),
1117                           status), status); /* X*64*LOG10/LOG2 */
1118        n = floatx80_to_int32(fp1, status); /* N=INT(X*64*LOG10/LOG2) */
1119        fp1 = int32_to_floatx80(n, status);
1120
1121        j = n & 0x3F;
1122        l = n / 64; /* NOTE: this is really arithmetic right shift by 6 */
1123        if (n < 0 && j) {
1124            /*
1125             * arithmetic right shift is division and
1126             * round towards minus infinity
1127             */
1128            l--;
1129        }
1130        m = l / 2; /* NOTE: this is really arithmetic right shift by 1 */
1131        if (l < 0 && (l & 1)) {
1132            /*
1133             * arithmetic right shift is division and
1134             * round towards minus infinity
1135             */
1136            m--;
1137        }
1138        m1 = l - m;
1139        m1 += 0x3FFF; /* ADJFACT IS 2^(M') */
1140
1141        adjfact = packFloatx80(0, m1, one_sig);
1142        fact1 = exp2_tbl[j];
1143        fact1.high += m;
1144        fact2.high = exp2_tbl2[j] >> 16;
1145        fact2.high += m;
1146        fact2.low = (uint64_t)(exp2_tbl2[j] & 0xFFFF);
1147        fact2.low <<= 48;
1148
1149        fp2 = fp1; /* N */
1150        fp1 = floatx80_mul(fp1, float64_to_floatx80(
1151                           make_float64(0x3F734413509F8000), status),
1152                           status); /* N*(LOG2/64LOG10)_LEAD */
1153        fp3 = packFloatx80(1, 0x3FCD, UINT64_C(0xC0219DC1DA994FD2));
1154        fp2 = floatx80_mul(fp2, fp3, status); /* N*(LOG2/64LOG10)_TRAIL */
1155        fp0 = floatx80_sub(fp0, fp1, status); /* X - N L_LEAD */
1156        fp0 = floatx80_sub(fp0, fp2, status); /* X - N L_TRAIL */
1157        fp2 = packFloatx80(0, 0x4000, UINT64_C(0x935D8DDDAAA8AC17)); /* LOG10 */
1158        fp0 = floatx80_mul(fp0, fp2, status); /* R */
1159
1160        /* EXPR */
1161        fp1 = floatx80_mul(fp0, fp0, status); /* S = R*R */
1162        fp2 = float64_to_floatx80(make_float64(0x3F56C16D6F7BD0B2),
1163                                  status); /* A5 */
1164        fp3 = float64_to_floatx80(make_float64(0x3F811112302C712C),
1165                                  status); /* A4 */
1166        fp2 = floatx80_mul(fp2, fp1, status); /* S*A5 */
1167        fp3 = floatx80_mul(fp3, fp1, status); /* S*A4 */
1168        fp2 = floatx80_add(fp2, float64_to_floatx80(
1169                           make_float64(0x3FA5555555554CC1), status),
1170                           status); /* A3+S*A5 */
1171        fp3 = floatx80_add(fp3, float64_to_floatx80(
1172                           make_float64(0x3FC5555555554A54), status),
1173                           status); /* A2+S*A4 */
1174        fp2 = floatx80_mul(fp2, fp1, status); /* S*(A3+S*A5) */
1175        fp3 = floatx80_mul(fp3, fp1, status); /* S*(A2+S*A4) */
1176        fp2 = floatx80_add(fp2, float64_to_floatx80(
1177                           make_float64(0x3FE0000000000000), status),
1178                           status); /* A1+S*(A3+S*A5) */
1179        fp3 = floatx80_mul(fp3, fp0, status); /* R*S*(A2+S*A4) */
1180
1181        fp2 = floatx80_mul(fp2, fp1, status); /* S*(A1+S*(A3+S*A5)) */
1182        fp0 = floatx80_add(fp0, fp3, status); /* R+R*S*(A2+S*A4) */
1183        fp0 = floatx80_add(fp0, fp2, status); /* EXP(R) - 1 */
1184
1185        fp0 = floatx80_mul(fp0, fact1, status);
1186        fp0 = floatx80_add(fp0, fact2, status);
1187        fp0 = floatx80_add(fp0, fact1, status);
1188
1189        status->float_rounding_mode = user_rnd_mode;
1190        status->floatx80_rounding_precision = user_rnd_prec;
1191
1192        a = floatx80_mul(fp0, adjfact, status);
1193
1194        float_raise(float_flag_inexact, status);
1195
1196        return a;
1197    }
1198}
1199
1200/*
1201 * Tangent
1202 */
1203
1204floatx80 floatx80_tan(floatx80 a, float_status *status)
1205{
1206    bool aSign, xSign;
1207    int32_t aExp, xExp;
1208    uint64_t aSig, xSig;
1209
1210    int8_t user_rnd_mode, user_rnd_prec;
1211
1212    int32_t compact, l, n, j;
1213    floatx80 fp0, fp1, fp2, fp3, fp4, fp5, invtwopi, twopi1, twopi2;
1214    float32 twoto63;
1215    bool endflag;
1216
1217    aSig = extractFloatx80Frac(a);
1218    aExp = extractFloatx80Exp(a);
1219    aSign = extractFloatx80Sign(a);
1220
1221    if (aExp == 0x7FFF) {
1222        if ((uint64_t) (aSig << 1)) {
1223            return propagateFloatx80NaNOneArg(a, status);
1224        }
1225        float_raise(float_flag_invalid, status);
1226        return floatx80_default_nan(status);
1227    }
1228
1229    if (aExp == 0 && aSig == 0) {
1230        return packFloatx80(aSign, 0, 0);
1231    }
1232
1233    user_rnd_mode = status->float_rounding_mode;
1234    user_rnd_prec = status->floatx80_rounding_precision;
1235    status->float_rounding_mode = float_round_nearest_even;
1236    status->floatx80_rounding_precision = 80;
1237
1238    compact = floatx80_make_compact(aExp, aSig);
1239
1240    fp0 = a;
1241
1242    if (compact < 0x3FD78000 || compact > 0x4004BC7E) {
1243        /* 2^(-40) > |X| > 15 PI */
1244        if (compact > 0x3FFF8000) { /* |X| >= 15 PI */
1245            /* REDUCEX */
1246            fp1 = packFloatx80(0, 0, 0);
1247            if (compact == 0x7FFEFFFF) {
1248                twopi1 = packFloatx80(aSign ^ 1, 0x7FFE,
1249                                      UINT64_C(0xC90FDAA200000000));
1250                twopi2 = packFloatx80(aSign ^ 1, 0x7FDC,
1251                                      UINT64_C(0x85A308D300000000));
1252                fp0 = floatx80_add(fp0, twopi1, status);
1253                fp1 = fp0;
1254                fp0 = floatx80_add(fp0, twopi2, status);
1255                fp1 = floatx80_sub(fp1, fp0, status);
1256                fp1 = floatx80_add(fp1, twopi2, status);
1257            }
1258        loop:
1259            xSign = extractFloatx80Sign(fp0);
1260            xExp = extractFloatx80Exp(fp0);
1261            xExp -= 0x3FFF;
1262            if (xExp <= 28) {
1263                l = 0;
1264                endflag = true;
1265            } else {
1266                l = xExp - 27;
1267                endflag = false;
1268            }
1269            invtwopi = packFloatx80(0, 0x3FFE - l,
1270                                    UINT64_C(0xA2F9836E4E44152A)); /* INVTWOPI */
1271            twopi1 = packFloatx80(0, 0x3FFF + l, UINT64_C(0xC90FDAA200000000));
1272            twopi2 = packFloatx80(0, 0x3FDD + l, UINT64_C(0x85A308D300000000));
1273
1274            /* SIGN(INARG)*2^63 IN SGL */
1275            twoto63 = packFloat32(xSign, 0xBE, 0);
1276
1277            fp2 = floatx80_mul(fp0, invtwopi, status);
1278            fp2 = floatx80_add(fp2, float32_to_floatx80(twoto63, status),
1279                               status); /* THE FRACT PART OF FP2 IS ROUNDED */
1280            fp2 = floatx80_sub(fp2, float32_to_floatx80(twoto63, status),
1281                               status); /* FP2 is N */
1282            fp4 = floatx80_mul(twopi1, fp2, status); /* W = N*P1 */
1283            fp5 = floatx80_mul(twopi2, fp2, status); /* w = N*P2 */
1284            fp3 = floatx80_add(fp4, fp5, status); /* FP3 is P */
1285            fp4 = floatx80_sub(fp4, fp3, status); /* W-P */
1286            fp0 = floatx80_sub(fp0, fp3, status); /* FP0 is A := R - P */
1287            fp4 = floatx80_add(fp4, fp5, status); /* FP4 is p = (W-P)+w */
1288            fp3 = fp0; /* FP3 is A */
1289            fp1 = floatx80_sub(fp1, fp4, status); /* FP1 is a := r - p */
1290            fp0 = floatx80_add(fp0, fp1, status); /* FP0 is R := A+a */
1291
1292            if (endflag) {
1293                n = floatx80_to_int32(fp2, status);
1294                goto tancont;
1295            }
1296            fp3 = floatx80_sub(fp3, fp0, status); /* A-R */
1297            fp1 = floatx80_add(fp1, fp3, status); /* FP1 is r := (A-R)+a */
1298            goto loop;
1299        } else {
1300            status->float_rounding_mode = user_rnd_mode;
1301            status->floatx80_rounding_precision = user_rnd_prec;
1302
1303            a = floatx80_move(a, status);
1304
1305            float_raise(float_flag_inexact, status);
1306
1307            return a;
1308        }
1309    } else {
1310        fp1 = floatx80_mul(fp0, float64_to_floatx80(
1311                           make_float64(0x3FE45F306DC9C883), status),
1312                           status); /* X*2/PI */
1313
1314        n = floatx80_to_int32(fp1, status);
1315        j = 32 + n;
1316
1317        fp0 = floatx80_sub(fp0, pi_tbl[j], status); /* X-Y1 */
1318        fp0 = floatx80_sub(fp0, float32_to_floatx80(pi_tbl2[j], status),
1319                           status); /* FP0 IS R = (X-Y1)-Y2 */
1320
1321    tancont:
1322        if (n & 1) {
1323            /* NODD */
1324            fp1 = fp0; /* R */
1325            fp0 = floatx80_mul(fp0, fp0, status); /* S = R*R */
1326            fp3 = float64_to_floatx80(make_float64(0x3EA0B759F50F8688),
1327                                      status); /* Q4 */
1328            fp2 = float64_to_floatx80(make_float64(0xBEF2BAA5A8924F04),
1329                                      status); /* P3 */
1330            fp3 = floatx80_mul(fp3, fp0, status); /* SQ4 */
1331            fp2 = floatx80_mul(fp2, fp0, status); /* SP3 */
1332            fp3 = floatx80_add(fp3, float64_to_floatx80(
1333                               make_float64(0xBF346F59B39BA65F), status),
1334                               status); /* Q3+SQ4 */
1335            fp4 = packFloatx80(0, 0x3FF6, UINT64_C(0xE073D3FC199C4A00));
1336            fp2 = floatx80_add(fp2, fp4, status); /* P2+SP3 */
1337            fp3 = floatx80_mul(fp3, fp0, status); /* S(Q3+SQ4) */
1338            fp2 = floatx80_mul(fp2, fp0, status); /* S(P2+SP3) */
1339            fp4 = packFloatx80(0, 0x3FF9, UINT64_C(0xD23CD68415D95FA1));
1340            fp3 = floatx80_add(fp3, fp4, status); /* Q2+S(Q3+SQ4) */
1341            fp4 = packFloatx80(1, 0x3FFC, UINT64_C(0x8895A6C5FB423BCA));
1342            fp2 = floatx80_add(fp2, fp4, status); /* P1+S(P2+SP3) */
1343            fp3 = floatx80_mul(fp3, fp0, status); /* S(Q2+S(Q3+SQ4)) */
1344            fp2 = floatx80_mul(fp2, fp0, status); /* S(P1+S(P2+SP3)) */
1345            fp4 = packFloatx80(1, 0x3FFD, UINT64_C(0xEEF57E0DA84BC8CE));
1346            fp3 = floatx80_add(fp3, fp4, status); /* Q1+S(Q2+S(Q3+SQ4)) */
1347            fp2 = floatx80_mul(fp2, fp1, status); /* RS(P1+S(P2+SP3)) */
1348            fp0 = floatx80_mul(fp0, fp3, status); /* S(Q1+S(Q2+S(Q3+SQ4))) */
1349            fp1 = floatx80_add(fp1, fp2, status); /* R+RS(P1+S(P2+SP3)) */
1350            fp0 = floatx80_add(fp0, float32_to_floatx80(
1351                               make_float32(0x3F800000), status),
1352                               status); /* 1+S(Q1+S(Q2+S(Q3+SQ4))) */
1353
1354            xSign = extractFloatx80Sign(fp1);
1355            xExp = extractFloatx80Exp(fp1);
1356            xSig = extractFloatx80Frac(fp1);
1357            xSign ^= 1;
1358            fp1 = packFloatx80(xSign, xExp, xSig);
1359
1360            status->float_rounding_mode = user_rnd_mode;
1361            status->floatx80_rounding_precision = user_rnd_prec;
1362
1363            a = floatx80_div(fp0, fp1, status);
1364
1365            float_raise(float_flag_inexact, status);
1366
1367            return a;
1368        } else {
1369            fp1 = floatx80_mul(fp0, fp0, status); /* S = R*R */
1370            fp3 = float64_to_floatx80(make_float64(0x3EA0B759F50F8688),
1371                                      status); /* Q4 */
1372            fp2 = float64_to_floatx80(make_float64(0xBEF2BAA5A8924F04),
1373                                      status); /* P3 */
1374            fp3 = floatx80_mul(fp3, fp1, status); /* SQ4 */
1375            fp2 = floatx80_mul(fp2, fp1, status); /* SP3 */
1376            fp3 = floatx80_add(fp3, float64_to_floatx80(
1377                               make_float64(0xBF346F59B39BA65F), status),
1378                               status); /* Q3+SQ4 */
1379            fp4 = packFloatx80(0, 0x3FF6, UINT64_C(0xE073D3FC199C4A00));
1380            fp2 = floatx80_add(fp2, fp4, status); /* P2+SP3 */
1381            fp3 = floatx80_mul(fp3, fp1, status); /* S(Q3+SQ4) */
1382            fp2 = floatx80_mul(fp2, fp1, status); /* S(P2+SP3) */
1383            fp4 = packFloatx80(0, 0x3FF9, UINT64_C(0xD23CD68415D95FA1));
1384            fp3 = floatx80_add(fp3, fp4, status); /* Q2+S(Q3+SQ4) */
1385            fp4 = packFloatx80(1, 0x3FFC, UINT64_C(0x8895A6C5FB423BCA));
1386            fp2 = floatx80_add(fp2, fp4, status); /* P1+S(P2+SP3) */
1387            fp3 = floatx80_mul(fp3, fp1, status); /* S(Q2+S(Q3+SQ4)) */
1388            fp2 = floatx80_mul(fp2, fp1, status); /* S(P1+S(P2+SP3)) */
1389            fp4 = packFloatx80(1, 0x3FFD, UINT64_C(0xEEF57E0DA84BC8CE));
1390            fp3 = floatx80_add(fp3, fp4, status); /* Q1+S(Q2+S(Q3+SQ4)) */
1391            fp2 = floatx80_mul(fp2, fp0, status); /* RS(P1+S(P2+SP3)) */
1392            fp1 = floatx80_mul(fp1, fp3, status); /* S(Q1+S(Q2+S(Q3+SQ4))) */
1393            fp0 = floatx80_add(fp0, fp2, status); /* R+RS(P1+S(P2+SP3)) */
1394            fp1 = floatx80_add(fp1, float32_to_floatx80(
1395                               make_float32(0x3F800000), status),
1396                               status); /* 1+S(Q1+S(Q2+S(Q3+SQ4))) */
1397
1398            status->float_rounding_mode = user_rnd_mode;
1399            status->floatx80_rounding_precision = user_rnd_prec;
1400
1401            a = floatx80_div(fp0, fp1, status);
1402
1403            float_raise(float_flag_inexact, status);
1404
1405            return a;
1406        }
1407    }
1408}
1409
1410/*
1411 * Sine
1412 */
1413
1414floatx80 floatx80_sin(floatx80 a, float_status *status)
1415{
1416    bool aSign, xSign;
1417    int32_t aExp, xExp;
1418    uint64_t aSig, xSig;
1419
1420    int8_t user_rnd_mode, user_rnd_prec;
1421
1422    int32_t compact, l, n, j;
1423    floatx80 fp0, fp1, fp2, fp3, fp4, fp5, x, invtwopi, twopi1, twopi2;
1424    float32 posneg1, twoto63;
1425    bool endflag;
1426
1427    aSig = extractFloatx80Frac(a);
1428    aExp = extractFloatx80Exp(a);
1429    aSign = extractFloatx80Sign(a);
1430
1431    if (aExp == 0x7FFF) {
1432        if ((uint64_t) (aSig << 1)) {
1433            return propagateFloatx80NaNOneArg(a, status);
1434        }
1435        float_raise(float_flag_invalid, status);
1436        return floatx80_default_nan(status);
1437    }
1438
1439    if (aExp == 0 && aSig == 0) {
1440        return packFloatx80(aSign, 0, 0);
1441    }
1442
1443    user_rnd_mode = status->float_rounding_mode;
1444    user_rnd_prec = status->floatx80_rounding_precision;
1445    status->float_rounding_mode = float_round_nearest_even;
1446    status->floatx80_rounding_precision = 80;
1447
1448    compact = floatx80_make_compact(aExp, aSig);
1449
1450    fp0 = a;
1451
1452    if (compact < 0x3FD78000 || compact > 0x4004BC7E) {
1453        /* 2^(-40) > |X| > 15 PI */
1454        if (compact > 0x3FFF8000) { /* |X| >= 15 PI */
1455            /* REDUCEX */
1456            fp1 = packFloatx80(0, 0, 0);
1457            if (compact == 0x7FFEFFFF) {
1458                twopi1 = packFloatx80(aSign ^ 1, 0x7FFE,
1459                                      UINT64_C(0xC90FDAA200000000));
1460                twopi2 = packFloatx80(aSign ^ 1, 0x7FDC,
1461                                      UINT64_C(0x85A308D300000000));
1462                fp0 = floatx80_add(fp0, twopi1, status);
1463                fp1 = fp0;
1464                fp0 = floatx80_add(fp0, twopi2, status);
1465                fp1 = floatx80_sub(fp1, fp0, status);
1466                fp1 = floatx80_add(fp1, twopi2, status);
1467            }
1468        loop:
1469            xSign = extractFloatx80Sign(fp0);
1470            xExp = extractFloatx80Exp(fp0);
1471            xExp -= 0x3FFF;
1472            if (xExp <= 28) {
1473                l = 0;
1474                endflag = true;
1475            } else {
1476                l = xExp - 27;
1477                endflag = false;
1478            }
1479            invtwopi = packFloatx80(0, 0x3FFE - l,
1480                                    UINT64_C(0xA2F9836E4E44152A)); /* INVTWOPI */
1481            twopi1 = packFloatx80(0, 0x3FFF + l, UINT64_C(0xC90FDAA200000000));
1482            twopi2 = packFloatx80(0, 0x3FDD + l, UINT64_C(0x85A308D300000000));
1483
1484            /* SIGN(INARG)*2^63 IN SGL */
1485            twoto63 = packFloat32(xSign, 0xBE, 0);
1486
1487            fp2 = floatx80_mul(fp0, invtwopi, status);
1488            fp2 = floatx80_add(fp2, float32_to_floatx80(twoto63, status),
1489                               status); /* THE FRACT PART OF FP2 IS ROUNDED */
1490            fp2 = floatx80_sub(fp2, float32_to_floatx80(twoto63, status),
1491                               status); /* FP2 is N */
1492            fp4 = floatx80_mul(twopi1, fp2, status); /* W = N*P1 */
1493            fp5 = floatx80_mul(twopi2, fp2, status); /* w = N*P2 */
1494            fp3 = floatx80_add(fp4, fp5, status); /* FP3 is P */
1495            fp4 = floatx80_sub(fp4, fp3, status); /* W-P */
1496            fp0 = floatx80_sub(fp0, fp3, status); /* FP0 is A := R - P */
1497            fp4 = floatx80_add(fp4, fp5, status); /* FP4 is p = (W-P)+w */
1498            fp3 = fp0; /* FP3 is A */
1499            fp1 = floatx80_sub(fp1, fp4, status); /* FP1 is a := r - p */
1500            fp0 = floatx80_add(fp0, fp1, status); /* FP0 is R := A+a */
1501
1502            if (endflag) {
1503                n = floatx80_to_int32(fp2, status);
1504                goto sincont;
1505            }
1506            fp3 = floatx80_sub(fp3, fp0, status); /* A-R */
1507            fp1 = floatx80_add(fp1, fp3, status); /* FP1 is r := (A-R)+a */
1508            goto loop;
1509        } else {
1510            /* SINSM */
1511            fp0 = float32_to_floatx80(make_float32(0x3F800000),
1512                                      status); /* 1 */
1513
1514            status->float_rounding_mode = user_rnd_mode;
1515            status->floatx80_rounding_precision = user_rnd_prec;
1516
1517            /* SINTINY */
1518            a = floatx80_move(a, status);
1519            float_raise(float_flag_inexact, status);
1520
1521            return a;
1522        }
1523    } else {
1524        fp1 = floatx80_mul(fp0, float64_to_floatx80(
1525                           make_float64(0x3FE45F306DC9C883), status),
1526                           status); /* X*2/PI */
1527
1528        n = floatx80_to_int32(fp1, status);
1529        j = 32 + n;
1530
1531        fp0 = floatx80_sub(fp0, pi_tbl[j], status); /* X-Y1 */
1532        fp0 = floatx80_sub(fp0, float32_to_floatx80(pi_tbl2[j], status),
1533                           status); /* FP0 IS R = (X-Y1)-Y2 */
1534
1535    sincont:
1536        if (n & 1) {
1537            /* COSPOLY */
1538            fp0 = floatx80_mul(fp0, fp0, status); /* FP0 IS S */
1539            fp1 = floatx80_mul(fp0, fp0, status); /* FP1 IS T */
1540            fp2 = float64_to_floatx80(make_float64(0x3D2AC4D0D6011EE3),
1541                                      status); /* B8 */
1542            fp3 = float64_to_floatx80(make_float64(0xBDA9396F9F45AC19),
1543                                      status); /* B7 */
1544
1545            xSign = extractFloatx80Sign(fp0); /* X IS S */
1546            xExp = extractFloatx80Exp(fp0);
1547            xSig = extractFloatx80Frac(fp0);
1548
1549            if ((n >> 1) & 1) {
1550                xSign ^= 1;
1551                posneg1 = make_float32(0xBF800000); /* -1 */
1552            } else {
1553                xSign ^= 0;
1554                posneg1 = make_float32(0x3F800000); /* 1 */
1555            } /* X IS NOW R'= SGN*R */
1556
1557            fp2 = floatx80_mul(fp2, fp1, status); /* TB8 */
1558            fp3 = floatx80_mul(fp3, fp1, status); /* TB7 */
1559            fp2 = floatx80_add(fp2, float64_to_floatx80(
1560                               make_float64(0x3E21EED90612C972), status),
1561                               status); /* B6+TB8 */
1562            fp3 = floatx80_add(fp3, float64_to_floatx80(
1563                               make_float64(0xBE927E4FB79D9FCF), status),
1564                               status); /* B5+TB7 */
1565            fp2 = floatx80_mul(fp2, fp1, status); /* T(B6+TB8) */
1566            fp3 = floatx80_mul(fp3, fp1, status); /* T(B5+TB7) */
1567            fp2 = floatx80_add(fp2, float64_to_floatx80(
1568                               make_float64(0x3EFA01A01A01D423), status),
1569                               status); /* B4+T(B6+TB8) */
1570            fp4 = packFloatx80(1, 0x3FF5, UINT64_C(0xB60B60B60B61D438));
1571            fp3 = floatx80_add(fp3, fp4, status); /* B3+T(B5+TB7) */
1572            fp2 = floatx80_mul(fp2, fp1, status); /* T(B4+T(B6+TB8)) */
1573            fp1 = floatx80_mul(fp1, fp3, status); /* T(B3+T(B5+TB7)) */
1574            fp4 = packFloatx80(0, 0x3FFA, UINT64_C(0xAAAAAAAAAAAAAB5E));
1575            fp2 = floatx80_add(fp2, fp4, status); /* B2+T(B4+T(B6+TB8)) */
1576            fp1 = floatx80_add(fp1, float32_to_floatx80(
1577                               make_float32(0xBF000000), status),
1578                               status); /* B1+T(B3+T(B5+TB7)) */
1579            fp0 = floatx80_mul(fp0, fp2, status); /* S(B2+T(B4+T(B6+TB8))) */
1580            fp0 = floatx80_add(fp0, fp1, status); /* [B1+T(B3+T(B5+TB7))]+
1581                                                   * [S(B2+T(B4+T(B6+TB8)))]
1582                                                   */
1583
1584            x = packFloatx80(xSign, xExp, xSig);
1585            fp0 = floatx80_mul(fp0, x, status);
1586
1587            status->float_rounding_mode = user_rnd_mode;
1588            status->floatx80_rounding_precision = user_rnd_prec;
1589
1590            a = floatx80_add(fp0, float32_to_floatx80(posneg1, status), status);
1591
1592            float_raise(float_flag_inexact, status);
1593
1594            return a;
1595        } else {
1596            /* SINPOLY */
1597            xSign = extractFloatx80Sign(fp0); /* X IS R */
1598            xExp = extractFloatx80Exp(fp0);
1599            xSig = extractFloatx80Frac(fp0);
1600
1601            xSign ^= (n >> 1) & 1; /* X IS NOW R'= SGN*R */
1602
1603            fp0 = floatx80_mul(fp0, fp0, status); /* FP0 IS S */
1604            fp1 = floatx80_mul(fp0, fp0, status); /* FP1 IS T */
1605            fp3 = float64_to_floatx80(make_float64(0xBD6AAA77CCC994F5),
1606                                      status); /* A7 */
1607            fp2 = float64_to_floatx80(make_float64(0x3DE612097AAE8DA1),
1608                                      status); /* A6 */
1609            fp3 = floatx80_mul(fp3, fp1, status); /* T*A7 */
1610            fp2 = floatx80_mul(fp2, fp1, status); /* T*A6 */
1611            fp3 = floatx80_add(fp3, float64_to_floatx80(
1612                               make_float64(0xBE5AE6452A118AE4), status),
1613                               status); /* A5+T*A7 */
1614            fp2 = floatx80_add(fp2, float64_to_floatx80(
1615                               make_float64(0x3EC71DE3A5341531), status),
1616                               status); /* A4+T*A6 */
1617            fp3 = floatx80_mul(fp3, fp1, status); /* T(A5+TA7) */
1618            fp2 = floatx80_mul(fp2, fp1, status); /* T(A4+TA6) */
1619            fp3 = floatx80_add(fp3, float64_to_floatx80(
1620                               make_float64(0xBF2A01A01A018B59), status),
1621                               status); /* A3+T(A5+TA7) */
1622            fp4 = packFloatx80(0, 0x3FF8, UINT64_C(0x88888888888859AF));
1623            fp2 = floatx80_add(fp2, fp4, status); /* A2+T(A4+TA6) */
1624            fp1 = floatx80_mul(fp1, fp3, status); /* T(A3+T(A5+TA7)) */
1625            fp2 = floatx80_mul(fp2, fp0, status); /* S(A2+T(A4+TA6)) */
1626            fp4 = packFloatx80(1, 0x3FFC, UINT64_C(0xAAAAAAAAAAAAAA99));
1627            fp1 = floatx80_add(fp1, fp4, status); /* A1+T(A3+T(A5+TA7)) */
1628            fp1 = floatx80_add(fp1, fp2,
1629                               status); /* [A1+T(A3+T(A5+TA7))]+
1630                                         * [S(A2+T(A4+TA6))]
1631                                         */
1632
1633            x = packFloatx80(xSign, xExp, xSig);
1634            fp0 = floatx80_mul(fp0, x, status); /* R'*S */
1635            fp0 = floatx80_mul(fp0, fp1, status); /* SIN(R')-R' */
1636
1637            status->float_rounding_mode = user_rnd_mode;
1638            status->floatx80_rounding_precision = user_rnd_prec;
1639
1640            a = floatx80_add(fp0, x, status);
1641
1642            float_raise(float_flag_inexact, status);
1643
1644            return a;
1645        }
1646    }
1647}
1648
1649/*
1650 * Cosine
1651 */
1652
1653floatx80 floatx80_cos(floatx80 a, float_status *status)
1654{
1655    bool aSign, xSign;
1656    int32_t aExp, xExp;
1657    uint64_t aSig, xSig;
1658
1659    int8_t user_rnd_mode, user_rnd_prec;
1660
1661    int32_t compact, l, n, j;
1662    floatx80 fp0, fp1, fp2, fp3, fp4, fp5, x, invtwopi, twopi1, twopi2;
1663    float32 posneg1, twoto63;
1664    bool endflag;
1665
1666    aSig = extractFloatx80Frac(a);
1667    aExp = extractFloatx80Exp(a);
1668    aSign = extractFloatx80Sign(a);
1669
1670    if (aExp == 0x7FFF) {
1671        if ((uint64_t) (aSig << 1)) {
1672            return propagateFloatx80NaNOneArg(a, status);
1673        }
1674        float_raise(float_flag_invalid, status);
1675        return floatx80_default_nan(status);
1676    }
1677
1678    if (aExp == 0 && aSig == 0) {
1679        return packFloatx80(0, one_exp, one_sig);
1680    }
1681
1682    user_rnd_mode = status->float_rounding_mode;
1683    user_rnd_prec = status->floatx80_rounding_precision;
1684    status->float_rounding_mode = float_round_nearest_even;
1685    status->floatx80_rounding_precision = 80;
1686
1687    compact = floatx80_make_compact(aExp, aSig);
1688
1689    fp0 = a;
1690
1691    if (compact < 0x3FD78000 || compact > 0x4004BC7E) {
1692        /* 2^(-40) > |X| > 15 PI */
1693        if (compact > 0x3FFF8000) { /* |X| >= 15 PI */
1694            /* REDUCEX */
1695            fp1 = packFloatx80(0, 0, 0);
1696            if (compact == 0x7FFEFFFF) {
1697                twopi1 = packFloatx80(aSign ^ 1, 0x7FFE,
1698                                      UINT64_C(0xC90FDAA200000000));
1699                twopi2 = packFloatx80(aSign ^ 1, 0x7FDC,
1700                                      UINT64_C(0x85A308D300000000));
1701                fp0 = floatx80_add(fp0, twopi1, status);
1702                fp1 = fp0;
1703                fp0 = floatx80_add(fp0, twopi2, status);
1704                fp1 = floatx80_sub(fp1, fp0, status);
1705                fp1 = floatx80_add(fp1, twopi2, status);
1706            }
1707        loop:
1708            xSign = extractFloatx80Sign(fp0);
1709            xExp = extractFloatx80Exp(fp0);
1710            xExp -= 0x3FFF;
1711            if (xExp <= 28) {
1712                l = 0;
1713                endflag = true;
1714            } else {
1715                l = xExp - 27;
1716                endflag = false;
1717            }
1718            invtwopi = packFloatx80(0, 0x3FFE - l,
1719                                    UINT64_C(0xA2F9836E4E44152A)); /* INVTWOPI */
1720            twopi1 = packFloatx80(0, 0x3FFF + l, UINT64_C(0xC90FDAA200000000));
1721            twopi2 = packFloatx80(0, 0x3FDD + l, UINT64_C(0x85A308D300000000));
1722
1723            /* SIGN(INARG)*2^63 IN SGL */
1724            twoto63 = packFloat32(xSign, 0xBE, 0);
1725
1726            fp2 = floatx80_mul(fp0, invtwopi, status);
1727            fp2 = floatx80_add(fp2, float32_to_floatx80(twoto63, status),
1728                               status); /* THE FRACT PART OF FP2 IS ROUNDED */
1729            fp2 = floatx80_sub(fp2, float32_to_floatx80(twoto63, status),
1730                               status); /* FP2 is N */
1731            fp4 = floatx80_mul(twopi1, fp2, status); /* W = N*P1 */
1732            fp5 = floatx80_mul(twopi2, fp2, status); /* w = N*P2 */
1733            fp3 = floatx80_add(fp4, fp5, status); /* FP3 is P */
1734            fp4 = floatx80_sub(fp4, fp3, status); /* W-P */
1735            fp0 = floatx80_sub(fp0, fp3, status); /* FP0 is A := R - P */
1736            fp4 = floatx80_add(fp4, fp5, status); /* FP4 is p = (W-P)+w */
1737            fp3 = fp0; /* FP3 is A */
1738            fp1 = floatx80_sub(fp1, fp4, status); /* FP1 is a := r - p */
1739            fp0 = floatx80_add(fp0, fp1, status); /* FP0 is R := A+a */
1740
1741            if (endflag) {
1742                n = floatx80_to_int32(fp2, status);
1743                goto sincont;
1744            }
1745            fp3 = floatx80_sub(fp3, fp0, status); /* A-R */
1746            fp1 = floatx80_add(fp1, fp3, status); /* FP1 is r := (A-R)+a */
1747            goto loop;
1748        } else {
1749            /* SINSM */
1750            fp0 = float32_to_floatx80(make_float32(0x3F800000), status); /* 1 */
1751
1752            status->float_rounding_mode = user_rnd_mode;
1753            status->floatx80_rounding_precision = user_rnd_prec;
1754
1755            /* COSTINY */
1756            a = floatx80_sub(fp0, float32_to_floatx80(
1757                             make_float32(0x00800000), status),
1758                             status);
1759            float_raise(float_flag_inexact, status);
1760
1761            return a;
1762        }
1763    } else {
1764        fp1 = floatx80_mul(fp0, float64_to_floatx80(
1765                           make_float64(0x3FE45F306DC9C883), status),
1766                           status); /* X*2/PI */
1767
1768        n = floatx80_to_int32(fp1, status);
1769        j = 32 + n;
1770
1771        fp0 = floatx80_sub(fp0, pi_tbl[j], status); /* X-Y1 */
1772        fp0 = floatx80_sub(fp0, float32_to_floatx80(pi_tbl2[j], status),
1773                           status); /* FP0 IS R = (X-Y1)-Y2 */
1774
1775    sincont:
1776        if ((n + 1) & 1) {
1777            /* COSPOLY */
1778            fp0 = floatx80_mul(fp0, fp0, status); /* FP0 IS S */
1779            fp1 = floatx80_mul(fp0, fp0, status); /* FP1 IS T */
1780            fp2 = float64_to_floatx80(make_float64(0x3D2AC4D0D6011EE3),
1781                                      status); /* B8 */
1782            fp3 = float64_to_floatx80(make_float64(0xBDA9396F9F45AC19),
1783                                      status); /* B7 */
1784
1785            xSign = extractFloatx80Sign(fp0); /* X IS S */
1786            xExp = extractFloatx80Exp(fp0);
1787            xSig = extractFloatx80Frac(fp0);
1788
1789            if (((n + 1) >> 1) & 1) {
1790                xSign ^= 1;
1791                posneg1 = make_float32(0xBF800000); /* -1 */
1792            } else {
1793                xSign ^= 0;
1794                posneg1 = make_float32(0x3F800000); /* 1 */
1795            } /* X IS NOW R'= SGN*R */
1796
1797            fp2 = floatx80_mul(fp2, fp1, status); /* TB8 */
1798            fp3 = floatx80_mul(fp3, fp1, status); /* TB7 */
1799            fp2 = floatx80_add(fp2, float64_to_floatx80(
1800                               make_float64(0x3E21EED90612C972), status),
1801                               status); /* B6+TB8 */
1802            fp3 = floatx80_add(fp3, float64_to_floatx80(
1803                               make_float64(0xBE927E4FB79D9FCF), status),
1804                               status); /* B5+TB7 */
1805            fp2 = floatx80_mul(fp2, fp1, status); /* T(B6+TB8) */
1806            fp3 = floatx80_mul(fp3, fp1, status); /* T(B5+TB7) */
1807            fp2 = floatx80_add(fp2, float64_to_floatx80(
1808                               make_float64(0x3EFA01A01A01D423), status),
1809                               status); /* B4+T(B6+TB8) */
1810            fp4 = packFloatx80(1, 0x3FF5, UINT64_C(0xB60B60B60B61D438));
1811            fp3 = floatx80_add(fp3, fp4, status); /* B3+T(B5+TB7) */
1812            fp2 = floatx80_mul(fp2, fp1, status); /* T(B4+T(B6+TB8)) */
1813            fp1 = floatx80_mul(fp1, fp3, status); /* T(B3+T(B5+TB7)) */
1814            fp4 = packFloatx80(0, 0x3FFA, UINT64_C(0xAAAAAAAAAAAAAB5E));
1815            fp2 = floatx80_add(fp2, fp4, status); /* B2+T(B4+T(B6+TB8)) */
1816            fp1 = floatx80_add(fp1, float32_to_floatx80(
1817                               make_float32(0xBF000000), status),
1818                               status); /* B1+T(B3+T(B5+TB7)) */
1819            fp0 = floatx80_mul(fp0, fp2, status); /* S(B2+T(B4+T(B6+TB8))) */
1820            fp0 = floatx80_add(fp0, fp1, status);
1821                              /* [B1+T(B3+T(B5+TB7))]+[S(B2+T(B4+T(B6+TB8)))] */
1822
1823            x = packFloatx80(xSign, xExp, xSig);
1824            fp0 = floatx80_mul(fp0, x, status);
1825
1826            status->float_rounding_mode = user_rnd_mode;
1827            status->floatx80_rounding_precision = user_rnd_prec;
1828
1829            a = floatx80_add(fp0, float32_to_floatx80(posneg1, status), status);
1830
1831            float_raise(float_flag_inexact, status);
1832
1833            return a;
1834        } else {
1835            /* SINPOLY */
1836            xSign = extractFloatx80Sign(fp0); /* X IS R */
1837            xExp = extractFloatx80Exp(fp0);
1838            xSig = extractFloatx80Frac(fp0);
1839
1840            xSign ^= ((n + 1) >> 1) & 1; /* X IS NOW R'= SGN*R */
1841
1842            fp0 = floatx80_mul(fp0, fp0, status); /* FP0 IS S */
1843            fp1 = floatx80_mul(fp0, fp0, status); /* FP1 IS T */
1844            fp3 = float64_to_floatx80(make_float64(0xBD6AAA77CCC994F5),
1845                                      status); /* A7 */
1846            fp2 = float64_to_floatx80(make_float64(0x3DE612097AAE8DA1),
1847                                      status); /* A6 */
1848            fp3 = floatx80_mul(fp3, fp1, status); /* T*A7 */
1849            fp2 = floatx80_mul(fp2, fp1, status); /* T*A6 */
1850            fp3 = floatx80_add(fp3, float64_to_floatx80(
1851                               make_float64(0xBE5AE6452A118AE4), status),
1852                               status); /* A5+T*A7 */
1853            fp2 = floatx80_add(fp2, float64_to_floatx80(
1854                               make_float64(0x3EC71DE3A5341531), status),
1855                               status); /* A4+T*A6 */
1856            fp3 = floatx80_mul(fp3, fp1, status); /* T(A5+TA7) */
1857            fp2 = floatx80_mul(fp2, fp1, status); /* T(A4+TA6) */
1858            fp3 = floatx80_add(fp3, float64_to_floatx80(
1859                               make_float64(0xBF2A01A01A018B59), status),
1860                               status); /* A3+T(A5+TA7) */
1861            fp4 = packFloatx80(0, 0x3FF8, UINT64_C(0x88888888888859AF));
1862            fp2 = floatx80_add(fp2, fp4, status); /* A2+T(A4+TA6) */
1863            fp1 = floatx80_mul(fp1, fp3, status); /* T(A3+T(A5+TA7)) */
1864            fp2 = floatx80_mul(fp2, fp0, status); /* S(A2+T(A4+TA6)) */
1865            fp4 = packFloatx80(1, 0x3FFC, UINT64_C(0xAAAAAAAAAAAAAA99));
1866            fp1 = floatx80_add(fp1, fp4, status); /* A1+T(A3+T(A5+TA7)) */
1867            fp1 = floatx80_add(fp1, fp2, status);
1868                                    /* [A1+T(A3+T(A5+TA7))]+[S(A2+T(A4+TA6))] */
1869
1870            x = packFloatx80(xSign, xExp, xSig);
1871            fp0 = floatx80_mul(fp0, x, status); /* R'*S */
1872            fp0 = floatx80_mul(fp0, fp1, status); /* SIN(R')-R' */
1873
1874            status->float_rounding_mode = user_rnd_mode;
1875            status->floatx80_rounding_precision = user_rnd_prec;
1876
1877            a = floatx80_add(fp0, x, status);
1878
1879            float_raise(float_flag_inexact, status);
1880
1881            return a;
1882        }
1883    }
1884}
1885
1886/*
1887 * Arc tangent
1888 */
1889
1890floatx80 floatx80_atan(floatx80 a, float_status *status)
1891{
1892    bool aSign;
1893    int32_t aExp;
1894    uint64_t aSig;
1895
1896    int8_t user_rnd_mode, user_rnd_prec;
1897
1898    int32_t compact, tbl_index;
1899    floatx80 fp0, fp1, fp2, fp3, xsave;
1900
1901    aSig = extractFloatx80Frac(a);
1902    aExp = extractFloatx80Exp(a);
1903    aSign = extractFloatx80Sign(a);
1904
1905    if (aExp == 0x7FFF) {
1906        if ((uint64_t) (aSig << 1)) {
1907            return propagateFloatx80NaNOneArg(a, status);
1908        }
1909        a = packFloatx80(aSign, piby2_exp, pi_sig);
1910        float_raise(float_flag_inexact, status);
1911        return floatx80_move(a, status);
1912    }
1913
1914    if (aExp == 0 && aSig == 0) {
1915        return packFloatx80(aSign, 0, 0);
1916    }
1917
1918    compact = floatx80_make_compact(aExp, aSig);
1919
1920    user_rnd_mode = status->float_rounding_mode;
1921    user_rnd_prec = status->floatx80_rounding_precision;
1922    status->float_rounding_mode = float_round_nearest_even;
1923    status->floatx80_rounding_precision = 80;
1924
1925    if (compact < 0x3FFB8000 || compact > 0x4002FFFF) {
1926        /* |X| >= 16 or |X| < 1/16 */
1927        if (compact > 0x3FFF8000) { /* |X| >= 16 */
1928            if (compact > 0x40638000) { /* |X| > 2^(100) */
1929                fp0 = packFloatx80(aSign, piby2_exp, pi_sig);
1930                fp1 = packFloatx80(aSign, 0x0001, one_sig);
1931
1932                status->float_rounding_mode = user_rnd_mode;
1933                status->floatx80_rounding_precision = user_rnd_prec;
1934
1935                a = floatx80_sub(fp0, fp1, status);
1936
1937                float_raise(float_flag_inexact, status);
1938
1939                return a;
1940            } else {
1941                fp0 = a;
1942                fp1 = packFloatx80(1, one_exp, one_sig); /* -1 */
1943                fp1 = floatx80_div(fp1, fp0, status); /* X' = -1/X */
1944                xsave = fp1;
1945                fp0 = floatx80_mul(fp1, fp1, status); /* Y = X'*X' */
1946                fp1 = floatx80_mul(fp0, fp0, status); /* Z = Y*Y */
1947                fp3 = float64_to_floatx80(make_float64(0xBFB70BF398539E6A),
1948                                          status); /* C5 */
1949                fp2 = float64_to_floatx80(make_float64(0x3FBC7187962D1D7D),
1950                                          status); /* C4 */
1951                fp3 = floatx80_mul(fp3, fp1, status); /* Z*C5 */
1952                fp2 = floatx80_mul(fp2, fp1, status); /* Z*C4 */
1953                fp3 = floatx80_add(fp3, float64_to_floatx80(
1954                                   make_float64(0xBFC24924827107B8), status),
1955                                   status); /* C3+Z*C5 */
1956                fp2 = floatx80_add(fp2, float64_to_floatx80(
1957                                   make_float64(0x3FC999999996263E), status),
1958                                   status); /* C2+Z*C4 */
1959                fp1 = floatx80_mul(fp1, fp3, status); /* Z*(C3+Z*C5) */
1960                fp2 = floatx80_mul(fp2, fp0, status); /* Y*(C2+Z*C4) */
1961                fp1 = floatx80_add(fp1, float64_to_floatx80(
1962                                   make_float64(0xBFD5555555555536), status),
1963                                   status); /* C1+Z*(C3+Z*C5) */
1964                fp0 = floatx80_mul(fp0, xsave, status); /* X'*Y */
1965                /* [Y*(C2+Z*C4)]+[C1+Z*(C3+Z*C5)] */
1966                fp1 = floatx80_add(fp1, fp2, status);
1967                /* X'*Y*([B1+Z*(B3+Z*B5)]+[Y*(B2+Z*(B4+Z*B6))]) ?? */
1968                fp0 = floatx80_mul(fp0, fp1, status);
1969                fp0 = floatx80_add(fp0, xsave, status);
1970                fp1 = packFloatx80(aSign, piby2_exp, pi_sig);
1971
1972                status->float_rounding_mode = user_rnd_mode;
1973                status->floatx80_rounding_precision = user_rnd_prec;
1974
1975                a = floatx80_add(fp0, fp1, status);
1976
1977                float_raise(float_flag_inexact, status);
1978
1979                return a;
1980            }
1981        } else { /* |X| < 1/16 */
1982            if (compact < 0x3FD78000) { /* |X| < 2^(-40) */
1983                status->float_rounding_mode = user_rnd_mode;
1984                status->floatx80_rounding_precision = user_rnd_prec;
1985
1986                a = floatx80_move(a, status);
1987
1988                float_raise(float_flag_inexact, status);
1989
1990                return a;
1991            } else {
1992                fp0 = a;
1993                xsave = a;
1994                fp0 = floatx80_mul(fp0, fp0, status); /* Y = X*X */
1995                fp1 = floatx80_mul(fp0, fp0, status); /* Z = Y*Y */
1996                fp2 = float64_to_floatx80(make_float64(0x3FB344447F876989),
1997                                          status); /* B6 */
1998                fp3 = float64_to_floatx80(make_float64(0xBFB744EE7FAF45DB),
1999                                          status); /* B5 */
2000                fp2 = floatx80_mul(fp2, fp1, status); /* Z*B6 */

2001                fp3 = floatx80_mul(fp3, fp1, status); /* Z*B5 */
2002                fp2 = floatx80_add(fp2, float64_to_floatx80(
2003                                   make_float64(0x3FBC71C646940220), status),
2004                                   status); /* B4+Z*B6 */
2005                fp3 = floatx80_add(fp3, float64_to_floatx80(
2006                                   make_float64(0xBFC24924921872F9),
2007                                   status), status); /* B3+Z*B5 */
2008                fp2 = floatx80_mul(fp2, fp1, status); /* Z*(B4+Z*B6) */
2009                fp1 = floatx80_mul(fp1, fp3, status); /* Z*(B3+Z*B5) */
2010                fp2 = floatx80_add(fp2, float64_to_floatx80(
2011                                   make_float64(0x3FC9999999998FA9), status),
2012                                   status); /* B2+Z*(B4+Z*B6) */
2013                fp1 = floatx80_add(fp1, float64_to_floatx80(
2014                                   make_float64(0xBFD5555555555555), status),
2015                                   status); /* B1+Z*(B3+Z*B5) */
2016                fp2 = floatx80_mul(fp2, fp0, status); /* Y*(B2+Z*(B4+Z*B6)) */
2017                fp0 = floatx80_mul(fp0, xsave, status); /* X*Y */
2018                /* [B1+Z*(B3+Z*B5)]+[Y*(B2+Z*(B4+Z*B6))] */
2019                fp1 = floatx80_add(fp1, fp2, status);
2020                /* X*Y*([B1+Z*(B3+Z*B5)]+[Y*(B2+Z*(B4+Z*B6))]) */
2021                fp0 = floatx80_mul(fp0, fp1, status);
2022
2023                status->float_rounding_mode = user_rnd_mode;
2024                status->floatx80_rounding_precision = user_rnd_prec;
2025
2026                a = floatx80_add(fp0, xsave, status);
2027
2028                float_raise(float_flag_inexact, status);
2029
2030                return a;
2031            }
2032        }
2033    } else {
2034        aSig &= UINT64_C(0xF800000000000000);
2035        aSig |= UINT64_C(0x0400000000000000);
2036        xsave = packFloatx80(aSign, aExp, aSig); /* F */
2037        fp0 = a;
2038        fp1 = a; /* X */
2039        fp2 = packFloatx80(0, one_exp, one_sig); /* 1 */
2040        fp1 = floatx80_mul(fp1, xsave, status); /* X*F */
2041        fp0 = floatx80_sub(fp0, xsave, status); /* X-F */
2042        fp1 = floatx80_add(fp1, fp2, status); /* 1 + X*F */
2043        fp0 = floatx80_div(fp0, fp1, status); /* U = (X-F)/(1+X*F) */
2044
2045        tbl_index = compact;
2046
2047        tbl_index &= 0x7FFF0000;
2048        tbl_index -= 0x3FFB0000;
2049        tbl_index >>= 1;
2050        tbl_index += compact & 0x00007800;
2051        tbl_index >>= 11;
2052
2053        fp3 = atan_tbl[tbl_index];
2054
2055        fp3.high |= aSign ? 0x8000 : 0; /* ATAN(F) */
2056
2057        fp1 = floatx80_mul(fp0, fp0, status); /* V = U*U */
2058        fp2 = float64_to_floatx80(make_float64(0xBFF6687E314987D8),
2059                                  status); /* A3 */
2060        fp2 = floatx80_add(fp2, fp1, status); /* A3+V */
2061        fp2 = floatx80_mul(fp2, fp1, status); /* V*(A3+V) */
2062        fp1 = floatx80_mul(fp1, fp0, status); /* U*V */
2063        fp2 = floatx80_add(fp2, float64_to_floatx80(
2064                           make_float64(0x4002AC6934A26DB3), status),
2065                           status); /* A2+V*(A3+V) */
2066        fp1 = floatx80_mul(fp1, float64_to_floatx80(
2067                           make_float64(0xBFC2476F4E1DA28E), status),
2068                           status); /* A1+U*V */
2069        fp1 = floatx80_mul(fp1, fp2, status); /* A1*U*V*(A2+V*(A3+V)) */
2070        fp0 = floatx80_add(fp0, fp1, status); /* ATAN(U) */
2071
2072        status->float_rounding_mode = user_rnd_mode;
2073        status->floatx80_rounding_precision = user_rnd_prec;
2074
2075        a = floatx80_add(fp0, fp3, status); /* ATAN(X) */
2076
2077        float_raise(float_flag_inexact, status);
2078
2079        return a;
2080    }
2081}
2082
2083/*
2084 * Arc sine
2085 */
2086
2087floatx80 floatx80_asin(floatx80 a, float_status *status)
2088{
2089    bool aSign;
2090    int32_t aExp;
2091    uint64_t aSig;
2092
2093    int8_t user_rnd_mode, user_rnd_prec;
2094
2095    int32_t compact;
2096    floatx80 fp0, fp1, fp2, one;
2097
2098    aSig = extractFloatx80Frac(a);
2099    aExp = extractFloatx80Exp(a);
2100    aSign = extractFloatx80Sign(a);
2101
2102    if (aExp == 0x7FFF && (uint64_t) (aSig << 1)) {
2103        return propagateFloatx80NaNOneArg(a, status);
2104    }
2105
2106    if (aExp == 0 && aSig == 0) {
2107        return packFloatx80(aSign, 0, 0);
2108    }
2109
2110    compact = floatx80_make_compact(aExp, aSig);
2111
2112    if (compact >= 0x3FFF8000) { /* |X| >= 1 */
2113        if (aExp == one_exp && aSig == one_sig) { /* |X| == 1 */
2114            float_raise(float_flag_inexact, status);
2115            a = packFloatx80(aSign, piby2_exp, pi_sig);
2116            return floatx80_move(a, status);
2117        } else { /* |X| > 1 */
2118            float_raise(float_flag_invalid, status);
2119            return floatx80_default_nan(status);
2120        }
2121
2122    } /* |X| < 1 */
2123
2124    user_rnd_mode = status->float_rounding_mode;
2125    user_rnd_prec = status->floatx80_rounding_precision;
2126    status->float_rounding_mode = float_round_nearest_even;
2127    status->floatx80_rounding_precision = 80;
2128
2129    one = packFloatx80(0, one_exp, one_sig);
2130    fp0 = a;
2131
2132    fp1 = floatx80_sub(one, fp0, status);   /* 1 - X */
2133    fp2 = floatx80_add(one, fp0, status);   /* 1 + X */
2134    fp1 = floatx80_mul(fp2, fp1, status);   /* (1+X)*(1-X) */
2135    fp1 = floatx80_sqrt(fp1, status);       /* SQRT((1+X)*(1-X)) */
2136    fp0 = floatx80_div(fp0, fp1, status);   /* X/SQRT((1+X)*(1-X)) */
2137
2138    status->float_rounding_mode = user_rnd_mode;
2139    status->floatx80_rounding_precision = user_rnd_prec;
2140
2141    a = floatx80_atan(fp0, status);         /* ATAN(X/SQRT((1+X)*(1-X))) */
2142
2143    float_raise(float_flag_inexact, status);
2144
2145    return a;
2146}
2147
2148/*
2149 * Arc cosine
2150 */
2151
2152floatx80 floatx80_acos(floatx80 a, float_status *status)
2153{
2154    bool aSign;
2155    int32_t aExp;
2156    uint64_t aSig;
2157
2158    int8_t user_rnd_mode, user_rnd_prec;
2159
2160    int32_t compact;
2161    floatx80 fp0, fp1, one;
2162
2163    aSig = extractFloatx80Frac(a);
2164    aExp = extractFloatx80Exp(a);
2165    aSign = extractFloatx80Sign(a);
2166
2167    if (aExp == 0x7FFF && (uint64_t) (aSig << 1)) {
2168        return propagateFloatx80NaNOneArg(a, status);
2169    }
2170    if (aExp == 0 && aSig == 0) {
2171        float_raise(float_flag_inexact, status);
2172        return roundAndPackFloatx80(status->floatx80_rounding_precision, 0,
2173                                    piby2_exp, pi_sig, 0, status);
2174    }
2175
2176    compact = floatx80_make_compact(aExp, aSig);
2177
2178    if (compact >= 0x3FFF8000) { /* |X| >= 1 */
2179        if (aExp == one_exp && aSig == one_sig) { /* |X| == 1 */
2180            if (aSign) { /* X == -1 */
2181                a = packFloatx80(0, pi_exp, pi_sig);
2182                float_raise(float_flag_inexact, status);
2183                return floatx80_move(a, status);
2184            } else { /* X == +1 */
2185                return packFloatx80(0, 0, 0);
2186            }
2187        } else { /* |X| > 1 */
2188            float_raise(float_flag_invalid, status);
2189            return floatx80_default_nan(status);
2190        }
2191    } /* |X| < 1 */
2192
2193    user_rnd_mode = status->float_rounding_mode;
2194    user_rnd_prec = status->floatx80_rounding_precision;
2195    status->float_rounding_mode = float_round_nearest_even;
2196    status->floatx80_rounding_precision = 80;
2197
2198    one = packFloatx80(0, one_exp, one_sig);
2199    fp0 = a;
2200
2201    fp1 = floatx80_add(one, fp0, status);   /* 1 + X */
2202    fp0 = floatx80_sub(one, fp0, status);   /* 1 - X */
2203    fp0 = floatx80_div(fp0, fp1, status);   /* (1-X)/(1+X) */
2204    fp0 = floatx80_sqrt(fp0, status);       /* SQRT((1-X)/(1+X)) */
2205    fp0 = floatx80_atan(fp0, status);       /* ATAN(SQRT((1-X)/(1+X))) */
2206
2207    status->float_rounding_mode = user_rnd_mode;
2208    status->floatx80_rounding_precision = user_rnd_prec;
2209
2210    a = floatx80_add(fp0, fp0, status);     /* 2 * ATAN(SQRT((1-X)/(1+X))) */
2211
2212    float_raise(float_flag_inexact, status);
2213
2214    return a;
2215}
2216
2217/*
2218 * Hyperbolic arc tangent
2219 */
2220
2221floatx80 floatx80_atanh(floatx80 a, float_status *status)
2222{
2223    bool aSign;
2224    int32_t aExp;
2225    uint64_t aSig;
2226
2227    int8_t user_rnd_mode, user_rnd_prec;
2228
2229    int32_t compact;
2230    floatx80 fp0, fp1, fp2, one;
2231
2232    aSig = extractFloatx80Frac(a);
2233    aExp = extractFloatx80Exp(a);
2234    aSign = extractFloatx80Sign(a);
2235
2236    if (aExp == 0x7FFF && (uint64_t) (aSig << 1)) {
2237        return propagateFloatx80NaNOneArg(a, status);
2238    }
2239
2240    if (aExp == 0 && aSig == 0) {
2241        return packFloatx80(aSign, 0, 0);
2242    }
2243
2244    compact = floatx80_make_compact(aExp, aSig);
2245
2246    if (compact >= 0x3FFF8000) { /* |X| >= 1 */
2247        if (aExp == one_exp && aSig == one_sig) { /* |X| == 1 */
2248            float_raise(float_flag_divbyzero, status);
2249            return packFloatx80(aSign, floatx80_infinity.high,
2250                                floatx80_infinity.low);
2251        } else { /* |X| > 1 */
2252            float_raise(float_flag_invalid, status);
2253            return floatx80_default_nan(status);
2254        }
2255    } /* |X| < 1 */
2256
2257    user_rnd_mode = status->float_rounding_mode;
2258    user_rnd_prec = status->floatx80_rounding_precision;
2259    status->float_rounding_mode = float_round_nearest_even;
2260    status->floatx80_rounding_precision = 80;
2261
2262    one = packFloatx80(0, one_exp, one_sig);
2263    fp2 = packFloatx80(aSign, 0x3FFE, one_sig); /* SIGN(X) * (1/2) */
2264    fp0 = packFloatx80(0, aExp, aSig); /* Y = |X| */
2265    fp1 = packFloatx80(1, aExp, aSig); /* -Y */
2266    fp0 = floatx80_add(fp0, fp0, status); /* 2Y */
2267    fp1 = floatx80_add(fp1, one, status); /* 1-Y */
2268    fp0 = floatx80_div(fp0, fp1, status); /* Z = 2Y/(1-Y) */
2269    fp0 = floatx80_lognp1(fp0, status); /* LOG1P(Z) */
2270
2271    status->float_rounding_mode = user_rnd_mode;
2272    status->floatx80_rounding_precision = user_rnd_prec;
2273
2274    a = floatx80_mul(fp0, fp2,
2275                     status); /* ATANH(X) = SIGN(X) * (1/2) * LOG1P(Z) */
2276
2277    float_raise(float_flag_inexact, status);
2278
2279    return a;
2280}
2281
2282/*
2283 * e to x minus 1
2284 */
2285
2286floatx80 floatx80_etoxm1(floatx80 a, float_status *status)
2287{
2288    bool aSign;
2289    int32_t aExp;
2290    uint64_t aSig;
2291
2292    int8_t user_rnd_mode, user_rnd_prec;
2293
2294    int32_t compact, n, j, m, m1;
2295    floatx80 fp0, fp1, fp2, fp3, l2, sc, onebysc;
2296
2297    aSig = extractFloatx80Frac(a);
2298    aExp = extractFloatx80Exp(a);
2299    aSign = extractFloatx80Sign(a);
2300
2301    if (aExp == 0x7FFF) {
2302        if ((uint64_t) (aSig << 1)) {
2303            return propagateFloatx80NaNOneArg(a, status);
2304        }
2305        if (aSign) {
2306            return packFloatx80(aSign, one_exp, one_sig);
2307        }
2308        return packFloatx80(0, floatx80_infinity.high,
2309                            floatx80_infinity.low);
2310    }
2311
2312    if (aExp == 0 && aSig == 0) {
2313        return packFloatx80(aSign, 0, 0);
2314    }
2315
2316    user_rnd_mode = status->float_rounding_mode;
2317    user_rnd_prec = status->floatx80_rounding_precision;
2318    status->float_rounding_mode = float_round_nearest_even;
2319    status->floatx80_rounding_precision = 80;
2320
2321    if (aExp >= 0x3FFD) { /* |X| >= 1/4 */
2322        compact = floatx80_make_compact(aExp, aSig);
2323
2324        if (compact <= 0x4004C215) { /* |X| <= 70 log2 */
2325            fp0 = a;
2326            fp1 = a;
2327            fp0 = floatx80_mul(fp0, float32_to_floatx80(
2328                               make_float32(0x42B8AA3B), status),
2329                               status); /* 64/log2 * X */
2330            n = floatx80_to_int32(fp0, status); /* int(64/log2*X) */
2331            fp0 = int32_to_floatx80(n, status);
2332
2333            j = n & 0x3F; /* J = N mod 64 */
2334            m = n / 64; /* NOTE: this is really arithmetic right shift by 6 */
2335            if (n < 0 && j) {
2336                /*
2337                 * arithmetic right shift is division and
2338                 * round towards minus infinity
2339                 */
2340                m--;
2341            }
2342            m1 = -m;
2343            /*m += 0x3FFF; // biased exponent of 2^(M) */
2344            /*m1 += 0x3FFF; // biased exponent of -2^(-M) */
2345
2346            fp2 = fp0; /* N */
2347            fp0 = floatx80_mul(fp0, float32_to_floatx80(
2348                               make_float32(0xBC317218), status),
2349                               status); /* N * L1, L1 = lead(-log2/64) */
2350            l2 = packFloatx80(0, 0x3FDC, UINT64_C(0x82E308654361C4C6));
2351            fp2 = floatx80_mul(fp2, l2, status); /* N * L2, L1+L2 = -log2/64 */
2352            fp0 = floatx80_add(fp0, fp1, status); /* X + N*L1 */
2353            fp0 = floatx80_add(fp0, fp2, status); /* R */
2354
2355            fp1 = floatx80_mul(fp0, fp0, status); /* S = R*R */
2356            fp2 = float32_to_floatx80(make_float32(0x3950097B),
2357                                      status); /* A6 */
2358            fp2 = floatx80_mul(fp2, fp1, status); /* fp2 is S*A6 */
2359            fp3 = floatx80_mul(float32_to_floatx80(make_float32(0x3AB60B6A),
2360                               status), fp1, status); /* fp3 is S*A5 */
2361            fp2 = floatx80_add(fp2, float64_to_floatx80(
2362                               make_float64(0x3F81111111174385), status),
2363                               status); /* fp2 IS A4+S*A6 */
2364            fp3 = floatx80_add(fp3, float64_to_floatx80(
2365                               make_float64(0x3FA5555555554F5A), status),
2366                               status); /* fp3 is A3+S*A5 */
2367            fp2 = floatx80_mul(fp2, fp1, status); /* fp2 IS S*(A4+S*A6) */
2368            fp3 = floatx80_mul(fp3, fp1, status); /* fp3 IS S*(A3+S*A5) */
2369            fp2 = floatx80_add(fp2, float64_to_floatx80(
2370                               make_float64(0x3FC5555555555555), status),
2371                               status); /* fp2 IS A2+S*(A4+S*A6) */
2372            fp3 = floatx80_add(fp3, float32_to_floatx80(
2373                               make_float32(0x3F000000), status),
2374                               status); /* fp3 IS A1+S*(A3+S*A5) */
2375            fp2 = floatx80_mul(fp2, fp1,
2376                               status); /* fp2 IS S*(A2+S*(A4+S*A6)) */
2377            fp1 = floatx80_mul(fp1, fp3,
2378                               status); /* fp1 IS S*(A1+S*(A3+S*A5)) */
2379            fp2 = floatx80_mul(fp2, fp0,
2380                               status); /* fp2 IS R*S*(A2+S*(A4+S*A6)) */
2381            fp0 = floatx80_add(fp0, fp1,
2382                               status); /* fp0 IS R+S*(A1+S*(A3+S*A5)) */
2383            fp0 = floatx80_add(fp0, fp2, status); /* fp0 IS EXP(R) - 1 */
2384
2385            fp0 = floatx80_mul(fp0, exp_tbl[j],
2386                               status); /* 2^(J/64)*(Exp(R)-1) */
2387
2388            if (m >= 64) {
2389                fp1 = float32_to_floatx80(exp_tbl2[j], status);
2390                onebysc = packFloatx80(1, m1 + 0x3FFF, one_sig); /* -2^(-M) */
2391                fp1 = floatx80_add(fp1, onebysc, status);
2392                fp0 = floatx80_add(fp0, fp1, status);
2393                fp0 = floatx80_add(fp0, exp_tbl[j], status);
2394            } else if (m < -3) {
2395                fp0 = floatx80_add(fp0, float32_to_floatx80(exp_tbl2[j],
2396                                   status), status);
2397                fp0 = floatx80_add(fp0, exp_tbl[j], status);
2398                onebysc = packFloatx80(1, m1 + 0x3FFF, one_sig); /* -2^(-M) */
2399                fp0 = floatx80_add(fp0, onebysc, status);
2400            } else { /* -3 <= m <= 63 */
2401                fp1 = exp_tbl[j];
2402                fp0 = floatx80_add(fp0, float32_to_floatx80(exp_tbl2[j],
2403                                   status), status);
2404                onebysc = packFloatx80(1, m1 + 0x3FFF, one_sig); /* -2^(-M) */
2405                fp1 = floatx80_add(fp1, onebysc, status);
2406                fp0 = floatx80_add(fp0, fp1, status);
2407            }
2408
2409            sc = packFloatx80(0, m + 0x3FFF, one_sig);
2410
2411            status->float_rounding_mode = user_rnd_mode;
2412            status->floatx80_rounding_precision = user_rnd_prec;
2413
2414            a = floatx80_mul(fp0, sc, status);
2415
2416            float_raise(float_flag_inexact, status);
2417
2418            return a;
2419        } else { /* |X| > 70 log2 */
2420            if (aSign) {
2421                fp0 = float32_to_floatx80(make_float32(0xBF800000),
2422                      status); /* -1 */
2423
2424                status->float_rounding_mode = user_rnd_mode;
2425                status->floatx80_rounding_precision = user_rnd_prec;
2426
2427                a = floatx80_add(fp0, float32_to_floatx80(
2428                                 make_float32(0x00800000), status),
2429                                 status); /* -1 + 2^(-126) */
2430
2431                float_raise(float_flag_inexact, status);
2432
2433                return a;
2434            } else {
2435                status->float_rounding_mode = user_rnd_mode;
2436                status->floatx80_rounding_precision = user_rnd_prec;
2437
2438                return floatx80_etox(a, status);
2439            }
2440        }
2441    } else { /* |X| < 1/4 */
2442        if (aExp >= 0x3FBE) {
2443            fp0 = a;
2444            fp0 = floatx80_mul(fp0, fp0, status); /* S = X*X */
2445            fp1 = float32_to_floatx80(make_float32(0x2F30CAA8),
2446                                      status); /* B12 */
2447            fp1 = floatx80_mul(fp1, fp0, status); /* S * B12 */
2448            fp2 = float32_to_floatx80(make_float32(0x310F8290),
2449                                      status); /* B11 */
2450            fp1 = floatx80_add(fp1, float32_to_floatx80(
2451                               make_float32(0x32D73220), status),
2452                               status); /* B10 */
2453            fp2 = floatx80_mul(fp2, fp0, status);
2454            fp1 = floatx80_mul(fp1, fp0, status);
2455            fp2 = floatx80_add(fp2, float32_to_floatx80(
2456                               make_float32(0x3493F281), status),
2457                               status); /* B9 */
2458            fp1 = floatx80_add(fp1, float64_to_floatx80(
2459                               make_float64(0x3EC71DE3A5774682), status),
2460                               status); /* B8 */
2461            fp2 = floatx80_mul(fp2, fp0, status);
2462            fp1 = floatx80_mul(fp1, fp0, status);
2463            fp2 = floatx80_add(fp2, float64_to_floatx80(
2464                               make_float64(0x3EFA01A019D7CB68), status),
2465                               status); /* B7 */
2466            fp1 = floatx80_add(fp1, float64_to_floatx80(
2467                               make_float64(0x3F2A01A01A019DF3), status),
2468                               status); /* B6 */
2469            fp2 = floatx80_mul(fp2, fp0, status);
2470            fp1 = floatx80_mul(fp1, fp0, status);
2471            fp2 = floatx80_add(fp2, float64_to_floatx80(
2472                               make_float64(0x3F56C16C16C170E2), status),
2473                               status); /* B5 */
2474            fp1 = floatx80_add(fp1, float64_to_floatx80(
2475                               make_float64(0x3F81111111111111), status),
2476                               status); /* B4 */
2477            fp2 = floatx80_mul(fp2, fp0, status);
2478            fp1 = floatx80_mul(fp1, fp0, status);
2479            fp2 = floatx80_add(fp2, float64_to_floatx80(
2480                               make_float64(0x3FA5555555555555), status),
2481                               status); /* B3 */
2482            fp3 = packFloatx80(0, 0x3FFC, UINT64_C(0xAAAAAAAAAAAAAAAB));
2483            fp1 = floatx80_add(fp1, fp3, status); /* B2 */
2484            fp2 = floatx80_mul(fp2, fp0, status);
2485            fp1 = floatx80_mul(fp1, fp0, status);
2486
2487            fp2 = floatx80_mul(fp2, fp0, status);
2488            fp1 = floatx80_mul(fp1, a, status);
2489
2490            fp0 = floatx80_mul(fp0, float32_to_floatx80(
2491                               make_float32(0x3F000000), status),
2492                               status); /* S*B1 */
2493            fp1 = floatx80_add(fp1, fp2, status); /* Q */
2494            fp0 = floatx80_add(fp0, fp1, status); /* S*B1+Q */
2495
2496            status->float_rounding_mode = user_rnd_mode;
2497            status->floatx80_rounding_precision = user_rnd_prec;
2498
2499            a = floatx80_add(fp0, a, status);
2500
2501            float_raise(float_flag_inexact, status);
2502
2503            return a;
2504        } else { /* |X| < 2^(-65) */
2505            sc = packFloatx80(1, 1, one_sig);
2506            fp0 = a;
2507
2508            if (aExp < 0x0033) { /* |X| < 2^(-16382) */
2509                fp0 = floatx80_mul(fp0, float64_to_floatx80(
2510                                   make_float64(0x48B0000000000000), status),
2511                                   status);
2512                fp0 = floatx80_add(fp0, sc, status);
2513
2514                status->float_rounding_mode = user_rnd_mode;
2515                status->floatx80_rounding_precision = user_rnd_prec;
2516
2517                a = floatx80_mul(fp0, float64_to_floatx80(
2518                                 make_float64(0x3730000000000000), status),
2519                                 status);
2520            } else {
2521                status->float_rounding_mode = user_rnd_mode;
2522                status->floatx80_rounding_precision = user_rnd_prec;
2523
2524                a = floatx80_add(fp0, sc, status);
2525            }
2526
2527            float_raise(float_flag_inexact, status);
2528
2529            return a;
2530        }
2531    }
2532}
2533
2534/*
2535 * Hyperbolic tangent
2536 */
2537
2538floatx80 floatx80_tanh(floatx80 a, float_status *status)
2539{
2540    bool aSign, vSign;
2541    int32_t aExp, vExp;
2542    uint64_t aSig, vSig;
2543
2544    int8_t user_rnd_mode, user_rnd_prec;
2545
2546    int32_t compact;
2547    floatx80 fp0, fp1;
2548    uint32_t sign;
2549
2550    aSig = extractFloatx80Frac(a);
2551    aExp = extractFloatx80Exp(a);
2552    aSign = extractFloatx80Sign(a);
2553
2554    if (aExp == 0x7FFF) {
2555        if ((uint64_t) (aSig << 1)) {
2556            return propagateFloatx80NaNOneArg(a, status);
2557        }
2558        return packFloatx80(aSign, one_exp, one_sig);
2559    }
2560
2561    if (aExp == 0 && aSig == 0) {
2562        return packFloatx80(aSign, 0, 0);
2563    }
2564
2565    user_rnd_mode = status->float_rounding_mode;
2566    user_rnd_prec = status->floatx80_rounding_precision;
2567    status->float_rounding_mode = float_round_nearest_even;
2568    status->floatx80_rounding_precision = 80;
2569
2570    compact = floatx80_make_compact(aExp, aSig);
2571
2572    if (compact < 0x3FD78000 || compact > 0x3FFFDDCE) {
2573        /* TANHBORS */
2574        if (compact < 0x3FFF8000) {
2575            /* TANHSM */
2576            status->float_rounding_mode = user_rnd_mode;
2577            status->floatx80_rounding_precision = user_rnd_prec;
2578
2579            a = floatx80_move(a, status);
2580
2581            float_raise(float_flag_inexact, status);
2582
2583            return a;
2584        } else {
2585            if (compact > 0x40048AA1) {
2586                /* TANHHUGE */
2587                sign = 0x3F800000;
2588                sign |= aSign ? 0x80000000 : 0x00000000;
2589                fp0 = float32_to_floatx80(make_float32(sign), status);
2590                sign &= 0x80000000;
2591                sign ^= 0x80800000; /* -SIGN(X)*EPS */
2592
2593                status->float_rounding_mode = user_rnd_mode;
2594                status->floatx80_rounding_precision = user_rnd_prec;
2595
2596                a = floatx80_add(fp0, float32_to_floatx80(make_float32(sign),
2597                                 status), status);
2598
2599                float_raise(float_flag_inexact, status);
2600
2601                return a;
2602            } else {
2603                fp0 = packFloatx80(0, aExp + 1, aSig); /* Y = 2|X| */
2604                fp0 = floatx80_etox(fp0, status); /* FP0 IS EXP(Y) */
2605                fp0 = floatx80_add(fp0, float32_to_floatx80(
2606                                   make_float32(0x3F800000),
2607                                   status), status); /* EXP(Y)+1 */
2608                sign = aSign ? 0x80000000 : 0x00000000;
2609                fp1 = floatx80_div(float32_to_floatx80(make_float32(
2610                                   sign ^ 0xC0000000), status), fp0,
2611                                   status); /* -SIGN(X)*2 / [EXP(Y)+1] */
2612                fp0 = float32_to_floatx80(make_float32(sign | 0x3F800000),
2613                                          status); /* SIGN */
2614
2615                status->float_rounding_mode = user_rnd_mode;
2616                status->floatx80_rounding_precision = user_rnd_prec;
2617
2618                a = floatx80_add(fp1, fp0, status);
2619
2620                float_raise(float_flag_inexact, status);
2621
2622                return a;
2623            }
2624        }
2625    } else { /* 2**(-40) < |X| < (5/2)LOG2 */
2626        fp0 = packFloatx80(0, aExp + 1, aSig); /* Y = 2|X| */
2627        fp0 = floatx80_etoxm1(fp0, status); /* FP0 IS Z = EXPM1(Y) */
2628        fp1 = floatx80_add(fp0, float32_to_floatx80(make_float32(0x40000000),
2629                           status),
2630                           status); /* Z+2 */
2631
2632        vSign = extractFloatx80Sign(fp1);
2633        vExp = extractFloatx80Exp(fp1);
2634        vSig = extractFloatx80Frac(fp1);
2635
2636        fp1 = packFloatx80(vSign ^ aSign, vExp, vSig);
2637
2638        status->float_rounding_mode = user_rnd_mode;
2639        status->floatx80_rounding_precision = user_rnd_prec;
2640
2641        a = floatx80_div(fp0, fp1, status);
2642
2643        float_raise(float_flag_inexact, status);
2644
2645        return a;
2646    }
2647}
2648
2649/*
2650 * Hyperbolic sine
2651 */
2652
2653floatx80 floatx80_sinh(floatx80 a, float_status *status)
2654{
2655    bool aSign;
2656    int32_t aExp;
2657    uint64_t aSig;
2658
2659    int8_t user_rnd_mode, user_rnd_prec;
2660
2661    int32_t compact;
2662    floatx80 fp0, fp1, fp2;
2663    float32 fact;
2664
2665    aSig = extractFloatx80Frac(a);
2666    aExp = extractFloatx80Exp(a);
2667    aSign = extractFloatx80Sign(a);
2668
2669    if (aExp == 0x7FFF) {
2670        if ((uint64_t) (aSig << 1)) {
2671            return propagateFloatx80NaNOneArg(a, status);
2672        }
2673        return packFloatx80(aSign, floatx80_infinity.high,
2674                            floatx80_infinity.low);
2675    }
2676
2677    if (aExp == 0 && aSig == 0) {
2678        return packFloatx80(aSign, 0, 0);
2679    }
2680
2681    user_rnd_mode = status->float_rounding_mode;
2682    user_rnd_prec = status->floatx80_rounding_precision;
2683    status->float_rounding_mode = float_round_nearest_even;
2684    status->floatx80_rounding_precision = 80;
2685
2686    compact = floatx80_make_compact(aExp, aSig);
2687
2688    if (compact > 0x400CB167) {
2689        /* SINHBIG */
2690        if (compact > 0x400CB2B3) {
2691            status->float_rounding_mode = user_rnd_mode;
2692            status->floatx80_rounding_precision = user_rnd_prec;
2693
2694            return roundAndPackFloatx80(status->floatx80_rounding_precision,
2695                                        aSign, 0x8000, aSig, 0, status);
2696        } else {
2697            fp0 = floatx80_abs(a); /* Y = |X| */
2698            fp0 = floatx80_sub(fp0, float64_to_floatx80(
2699                               make_float64(0x40C62D38D3D64634), status),
2700                               status); /* (|X|-16381LOG2_LEAD) */
2701            fp0 = floatx80_sub(fp0, float64_to_floatx80(
2702                               make_float64(0x3D6F90AEB1E75CC7), status),
2703                               status); /* |X| - 16381 LOG2, ACCURATE */
2704            fp0 = floatx80_etox(fp0, status);
2705            fp2 = packFloatx80(aSign, 0x7FFB, one_sig);
2706
2707            status->float_rounding_mode = user_rnd_mode;
2708            status->floatx80_rounding_precision = user_rnd_prec;
2709
2710            a = floatx80_mul(fp0, fp2, status);
2711
2712            float_raise(float_flag_inexact, status);
2713
2714            return a;
2715        }
2716    } else { /* |X| < 16380 LOG2 */
2717        fp0 = floatx80_abs(a); /* Y = |X| */
2718        fp0 = floatx80_etoxm1(fp0, status); /* FP0 IS Z = EXPM1(Y) */
2719        fp1 = floatx80_add(fp0, float32_to_floatx80(make_float32(0x3F800000),
2720                           status), status); /* 1+Z */
2721        fp2 = fp0;
2722        fp0 = floatx80_div(fp0, fp1, status); /* Z/(1+Z) */
2723        fp0 = floatx80_add(fp0, fp2, status);
2724
2725        fact = packFloat32(aSign, 0x7E, 0);
2726
2727        status->float_rounding_mode = user_rnd_mode;
2728        status->floatx80_rounding_precision = user_rnd_prec;
2729
2730        a = floatx80_mul(fp0, float32_to_floatx80(fact, status), status);
2731
2732        float_raise(float_flag_inexact, status);
2733
2734        return a;
2735    }
2736}
2737
2738/*
2739 * Hyperbolic cosine
2740 */
2741
2742floatx80 floatx80_cosh(floatx80 a, float_status *status)
2743{
2744    int32_t aExp;
2745    uint64_t aSig;
2746
2747    int8_t user_rnd_mode, user_rnd_prec;
2748
2749    int32_t compact;
2750    floatx80 fp0, fp1;
2751
2752    aSig = extractFloatx80Frac(a);
2753    aExp = extractFloatx80Exp(a);
2754
2755    if (aExp == 0x7FFF) {
2756        if ((uint64_t) (aSig << 1)) {
2757            return propagateFloatx80NaNOneArg(a, status);
2758        }
2759        return packFloatx80(0, floatx80_infinity.high,
2760                            floatx80_infinity.low);
2761    }
2762
2763    if (aExp == 0 && aSig == 0) {
2764        return packFloatx80(0, one_exp, one_sig);
2765    }
2766
2767    user_rnd_mode = status->float_rounding_mode;
2768    user_rnd_prec = status->floatx80_rounding_precision;
2769    status->float_rounding_mode = float_round_nearest_even;
2770    status->floatx80_rounding_precision = 80;
2771
2772    compact = floatx80_make_compact(aExp, aSig);
2773
2774    if (compact > 0x400CB167) {
2775        if (compact > 0x400CB2B3) {
2776            status->float_rounding_mode = user_rnd_mode;
2777            status->floatx80_rounding_precision = user_rnd_prec;
2778            return roundAndPackFloatx80(status->floatx80_rounding_precision, 0,
2779                                        0x8000, one_sig, 0, status);
2780        } else {
2781            fp0 = packFloatx80(0, aExp, aSig);
2782            fp0 = floatx80_sub(fp0, float64_to_floatx80(
2783                               make_float64(0x40C62D38D3D64634), status),
2784                               status);
2785            fp0 = floatx80_sub(fp0, float64_to_floatx80(
2786                               make_float64(0x3D6F90AEB1E75CC7), status),
2787                               status);
2788            fp0 = floatx80_etox(fp0, status);
2789            fp1 = packFloatx80(0, 0x7FFB, one_sig);
2790
2791            status->float_rounding_mode = user_rnd_mode;
2792            status->floatx80_rounding_precision = user_rnd_prec;
2793
2794            a = floatx80_mul(fp0, fp1, status);
2795
2796            float_raise(float_flag_inexact, status);
2797
2798            return a;
2799        }
2800    }
2801
2802    fp0 = packFloatx80(0, aExp, aSig); /* |X| */
2803    fp0 = floatx80_etox(fp0, status); /* EXP(|X|) */
2804    fp0 = floatx80_mul(fp0, float32_to_floatx80(make_float32(0x3F000000),
2805                       status), status); /* (1/2)*EXP(|X|) */
2806    fp1 = float32_to_floatx80(make_float32(0x3E800000), status); /* 1/4 */
2807    fp1 = floatx80_div(fp1, fp0, status); /* 1/(2*EXP(|X|)) */
2808
2809    status->float_rounding_mode = user_rnd_mode;
2810    status->floatx80_rounding_precision = user_rnd_prec;
2811
2812    a = floatx80_add(fp0, fp1, status);
2813
2814    float_raise(float_flag_inexact, status);
2815
2816    return a;
2817}
2818