LCOV - code coverage report
Current view: top level - ballet/bn254 - fd_bn254_pairing.c (source / functions) Hit Total Coverage
Test: cov.lcov Lines: 213 213 100.0 %
Date: 2024-11-13 11:58:15 Functions: 5 5 100.0 %

          Line data    Source code
       1             : #include "./fd_bn254.h"
       2             : 
       3             : /* Pairing */
       4             : 
       5             : static inline void
       6             : fd_bn254_pairing_proj_dbl( fd_bn254_fp12_t *     r,
       7             :                            fd_bn254_g2_t *       t,
       8       16128 :                            fd_bn254_g1_t const * p ) {
       9             :   /* https://eprint.iacr.org/2012/408, Sec 4.2.
      10             :      See also: https://eprint.iacr.org/2013/722, Sec. 4.3, Eq. (11).
      11             :      https://github.com/Consensys/gnark-crypto/blob/v0.12.1/ecc/bn254/pairing.go#L302
      12             :      Note: this can be optimized by precomputing 3x, -y and probably more. */
      13       16128 :   fd_bn254_fp2_t * X = &t->X;
      14       16128 :   fd_bn254_fp2_t * Y = &t->Y;
      15       16128 :   fd_bn254_fp2_t * Z = &t->Z;
      16       16128 :   fd_bn254_fp_t const * x = &p->X;
      17       16128 :   fd_bn254_fp_t const * y = &p->Y;
      18       16128 :   fd_bn254_fp2_t a[1], b[1], c[1], d[1];
      19       16128 :   fd_bn254_fp2_t e[1], f[1], g[1], h[1];
      20       16128 :   fd_bn254_fp_t x3[1];
      21             :   /* A=X1*Y1/2 */
      22       16128 :   fd_bn254_fp2_mul( a, X, Y );
      23       16128 :   fd_bn254_fp2_halve( a, a );
      24             :   /* B=Y1^2 */
      25       16128 :   fd_bn254_fp2_sqr( b, Y );
      26             :   /* C=Z1^2 */
      27       16128 :   fd_bn254_fp2_sqr( c, Z );
      28             :   /* D=3C */
      29       16128 :   fd_bn254_fp2_add( d, c, c );
      30       16128 :   fd_bn254_fp2_add( d, d, c );
      31             :   /* E=b'*D */
      32       16128 :   fd_bn254_fp2_mul( e, d, fd_bn254_const_twist_b_mont );
      33             :   /* F=3E */
      34       16128 :   fd_bn254_fp2_add( f, e, e );
      35       16128 :   fd_bn254_fp2_add( f, f, e );
      36             :   /* G=(B+F)/2 */
      37       16128 :   fd_bn254_fp2_add( g, b, f );
      38       16128 :   fd_bn254_fp2_halve( g, g );
      39             :   /* H =(Y1+Z1)^2 − (B+C) */
      40       16128 :   fd_bn254_fp2_add( h, Y, Z );
      41       16128 :   fd_bn254_fp2_sqr( h, h );
      42       16128 :   fd_bn254_fp2_sub( h, h, b );
      43       16128 :   fd_bn254_fp2_sub( h, h, c );
      44             : 
      45             :   /* g(P) = (H * -y) + (X^2 * 3 * x)w + (E−B)w^3. */
      46             :   /* el[0][0] = -(H * y) */
      47       16128 :   fd_bn254_fp2_neg( &r->el[0].el[0], h );
      48       16128 :   fd_bn254_fp_mul( &r->el[0].el[0].el[0], &r->el[0].el[0].el[0], y );
      49       16128 :   fd_bn254_fp_mul( &r->el[0].el[0].el[1], &r->el[0].el[0].el[1], y );
      50             :   /* el[0][1] = 0 */
      51       16128 :   fd_bn254_fp2_set_zero( &r->el[0].el[1] );
      52             :   /* el[0][2] = 0 */
      53       16128 :   fd_bn254_fp2_set_zero( &r->el[0].el[2] );
      54             :   /* el[1][0] = (3 * X^2 * x) */
      55       16128 :   fd_bn254_fp2_sqr( &r->el[1].el[0], X );
      56       16128 :   fd_bn254_fp_add( x3, x, x );
      57       16128 :   fd_bn254_fp_add( x3, x3, x );
      58       16128 :   fd_bn254_fp_mul( &r->el[1].el[0].el[0], &r->el[1].el[0].el[0], x3 );
      59       16128 :   fd_bn254_fp_mul( &r->el[1].el[0].el[1], &r->el[1].el[0].el[1], x3 );
      60             :   /* el[1][0] = (E−B) */
      61       16128 :   fd_bn254_fp2_sub( &r->el[1].el[1], e, b );
      62             :   /* el[1][2] = 0 */
      63       16128 :   fd_bn254_fp2_set_zero( &r->el[1].el[2] );
      64             : 
      65             :   /* update t */
      66             :   /* X3 = A * (B−F) */
      67       16128 :   fd_bn254_fp2_sub( X, b, f );
      68       16128 :   fd_bn254_fp2_mul( X, X, a );
      69             :   /* Y3 = G^2 − 3*E^2 (reusing var c, d) */
      70       16128 :   fd_bn254_fp2_sqr( Y, g );
      71       16128 :   fd_bn254_fp2_sqr( c, e );
      72       16128 :   fd_bn254_fp2_add( d, c, c );
      73       16128 :   fd_bn254_fp2_add( d, d, c );
      74       16128 :   fd_bn254_fp2_sub( Y, Y, d );
      75             :   /* Z3 = B * H */
      76       16128 :   fd_bn254_fp2_mul( Z, b, h );
      77       16128 : }
      78             : 
      79             : static inline void
      80             : fd_bn254_pairing_proj_add_sub( fd_bn254_fp12_t *     r,
      81             :                                fd_bn254_g2_t *       t,
      82             :                                fd_bn254_g2_t const * q,
      83             :                                fd_bn254_g1_t const * p,
      84             :                                int                   is_add,
      85        6048 :                                int                   add_point ) {
      86             :   /* https://eprint.iacr.org/2012/408, Sec 4.2.
      87             :      See also: https://eprint.iacr.org/2013/722, Sec. 4.3, Eq. (12, 13).
      88             :      https://github.com/Consensys/gnark-crypto/blob/v0.12.1/ecc/bn254/pairing.go#L343
      89             :      Note: this can be optimized by precomputing -x and probably more. */
      90        6048 :   fd_bn254_fp2_t * X = &t->X;
      91        6048 :   fd_bn254_fp2_t * Y = &t->Y;
      92        6048 :   fd_bn254_fp2_t * Z = &t->Z;
      93        6048 :   fd_bn254_fp2_t const * X2 = &q->X;
      94        6048 :   fd_bn254_fp2_t Y2[1];
      95        6048 :   fd_bn254_fp_t const * x = &p->X;
      96        6048 :   fd_bn254_fp_t const * y = &p->Y;
      97        6048 :   fd_bn254_fp2_t a[1], b[1], c[1], d[1];
      98        6048 :   fd_bn254_fp2_t e[1], f[1], g[1], h[1];
      99        6048 :   fd_bn254_fp2_t i[1], j[1], k[1];
     100        6048 :   fd_bn254_fp2_t o[1], l[1];
     101             : 
     102        6048 :   if( is_add ) {
     103        2772 :     fd_bn254_fp2_set( Y2, &q->Y );
     104        3276 :   } else {
     105        3276 :     fd_bn254_fp2_neg( Y2, &q->Y );
     106        3276 :   }
     107             : 
     108        6048 :   fd_bn254_fp2_mul( a, Y2, Z );
     109        6048 :   fd_bn254_fp2_mul( b, X2, Z );
     110        6048 :   fd_bn254_fp2_sub( o, Y, a );
     111        6048 :   fd_bn254_fp2_sub( l, X, b );
     112             : 
     113        6048 :   fd_bn254_fp2_mul( j, o, X2 );
     114        6048 :   fd_bn254_fp2_mul( k, l, Y2 );
     115             :   // fd_bn254_fp2_sub( j, j, k );
     116             : 
     117             :   /* g(P) */
     118             :   /* el[0][0] = (l * y) */
     119        6048 :   fd_bn254_fp_mul( &r->el[0].el[0].el[0], &l->el[0], y );
     120        6048 :   fd_bn254_fp_mul( &r->el[0].el[0].el[1], &l->el[1], y );
     121             :   /* el[0][1] = 0 */
     122        6048 :   fd_bn254_fp2_set_zero( &r->el[0].el[1] );
     123             :   /* el[0][2] = 0 */
     124        6048 :   fd_bn254_fp2_set_zero( &r->el[0].el[2] );
     125             :   /* el[1][0] = -(o * x), term in w */
     126        6048 :   fd_bn254_fp2_neg( &r->el[1].el[0], o );
     127        6048 :   fd_bn254_fp_mul( &r->el[1].el[0].el[0], &r->el[1].el[0].el[0], x );
     128        6048 :   fd_bn254_fp_mul( &r->el[1].el[0].el[1], &r->el[1].el[0].el[1], x );
     129             :   /* el[1][1] = j-k */
     130        6048 :   fd_bn254_fp2_sub( &r->el[1].el[1], j, k );
     131             :   /* el[1][2] = 0 */
     132        6048 :   fd_bn254_fp2_set_zero( &r->el[1].el[2] );
     133             : 
     134        6048 :   if( add_point ) {
     135        5544 :     fd_bn254_fp2_sqr( c, o );
     136        5544 :     fd_bn254_fp2_sqr( d, l );
     137        5544 :     fd_bn254_fp2_mul( e, d, l );
     138        5544 :     fd_bn254_fp2_mul( f, Z, c );
     139        5544 :     fd_bn254_fp2_mul( g, X, d );
     140        5544 :     fd_bn254_fp2_add( h, e, f );
     141        5544 :     fd_bn254_fp2_sub( h, h, g );
     142        5544 :     fd_bn254_fp2_sub( h, h, g );
     143        5544 :     fd_bn254_fp2_mul( i, Y, e );
     144             : 
     145             :     /* update t */
     146        5544 :     fd_bn254_fp2_mul( X, l, h );
     147        5544 :     fd_bn254_fp2_sub( Y, g, h );
     148        5544 :     fd_bn254_fp2_mul( Y, Y, o );
     149        5544 :     fd_bn254_fp2_sub( Y, Y, i );
     150        5544 :     fd_bn254_fp2_mul( Z, Z, e );
     151        5544 :   }
     152        6048 : }
     153             : 
     154             : fd_bn254_fp12_t *
     155             : fd_bn254_miller_loop( fd_bn254_fp12_t *   f,
     156             :                       fd_bn254_g1_t const p[],
     157             :                       fd_bn254_g2_t const q[],
     158         156 :                       ulong               sz ) {
     159             :   /* https://github.com/Consensys/gnark-crypto/blob/v0.12.1/ecc/bn254/pairing.go#L121 */
     160             :   //TODO use more efficient muls
     161         156 :   const schar s[] = {
     162         156 :     0,  0,  0,  1,  0,  1,  0, -1,
     163         156 :     0,  0, -1,  0,  0,  0,  1,  0,
     164         156 :     0, -1,  0, -1,  0,  0,  0,  1,
     165         156 :     0, -1,  0,  0,  0,  0, -1,  0,
     166         156 :     0,  1,  0, -1,  0,  0,  1,  0,
     167         156 :     0,  0,  0,  0, -1,  0,  0, -1,
     168         156 :     0,  1,  0, -1,  0,  0,  0, -1,
     169         156 :     0, -1,  0,  0,  0,  1,  0, -1, /* 0, 1 */
     170         156 :   };
     171             : 
     172         156 :   fd_bn254_g2_t t[FD_BN254_PAIRING_BATCH_MAX], frob[1];
     173         156 :   fd_bn254_fp12_t l[1];
     174             : 
     175         156 :   fd_bn254_fp12_set_one( f );
     176         408 :   for ( ulong j=0; j<sz; j++ ) {
     177         252 :     fd_bn254_g2_set( &t[j], &q[j] );
     178         252 :   }
     179             : 
     180         408 :   for( ulong j=0; j<sz; j++ ) {
     181         252 :     fd_bn254_pairing_proj_dbl( l, &t[j], &p[j] );
     182         252 :     fd_bn254_fp12_mul( f, f, l );
     183         252 :   }
     184         156 :   fd_bn254_fp12_sqr( f, f );
     185             : 
     186         408 :   for( ulong j=0; j<sz; j++ ) {
     187         252 :     fd_bn254_pairing_proj_add_sub( l, &t[j], &q[j], &p[j], 0, 0 ); /* do not change t */
     188         252 :     fd_bn254_fp12_mul( f, f, l );
     189             : 
     190         252 :     fd_bn254_pairing_proj_add_sub( l, &t[j], &q[j], &p[j], 1, 1 );
     191         252 :     fd_bn254_fp12_mul( f, f, l );
     192         252 :   }
     193             : 
     194        9984 :   for( int i = 65-3; i>=0; i-- ) {
     195        9828 :     fd_bn254_fp12_sqr( f, f );
     196             : 
     197       25704 :     for( ulong j=0; j<sz; j++ ) {
     198       15876 :       fd_bn254_pairing_proj_dbl( l, &t[j], &p[j] );
     199       15876 :       fd_bn254_fp12_mul( f, f, l );
     200       15876 :     }
     201             : 
     202        9828 :     if( s[i] != 0 ) {
     203        8160 :       for( ulong j=0; j<sz; j++ ) {
     204        5040 :         fd_bn254_pairing_proj_add_sub( l, &t[j], &q[j], &p[j], s[i] > 0, 1 );
     205        5040 :         fd_bn254_fp12_mul( f, f, l );
     206        5040 :       }
     207        3120 :     }
     208        9828 :   }
     209             : 
     210         408 :   for( ulong j=0; j<sz; j++ ) {
     211         252 :     fd_bn254_g2_frob( frob, &q[j] ); /* frob(q) */
     212         252 :     fd_bn254_pairing_proj_add_sub( l, &t[j], frob, &p[j], 1, 1 );
     213         252 :     fd_bn254_fp12_mul( f, f, l );
     214             : 
     215         252 :     fd_bn254_g2_frob2( frob, &q[j] ); /* -frob^2(q) */
     216         252 :     fd_bn254_g2_neg( frob, frob );
     217         252 :     fd_bn254_pairing_proj_add_sub( l, &t[j], frob, &p[j], 1, 0 ); /* do not change t */
     218         252 :     fd_bn254_fp12_mul( f, f, l );
     219         252 :   }
     220         156 :   return f;
     221         156 : }
     222             : 
     223             : fd_bn254_fp12_t *
     224             : fd_bn254_fp12_pow_x( fd_bn254_fp12_t * restrict r,
     225         792 :                      fd_bn254_fp12_t const *    a ) {
     226             :   /* https://github.com/Consensys/gnark-crypto/blob/v0.12.1/ecc/bn254/internal/fptower/e12_pairing.go#L16 */
     227         792 :   fd_bn254_fp12_t t[7];
     228         792 :   fd_bn254_fp12_sqr_fast( &t[3], a );
     229         792 :   fd_bn254_fp12_sqr_fast( &t[5], &t[3] );
     230         792 :   fd_bn254_fp12_sqr_fast( r,     &t[5] );
     231         792 :   fd_bn254_fp12_sqr_fast( &t[0], r );
     232         792 :   fd_bn254_fp12_mul     ( &t[2], &t[0], a );
     233         792 :   fd_bn254_fp12_mul     ( &t[0], &t[2], &t[3] );
     234         792 :   fd_bn254_fp12_mul     ( &t[1], &t[0], a );
     235         792 :   fd_bn254_fp12_mul     ( &t[4], &t[2], r );
     236         792 :   fd_bn254_fp12_sqr_fast( &t[6], &t[2] );
     237         792 :   fd_bn254_fp12_mul     ( &t[1], &t[1], &t[0] );
     238         792 :   fd_bn254_fp12_mul     ( &t[0], &t[1], &t[3] );
     239        5544 :   for( int i=0; i<6; i++ ) fd_bn254_fp12_sqr_fast( &t[6], &t[6] );
     240         792 :   fd_bn254_fp12_mul     ( &t[5], &t[5], &t[6] );
     241         792 :   fd_bn254_fp12_mul     ( &t[5], &t[5], &t[4] );
     242        6336 :   for( int i=0; i<7; i++ ) fd_bn254_fp12_sqr_fast( &t[5], &t[5] );
     243         792 :   fd_bn254_fp12_mul     ( &t[4], &t[4], &t[5] );
     244        7128 :   for( int i=0; i<8; i++ ) fd_bn254_fp12_sqr_fast( &t[4], &t[4] );
     245         792 :   fd_bn254_fp12_mul     ( &t[4], &t[4], &t[0] );
     246         792 :   fd_bn254_fp12_mul     ( &t[3], &t[3], &t[4] );
     247        5544 :   for( int i=0; i<6; i++ ) fd_bn254_fp12_sqr_fast( &t[3], &t[3] );
     248         792 :   fd_bn254_fp12_mul     ( &t[2], &t[2], &t[3] );
     249        7128 :   for( int i=0; i<8; i++ ) fd_bn254_fp12_sqr_fast( &t[2], &t[2] );
     250         792 :   fd_bn254_fp12_mul     ( &t[2], &t[2], &t[0] );
     251        5544 :   for( int i=0; i<6; i++ ) fd_bn254_fp12_sqr_fast( &t[2], &t[2] );
     252         792 :   fd_bn254_fp12_mul     ( &t[2], &t[2], &t[0] );
     253        8712 :   for( int i=0; i<10; i++ ) fd_bn254_fp12_sqr_fast( &t[2], &t[2] );
     254         792 :   fd_bn254_fp12_mul     ( &t[1], &t[1], &t[2] );
     255        5544 :   for( int i=0; i<6; i++ ) fd_bn254_fp12_sqr_fast( &t[1], &t[1] );
     256         792 :   fd_bn254_fp12_mul     ( &t[0], &t[0], &t[1] );
     257         792 :   fd_bn254_fp12_mul     ( r, r, &t[0] );
     258         792 :   return r;
     259         792 : }
     260             : 
     261             : fd_bn254_fp12_t *
     262             : fd_bn254_final_exp( fd_bn254_fp12_t *       r,
     263         264 :                     fd_bn254_fp12_t * const x ) {
     264             :   /* https://github.com/Consensys/gnark-crypto/blob/v0.12.1/ecc/bn254/pairing.go#L62 */
     265         264 :   fd_bn254_fp12_t t[5], s[1];
     266         264 :   fd_bn254_fp12_conj ( &t[0], x );            /* x^(p^6) */
     267         264 :   fd_bn254_fp12_inv  ( &t[1], x );            /* x^(-1) */
     268         264 :   fd_bn254_fp12_mul  ( &t[0], &t[0], &t[1] ); /* x^(p^6-1) */
     269         264 :   fd_bn254_fp12_frob2( &t[2], &t[0] );        /* x^(p^6-1)(p^2) */
     270         264 :   fd_bn254_fp12_mul  ( s, &t[0], &t[2] );     /* x^(p^6-1)(p^2+1) */
     271             :   /* Fast chain, https://eprint.iacr.org/2015/192, Alg. 10.
     272             :      Variant of https://eprint.iacr.org/2010/354, Alg. 31. */
     273         264 :   fd_bn254_fp12_pow_x   ( &t[0], s );
     274         264 :   fd_bn254_fp12_conj    ( &t[0], &t[0] );
     275         264 :   fd_bn254_fp12_sqr_fast( &t[0], &t[0] );
     276         264 :   fd_bn254_fp12_sqr_fast( &t[1], &t[0] );
     277         264 :   fd_bn254_fp12_mul     ( &t[1], &t[1], &t[0] );
     278             : 
     279         264 :   fd_bn254_fp12_pow_x   ( &t[2], &t[1] );
     280         264 :   fd_bn254_fp12_conj    ( &t[2], &t[2] );
     281         264 :   fd_bn254_fp12_conj    ( &t[3], &t[1] );
     282         264 :   fd_bn254_fp12_mul     ( &t[1], &t[2], &t[3] );
     283             : 
     284         264 :   fd_bn254_fp12_sqr_fast( &t[3], &t[2] );
     285         264 :   fd_bn254_fp12_pow_x   ( &t[4], &t[3] );
     286         264 :   fd_bn254_fp12_mul     ( &t[4], &t[1], &t[4] );
     287         264 :   fd_bn254_fp12_mul     ( &t[3], &t[0], &t[4] );
     288         264 :   fd_bn254_fp12_mul     ( &t[0], &t[2], &t[4] );
     289         264 :   fd_bn254_fp12_mul     ( &t[0], &t[0], s );
     290             : 
     291         264 :   fd_bn254_fp12_frob    ( &t[2], &t[3] );
     292         264 :   fd_bn254_fp12_mul     ( &t[0], &t[0], &t[2] );
     293         264 :   fd_bn254_fp12_frob2   ( &t[2], &t[4] );
     294         264 :   fd_bn254_fp12_mul     ( &t[0], &t[0], &t[2] );
     295             : 
     296         264 :   fd_bn254_fp12_conj    ( &t[2], s );
     297         264 :   fd_bn254_fp12_mul     ( &t[2], &t[2], &t[3] );
     298             :   // fd_bn254_fp12_frob3   ( &t[2], &t[2] );
     299         264 :   fd_bn254_fp12_frob2   ( &t[2], &t[2] );
     300         264 :   fd_bn254_fp12_frob    ( &t[2], &t[2] );
     301         264 :   fd_bn254_fp12_mul     ( r, &t[0], &t[2] );
     302         264 :   return r;
     303         264 : }

Generated by: LCOV version 1.14