[cvs] / xvidcore / src / encoder.c Repository:
ViewVC logotype

Diff of /xvidcore/src/encoder.c

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.133, Sun Nov 28 15:18:21 2010 UTC revision 1.134, Sat Dec 18 16:02:00 2010 UTC
# Line 444  Line 444 
444          pEnc->iFrameNum = 0;          pEnc->iFrameNum = 0;
445          pEnc->fMvPrevSigma = -1;          pEnc->fMvPrevSigma = -1;
446    
447            /* slices */
448            pEnc->num_slices = MIN(MAX(1, create->num_slices), (int) pEnc->mbParam.mb_height);
449    
450          /* multithreaded stuff */          /* multithreaded stuff */
451          if (create->num_threads > 0) {          if (create->num_threads > 0) {
452                  int t = create->num_threads;                  int t = MIN(create->num_threads, (int) (pEnc->mbParam.mb_height>>1)); /* at least two rows per thread */
453                  int rows_per_thread = (pEnc->mbParam.mb_height+t-1)/t;                  int threads_per_slice = MAX(1, (t / pEnc->num_slices));
454                    int rows_per_thread = (pEnc->mbParam.mb_height + threads_per_slice - 1) / threads_per_slice;
455    
456                  pEnc->num_threads = t;                  pEnc->num_threads = t;
457                  pEnc->motionData = xvid_malloc(t*sizeof(SMPmotionData), CACHE_LINE);                  pEnc->smpData = xvid_malloc(t*sizeof(SMPData), CACHE_LINE);
458                  if (!pEnc->motionData)                  if (!pEnc->smpData)
459                          goto xvid_err_nosmp;                          goto xvid_err_nosmp;
460    
461                    /* tmp bitstream buffer for slice coding */
462                    pEnc->smpData[0].tmp_buffer = xvid_malloc(16*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height*sizeof(uint8_t), CACHE_LINE);
463                    if (! pEnc->smpData[0].tmp_buffer) goto xvid_err_nosmp;
464    
465                  for (n = 0; n < t; n++) {                  for (n = 0; n < t; n++) {
466                          pEnc->motionData[n].complete_count_self =                          int s = MIN(pEnc->num_threads, pEnc->num_slices);
467    
468                            pEnc->smpData[n].complete_count_self =
469                                  xvid_malloc(rows_per_thread * sizeof(int), CACHE_LINE);                                  xvid_malloc(rows_per_thread * sizeof(int), CACHE_LINE);
470    
471                          if (!pEnc->motionData[n].complete_count_self)                          if (!pEnc->smpData[n].complete_count_self)
472                                  goto xvid_err_nosmp;                                  goto xvid_err_nosmp;
473    
474                            if (n > 0 && n < s) {
475                                    pEnc->smpData[n].bs = (Bitstream *) xvid_malloc(sizeof(Bitstream), CACHE_LINE);
476                                    if (!pEnc->smpData[n].bs)
477                                            goto xvid_err_nosmp;
478    
479                                    pEnc->smpData[n].sStat = (Statistics *) xvid_malloc(sizeof(Statistics), CACHE_LINE);
480                                    if (!pEnc->smpData[n].sStat)
481                                            goto xvid_err_nosmp;
482    
483                                    pEnc->smpData[n].tmp_buffer = pEnc->smpData[0].tmp_buffer + 16*(((n-1)*pEnc->mbParam.edged_width*pEnc->mbParam.mb_height)/s);
484                                    BitstreamInit(pEnc->smpData[n].bs, pEnc->smpData[n].tmp_buffer, 0);
485                            }
486    
487                          if (n != 0)                          if (n != 0)
488                                  pEnc->motionData[n].complete_count_above =                                  pEnc->smpData[n].complete_count_above =
489                                          pEnc->motionData[n-1].complete_count_self;                                          pEnc->smpData[n-1].complete_count_self;
490                  }                  }
491                  pEnc->motionData[0].complete_count_above =                  pEnc->smpData[0].complete_count_above =
492                          pEnc->motionData[t-1].complete_count_self - 1;                          pEnc->smpData[t-1].complete_count_self - 1;
493    
494          } else {          } else {
495    xvid_err_nosmp:    xvid_err_nosmp:
496                  /* no SMP */                  /* no SMP */
497                    if (pEnc->smpData) {
498                            if (pEnc->smpData[0].tmp_buffer)
499                                    xvid_free(pEnc->smpData[0].tmp_buffer);
500                    }
501                    else {
502                            pEnc->smpData = xvid_malloc(1*sizeof(SMPData), CACHE_LINE);
503                            if (pEnc->smpData == NULL)
504                                    goto xvid_err_memory5;
505                    }
506    
507                  create->num_threads = 0;                  create->num_threads = 0;
                 pEnc->motionData = NULL;  
508          }          }
509    
510          create->handle = (void *) pEnc;          create->handle = (void *) pEnc;
# Line 687  Line 720 
720                  xvid_free(pEnc->zones);                  xvid_free(pEnc->zones);
721    
722          if (pEnc->num_threads > 0) {          if (pEnc->num_threads > 0) {
723                  for (i = 0; i < pEnc->num_threads; i++)                  for (i = 1; i < MAX(1, MIN(pEnc->num_threads, pEnc->num_slices)); i++) {
724                          xvid_free(pEnc->motionData[i].complete_count_self);                          xvid_free(pEnc->smpData[i].bs);
725                            xvid_free(pEnc->smpData[i].sStat);
726                    }
727                    if (pEnc->smpData[0].tmp_buffer) xvid_free(pEnc->smpData[0].tmp_buffer);
728    
729                  xvid_free(pEnc->motionData);                  for (i = 0; i < pEnc->num_threads; i++)
730                            xvid_free(pEnc->smpData[i].complete_count_self);
731          }          }
732            xvid_free(pEnc->smpData);
733    
734          xvid_free(pEnc);          xvid_free(pEnc);
735    
# Line 1491  Line 1529 
1529    
1530    
1531  static __inline void  static __inline void
1532  CodeIntraMB(Encoder * pEnc,  CodeIntraMB(MACROBLOCK * pMB)
                         MACROBLOCK * pMB)  
1533  {  {
   
1534          pMB->mode = MODE_INTRA;          pMB->mode = MODE_INTRA;
1535    
1536          /* zero mv statistics */          /* zero mv statistics */
# Line 1508  Line 1544 
1544          }          }
1545  }  }
1546    
1547    static void
1548    SliceCodeI(SMPData *data)
1549    {
1550            Encoder *pEnc = (Encoder *) data->pEnc;
1551            Bitstream *bs = (Bitstream *) data->bs;
1552    
1553            uint16_t x, y;
1554            int mb_width = pEnc->mbParam.mb_width;
1555            int mb_height = pEnc->mbParam.mb_height;
1556    
1557            int bound = 0, num_slices = pEnc->num_slices;
1558            FRAMEINFO *const current = pEnc->current;
1559    
1560            DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1561            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1562    
1563            if (data->start_y > 0) { /* write resync marker */
1564                    bound = data->start_y*mb_width;
1565                    write_video_packet_header(bs, &pEnc->mbParam, current, bound);
1566            }
1567    
1568            for (y = data->start_y; y < data->stop_y; y++) {
1569                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1570    
1571                    if (new_bound > bound) {
1572                            bound = new_bound;
1573                            BitstreamPadAlways(bs);
1574                            write_video_packet_header(bs, &pEnc->mbParam, current, bound);
1575                    }
1576    
1577                    for (x = 0; x < mb_width; x++) {
1578                            MACROBLOCK *pMB = &current->mbs[x + y * mb_width];
1579    
1580                            CodeIntraMB(pMB);
1581    
1582                            MBTransQuantIntra(&pEnc->mbParam, current, pMB, x, y,
1583                                                              dct_codes, qcoeff);
1584    
1585                            start_timer();
1586                            MBPrediction(current, x, y, mb_width, qcoeff, bound);
1587                            stop_prediction_timer();
1588    
1589                            start_timer();
1590                            MBCoding(current, pMB, qcoeff, bs, data->sStat);
1591                            stop_coding_timer();
1592    
1593                    }
1594            }
1595    
1596            emms();
1597            BitstreamPadAlways(bs);
1598    }
1599    
1600    static __inline void
1601    SerializeBitstreams(Encoder *pEnc, FRAMEINFO *current, Bitstream *bs, int num_threads)
1602    {
1603            int k;
1604            uint32_t pos = BitstreamLength(bs);
1605    
1606            for (k = 1; k < num_threads; k++) {
1607                    uint32_t len = BitstreamLength(pEnc->smpData[k].bs);
1608    
1609                    memcpy((void *)((ptr_t)bs->start + pos),
1610                               (void *)((ptr_t)pEnc->smpData[k].bs->start), len);
1611    
1612                    current->length = pos += len;
1613    
1614                    /* collect stats */
1615                    current->sStat.iTextBits += pEnc->smpData[k].sStat->iTextBits;
1616                    current->sStat.kblks += pEnc->smpData[k].sStat->kblks;
1617                    current->sStat.mblks += pEnc->smpData[k].sStat->mblks;
1618                    current->sStat.ublks += pEnc->smpData[k].sStat->ublks;
1619                    current->sStat.iMVBits += pEnc->smpData[k].sStat->iMVBits;
1620            }
1621    
1622            if (num_threads > 1) {
1623                    uint32_t pos32 = pos>>2;
1624                    bs->tail = bs->start + pos32;
1625                    bs->pos = 8*(pos - (pos32<<2));
1626                    bs->buf = 0;
1627    
1628                    if (bs->pos > 0) {
1629                            uint32_t pos8 = bs->pos/8;
1630                            memset((void *)((ptr_t)bs->tail+pos8), 0, (4-pos8));
1631                            pos = *bs->tail;
1632    #ifndef ARCH_IS_BIG_ENDIAN
1633                            BSWAP(pos);
1634    #endif
1635                            bs->buf = pos;
1636                    }
1637            }
1638    }
1639    
1640  static int  static int
1641  FrameCodeI(Encoder * pEnc,  FrameCodeI(Encoder * pEnc,
1642                     Bitstream * bs)                     Bitstream * bs)
1643  {  {
1644          int bits = BitstreamPos(bs);          int bits = BitstreamPos(bs);
1645            int bound = 0, num_slices = pEnc->num_slices;
1646            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1647            int slices_per_thread = (num_slices*1024 / num_threads);
1648          int mb_width = pEnc->mbParam.mb_width;          int mb_width = pEnc->mbParam.mb_width;
1649          int mb_height = pEnc->mbParam.mb_height;          int mb_height = pEnc->mbParam.mb_height;
1650            void * status = NULL;
1651          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          uint16_t k;
         DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);  
   
         uint16_t x, y;  
1652    
1653          pEnc->mbParam.m_rounding_type = 1;          pEnc->mbParam.m_rounding_type = 1;
1654          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;          pEnc->current->rounding_type = pEnc->mbParam.m_rounding_type;
# Line 1531  Line 1658 
1658    
1659          SetMacroblockQuants(&pEnc->mbParam, pEnc->current);          SetMacroblockQuants(&pEnc->mbParam, pEnc->current);
1660    
1661          BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current);          BitstreamWriteVolHeader(bs, &pEnc->mbParam, pEnc->current, num_slices);
1662    
1663          set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);          set_timecodes(pEnc->current,pEnc->reference,pEnc->mbParam.fbase);
1664    
# Line 1540  Line 1667 
1667          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1, pEnc->current->mbs[0].quant);          BitstreamWriteVopHeader(bs, &pEnc->mbParam, pEnc->current, 1, pEnc->current->mbs[0].quant);
1668    
1669          pEnc->current->sStat.iTextBits = 0;          pEnc->current->sStat.iTextBits = 0;
         pEnc->current->sStat.iMVBits = 0;  
         pEnc->current->sStat.kblks = mb_width * mb_height;  
         pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;  
1670    
1671          for (y = 0; y < mb_height; y++)          /* multithreaded intra coding - dispatch threads */
1672                  for (x = 0; x < mb_width; x++) {          for (k = 0; k < num_threads; k++) {
1673                          MACROBLOCK *pMB =                  int add = ((slices_per_thread + 512) >> 10);
                                 &pEnc->current->mbs[x + y * pEnc->mbParam.mb_width];  
1674    
1675                          CodeIntraMB(pEnc, pMB);                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
1676    
1677                          MBTransQuantIntra(&pEnc->mbParam, pEnc->current, pMB, x, y,                  pEnc->smpData[k].pEnc = (void *) pEnc;
1678                                                            dct_codes, qcoeff);                  pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
1679                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
1680    
1681                          start_timer();                  bound += add;
                         MBPrediction(pEnc->current, x, y, pEnc->mbParam.mb_width, qcoeff);  
                         stop_prediction_timer();  
1682    
1683                          start_timer();                  if (k > 0) {
1684                          MBCoding(pEnc->current, pMB, qcoeff, bs, &pEnc->current->sStat);                          BitstreamReset(pEnc->smpData[k].bs);
1685                          stop_coding_timer();                          pEnc->smpData[k].sStat->iTextBits = 0;
1686                    }
1687                  }                  }
1688            pEnc->smpData[0].bs = bs;
1689            pEnc->smpData[0].sStat = &pEnc->current->sStat;
1690    
1691          emms();          /* create threads */
1692            for (k = 1; k < num_threads; k++) {
1693                    pthread_create(&pEnc->smpData[k].handle, NULL,
1694                                   (void*)SliceCodeI, (void*)&pEnc->smpData[k]);
1695            }
1696    
1697          BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */          SliceCodeI(&pEnc->smpData[0]);
1698    
1699          pEnc->current->length = (BitstreamPos(bs) - bits) / 8;          /* wait until all threads are finished */
1700            for (k = 1; k < num_threads; k++) {
1701                    pthread_join(pEnc->smpData[k].handle, &status);
1702            }
1703    
1704            pEnc->current->length = BitstreamLength(bs) - (bits/8);
1705    
1706            /* reassemble the pieces together */
1707            SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
1708    
1709            pEnc->current->sStat.iMVBits = 0;
1710            pEnc->current->sStat.mblks = pEnc->current->sStat.ublks = 0;
1711            pEnc->current->sStat.kblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
1712    
1713          pEnc->fMvPrevSigma = -1;          pEnc->fMvPrevSigma = -1;
1714          pEnc->mbParam.m_fcode = 2;          pEnc->mbParam.m_fcode = 2;
# Line 1604  Line 1745 
1745    
1746  #define BFRAME_SKIP_THRESHHOLD 30  #define BFRAME_SKIP_THRESHHOLD 30
1747    
1748  /* FrameCodeP also handles S(GMC)-VOPs */  static void
1749  static int  SliceCodeP(SMPData *data)
 FrameCodeP(Encoder * pEnc,  
                    Bitstream * bs)  
1750  {  {
1751          int bits = BitstreamPos(bs);          Encoder *pEnc = (Encoder *) data->pEnc;
1752            Bitstream *bs = (Bitstream *) data->bs;
1753    
1754            int x, y, k;
1755            FRAMEINFO *const current = pEnc->current;
1756            FRAMEINFO *const reference = pEnc->reference;
1757            MBParam * const pParam = &pEnc->mbParam;
1758            IMAGE *pRef = &reference->image;
1759            int mb_width = pParam->mb_width;
1760            int mb_height = pParam->mb_height;
1761    
1762          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
1763          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
1764    
1765          int x, y, k;          int bound = 0, num_slices = pEnc->num_slices;
1766    
1767            if (data->start_y > 0) { /* write resync marker */
1768                    bound = data->start_y*mb_width;
1769                    write_video_packet_header(bs, pParam, current, bound);
1770            }
1771    
1772            for (y = data->start_y; y < data->stop_y; y++) {
1773                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
1774    
1775                    if (new_bound > bound) {
1776                            bound = new_bound;
1777                            BitstreamPadAlways(bs);
1778                            write_video_packet_header(bs, pParam, current, bound);
1779                    }
1780    
1781                    for (x = 0; x < mb_width; x++) {
1782                            MACROBLOCK *pMB = &current->mbs[x + y * pParam->mb_width];
1783                            int skip_possible;
1784    
1785                            if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q) {
1786                                    CodeIntraMB(pMB);
1787                                    MBTransQuantIntra(pParam, current, pMB, x, y,
1788                                                                      dct_codes, qcoeff);
1789    
1790                                    start_timer();
1791                                    MBPrediction(current, x, y, pParam->mb_width, qcoeff, bound);
1792                                    stop_prediction_timer();
1793    
1794                                    data->sStat->kblks++;
1795    
1796                                    MBCoding(current, pMB, qcoeff, bs, data->sStat);
1797                                    stop_coding_timer();
1798                                    continue;
1799                            }
1800    
1801                            start_timer();
1802                            MBMotionCompensation(pMB, x, y, &reference->image,
1803                                                                     &pEnc->vInterH, &pEnc->vInterV,
1804                                                                     &pEnc->vInterHV, &pEnc->vGMC,
1805                                                                     &current->image,
1806                                                                     dct_codes, pParam->width,
1807                                                                     pParam->height,
1808                                                                     pParam->edged_width,
1809                                                                     (current->vol_flags & XVID_VOL_QUARTERPEL),
1810                                                                     current->rounding_type,
1811                                                                     data->RefQ);
1812    
1813                            stop_comp_timer();
1814    
1815                            pMB->field_pred = 0;
1816    
1817                            if (pMB->cbp != 0) {
1818                                    pMB->cbp = MBTransQuantInter(pParam, current, pMB, x, y,
1819                                                                 dct_codes, qcoeff);
1820                            }
1821    
1822                            if (pMB->dquant != 0)
1823                                    MBSetDquant(pMB, x, y, pParam);
1824    
1825    
1826                            if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||
1827                                       pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||
1828                                       pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {
1829                                    data->sStat->mblks++;
1830                            }  else {
1831                                    data->sStat->ublks++;
1832                            }
1833    
1834                            start_timer();
1835    
1836                            /* Finished processing the MB, now check if to CODE or SKIP */
1837    
1838                            skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER);
1839    
1840                            if (current->coding_type == S_VOP)
1841                                    skip_possible &= (pMB->mcsel == 1);
1842                            else { /* PVOP */
1843                                    const VECTOR * const mv = (pParam->vol_flags & XVID_VOL_QUARTERPEL) ?
1844                                                                                    pMB->qmvs : pMB->mvs;
1845                                    skip_possible &= ((mv->x|mv->y) == 0);
1846                            }
1847    
1848                            if ((pMB->mode == MODE_NOT_CODED) || (skip_possible)) {
1849                                    /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */
1850                                    int bSkip = 1;
1851    
1852                                    if (current->coding_type == P_VOP) {    /* special rule for P-VOP's SKIP */
1853                                            for (k = pEnc->bframenum_head; k < pEnc->bframenum_tail; k++) {
1854                                                    int iSAD;
1855                                                    iSAD = sad16(reference->image.y + 16*y*pParam->edged_width + 16*x,
1856                                                                                    pEnc->bframes[k]->image.y + 16*y*pParam->edged_width + 16*x,
1857                                                                                    pParam->edged_width, BFRAME_SKIP_THRESHHOLD * pMB->quant);
1858                                                    if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant) {
1859                                                            bSkip = 0; /* could not SKIP */
1860                                                            if (pParam->vol_flags & XVID_VOL_QUARTERPEL) {
1861                                                                    VECTOR predMV = get_qpmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
1862                                                                    pMB->pmvs[0].x = - predMV.x;
1863                                                                    pMB->pmvs[0].y = - predMV.y;
1864                                                            } else {
1865                                                                    VECTOR predMV = get_pmv2(current->mbs, pParam->mb_width, bound, x, y, 0);
1866                                                                    pMB->pmvs[0].x = - predMV.x;
1867                                                                    pMB->pmvs[0].y = - predMV.y;
1868                                                            }
1869                                                            pMB->mode = MODE_INTER;
1870                                                            pMB->cbp = 0;
1871                                                            break;
1872                                                    }
1873                                            }
1874                                    }
1875    
1876                                    if (bSkip) {
1877                                            /* do SKIP */
1878                                            pMB->mode = MODE_NOT_CODED;
1879                                            MBSkip(bs);
1880                                            stop_coding_timer();
1881                                            continue;       /* next MB */
1882                                    }
1883                            }
1884    
1885                            /* ordinary case: normal coded INTER/INTER4V block */
1886                            MBCoding(current, pMB, qcoeff, bs, data->sStat);
1887                            stop_coding_timer();
1888                    }
1889            }
1890    
1891            BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
1892            emms();
1893    }
1894    
1895    /* FrameCodeP also handles S(GMC)-VOPs */
1896    static int
1897    FrameCodeP(Encoder * pEnc, Bitstream * bs)
1898    {
1899            int bits = BitstreamPos(bs);
1900    
1901          FRAMEINFO *const current = pEnc->current;          FRAMEINFO *const current = pEnc->current;
1902          FRAMEINFO *const reference = pEnc->reference;          FRAMEINFO *const reference = pEnc->reference;
1903          MBParam * const pParam = &pEnc->mbParam;          MBParam * const pParam = &pEnc->mbParam;
# Line 1622  Line 1905 
1905          int mb_height = pParam->mb_height;          int mb_height = pParam->mb_height;
1906          int coded = 1;          int coded = 1;
1907    
1908            int k = 0, bound = 0, num_slices = pEnc->num_slices;
1909            int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
1910            void * status = NULL;
1911            int slices_per_thread = (num_slices*1024 / num_threads);
1912            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
1913    
1914          IMAGE *pRef = &reference->image;          IMAGE *pRef = &reference->image;
1915    
1916          if (!reference->is_edged) {          if (!reference->is_edged) {
# Line 1668  Line 1957 
1957          if (current->vol_flags & XVID_VOL_GMC ) /* GMC only for S(GMC)-VOPs */          if (current->vol_flags & XVID_VOL_GMC ) /* GMC only for S(GMC)-VOPs */
1958          {       int gmcval;          {       int gmcval;
1959                  current->warp = GlobalMotionEst( current->mbs, pParam, current, reference,                  current->warp = GlobalMotionEst( current->mbs, pParam, current, reference,
1960                                                                   &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV);                                                                   &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV, num_slices);
1961    
1962                  if (current->motion_flags & XVID_ME_GME_REFINE) {                  if (current->motion_flags & XVID_ME_GME_REFINE) {
1963                          gmcval = GlobalMotionEstRefine(&current->warp,                          gmcval = GlobalMotionEstRefine(&current->warp,
# Line 1715  Line 2004 
2004                  }                  }
2005          }          }
2006    
   
2007          if (pEnc->num_threads > 0) {          if (pEnc->num_threads > 0) {
                 /* multithreaded motion estimation - dispatch threads */  
2008    
2009                  void * status;                  /* multithreaded motion estimation - dispatch threads */
2010                  int rows_per_thread = (pParam->mb_height + pEnc->num_threads - 1)/pEnc->num_threads;                  while (k < pEnc->num_threads) {
2011                            int i, add_s = (slices_per_thread + 512) >> 10;
2012                            int add_t = (threads_per_slice + 512) >> 10;
2013    
2014                            int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2015                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2016                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2017    
2018                            slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2019                            threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
2020    
2021                            for (i = 0; i < add_t; i++) {
2022                                    memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
2023    
2024                                    pEnc->smpData[k+i].pEnc = (void *) pEnc;
2025                                    pEnc->smpData[k+i].y_row = i;
2026                                    pEnc->smpData[k+i].y_step = add_t;
2027                                    pEnc->smpData[k+i].stop_y = stop_y;
2028                                    pEnc->smpData[k+i].start_y = start_y;
2029    
                 for (k = 0; k < pEnc->num_threads; k++) {  
                         memset(pEnc->motionData[k].complete_count_self, 0, rows_per_thread * sizeof(int));  
                         pEnc->motionData[k].pParam = &pEnc->mbParam;  
                         pEnc->motionData[k].current = current;  
                         pEnc->motionData[k].reference = reference;  
                         pEnc->motionData[k].pRefH = &pEnc->vInterH;  
                         pEnc->motionData[k].pRefV = &pEnc->vInterV;  
                         pEnc->motionData[k].pRefHV = &pEnc->vInterHV;  
                         pEnc->motionData[k].pGMC = &pEnc->vGMC;  
                         pEnc->motionData[k].y_step = pEnc->num_threads;  
                         pEnc->motionData[k].start_y = k;  
2030                          /* todo: sort out temp space once and for all */                          /* todo: sort out temp space once and for all */
2031                          pEnc->motionData[k].RefQ = pEnc->vInterH.u + 16*k*pParam->edged_width;                                  pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2032                                                                                            16*((k+i)>>1)*pParam->edged_width;
2033                            }
2034    
2035                            pEnc->smpData[k].complete_count_above =
2036                                    pEnc->smpData[k+add_t-1].complete_count_self - 1;
2037    
2038                            bound += add_s;
2039                            k += add_t;
2040                  }                  }
2041    
2042                  for (k = 1; k < pEnc->num_threads; k++) {                  for (k = 1; k < pEnc->num_threads; k++) {
2043                          pthread_create(&pEnc->motionData[k].handle, NULL,                          pthread_create(&pEnc->smpData[k].handle, NULL,
2044                                  (void*)MotionEstimateSMP, (void*)&pEnc->motionData[k]);                                  (void*)MotionEstimateSMP, (void*)&pEnc->smpData[k]);
2045                  }                  }
2046    
2047                  MotionEstimateSMP(&pEnc->motionData[0]);                  MotionEstimateSMP(&pEnc->smpData[0]);
2048    
2049                  for (k = 1; k < pEnc->num_threads; k++) {                  for (k = 1; k < pEnc->num_threads; k++) {
2050                          pthread_join(pEnc->motionData[k].handle, &status);                          pthread_join(pEnc->smpData[k].handle, &status);
2051                  }                  }
2052    
2053                  current->fcode = 0;                  current->fcode = 0;
2054                  for (k = 0; k < pEnc->num_threads; k++) {                  for (k = 0; k < pEnc->num_threads; k++) {
2055                          current->sStat.iMvSum += pEnc->motionData[k].mvSum;                          current->sStat.iMvSum += pEnc->smpData[k].mvSum;
2056                          current->sStat.iMvCount += pEnc->motionData[k].mvCount;                          current->sStat.iMvCount += pEnc->smpData[k].mvCount;
2057                          if (pEnc->motionData[k].minfcode > current->fcode)                          if (pEnc->smpData[k].minfcode > current->fcode)
2058                                  current->fcode = pEnc->motionData[k].minfcode;                                  current->fcode = pEnc->smpData[k].minfcode;
2059                  }                  }
2060    
2061          } else {          } else {
2062    
2063                  /* regular ME */                  /* regular ME */
2064    
2065                  MotionEstimation(&pEnc->mbParam, current, reference,                  MotionEstimation(&pEnc->mbParam, current, reference,
2066                                                   &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,                                                   &pEnc->vInterH, &pEnc->vInterV, &pEnc->vInterHV,
2067                                                   &pEnc->vGMC, 256*4096);                                                   &pEnc->vGMC, 256*4096, num_slices);
2068    
2069          }          }
2070    
2071          stop_motion_timer();          stop_motion_timer();
# Line 1770  Line 2074 
2074    
2075          BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 1, current->mbs[0].quant);          BitstreamWriteVopHeader(bs, &pEnc->mbParam, current, 1, current->mbs[0].quant);
2076    
2077          for (y = 0; y < mb_height; y++) {          /* multithreaded inter coding - dispatch threads */
                 for (x = 0; x < mb_width; x++) {  
                         MACROBLOCK *pMB = &current->mbs[x + y * pParam->mb_width];  
                         int skip_possible;  
2078    
2079                          if (pMB->mode == MODE_INTRA || pMB->mode == MODE_INTRA_Q) {          bound = 0;
2080                                  CodeIntraMB(pEnc, pMB);          slices_per_thread = (num_slices*1024 / num_threads);
                                 MBTransQuantIntra(&pEnc->mbParam, current, pMB, x, y,  
                                                                   dct_codes, qcoeff);  
2081    
2082                                  start_timer();          for (k = 0; k < num_threads; k++) {
2083                                  MBPrediction(current, x, y, pParam->mb_width, qcoeff);                  int add = ((slices_per_thread + 512) >> 10);
                                 stop_prediction_timer();  
2084    
2085                                  current->sStat.kblks++;                  slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
2086    
2087                                  MBCoding(current, pMB, qcoeff, bs, &current->sStat);                  pEnc->smpData[k].pEnc = (void *) pEnc;
2088                                  stop_coding_timer();                  pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2089                                  continue;                  pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2090                          }                  pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2091    
2092                          start_timer();                  bound += add;
                         MBMotionCompensation(pMB, x, y, &reference->image,  
                                                                  &pEnc->vInterH, &pEnc->vInterV,  
                                                                  &pEnc->vInterHV, &pEnc->vGMC,  
                                                                  &current->image,  
                                                                  dct_codes, pParam->width,  
                                                                  pParam->height,  
                                                                  pParam->edged_width,  
                                                                  (current->vol_flags & XVID_VOL_QUARTERPEL),  
                                                                  current->rounding_type);  
   
                         stop_comp_timer();  
2093    
2094                          pMB->field_pred = 0;                  if (k > 0) {
2095                            pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2096                            pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks =
2097                            pEnc->smpData[k].sStat->iMVBits = 0;
2098    
2099                          if (pMB->cbp != 0) {                          BitstreamReset(pEnc->smpData[k].bs);
                                 pMB->cbp = MBTransQuantInter(&pEnc->mbParam, current, pMB, x, y,  
                                                                           dct_codes, qcoeff);  
2100                          }                          }
   
                         if (pMB->dquant != 0)  
                                 MBSetDquant(pMB, x, y, &pEnc->mbParam);  
   
   
                         if (pMB->cbp || pMB->mvs[0].x || pMB->mvs[0].y ||  
                                    pMB->mvs[1].x || pMB->mvs[1].y || pMB->mvs[2].x ||  
                                    pMB->mvs[2].y || pMB->mvs[3].x || pMB->mvs[3].y) {  
                                 current->sStat.mblks++;  
                         }  else {  
                                 current->sStat.ublks++;  
2101                          }                          }
2102            pEnc->smpData[0].bs = bs;
2103            pEnc->smpData[0].sStat = &current->sStat;
2104    
2105                          start_timer();          /* create threads */
2106            for (k = 1; k < num_threads; k++) {
2107                          /* Finished processing the MB, now check if to CODE or SKIP */                  pthread_create(&pEnc->smpData[k].handle, NULL,
2108                            (void*)SliceCodeP, (void*)&pEnc->smpData[k]);
                         skip_possible = (pMB->cbp == 0) && (pMB->mode == MODE_INTER);  
   
                         if (current->coding_type == S_VOP)  
                                 skip_possible &= (pMB->mcsel == 1);  
                         else { /* PVOP */  
                                 const VECTOR * const mv = (pParam->vol_flags & XVID_VOL_QUARTERPEL) ?  
                                                                                 pMB->qmvs : pMB->mvs;  
                                 skip_possible &= ((mv->x|mv->y) == 0);  
2109                          }                          }
2110    
2111                          if ((pMB->mode == MODE_NOT_CODED) || (skip_possible)) {          SliceCodeP(&pEnc->smpData[0]);
                                 /* This is a candidate for SKIPping, but for P-VOPs check intermediate B-frames first */  
                                 int bSkip = 1;  
   
                                 if (current->coding_type == P_VOP) {    /* special rule for P-VOP's SKIP */  
2112    
2113                                          for (k = pEnc->bframenum_head; k < pEnc->bframenum_tail; k++) {          /* wait until all threads are finished */
2114                                                  int iSAD;          for (k = 1; k < num_threads; k++) {
2115                                                  iSAD = sad16(reference->image.y + 16*y*pParam->edged_width + 16*x,                  pthread_join(pEnc->smpData[k].handle, &status);
                                                                                 pEnc->bframes[k]->image.y + 16*y*pParam->edged_width + 16*x,  
                                                                                 pParam->edged_width, BFRAME_SKIP_THRESHHOLD * pMB->quant);  
                                                 if (iSAD >= BFRAME_SKIP_THRESHHOLD * pMB->quant) {  
                                                         bSkip = 0; /* could not SKIP */  
                                                         if (pParam->vol_flags & XVID_VOL_QUARTERPEL) {  
                                                                 VECTOR predMV = get_qpmv2(current->mbs, pParam->mb_width, 0, x, y, 0);  
                                                                 pMB->pmvs[0].x = - predMV.x;  
                                                                 pMB->pmvs[0].y = - predMV.y;  
                                                         } else {  
                                                                 VECTOR predMV = get_pmv2(current->mbs, pParam->mb_width, 0, x, y, 0);  
                                                                 pMB->pmvs[0].x = - predMV.x;  
                                                                 pMB->pmvs[0].y = - predMV.y;  
                                                         }  
                                                         pMB->mode = MODE_INTER;  
                                                         pMB->cbp = 0;  
                                                         break;  
                                                 }  
                                         }  
2116                                  }                                  }
2117    
2118                                  if (bSkip) {          current->length = BitstreamLength(bs) - (bits/8);
                                         /* do SKIP */  
                                         pMB->mode = MODE_NOT_CODED;  
                                         MBSkip(bs);  
                                         stop_coding_timer();  
                                         continue;       /* next MB */  
                                 }  
                         }  
2119    
2120                          /* ordinary case: normal coded INTER/INTER4V block */          /* reassemble the pieces together */
2121                          MBCoding(current, pMB, qcoeff, bs, &pEnc->current->sStat);          SerializeBitstreams(pEnc, pEnc->current, bs, num_threads);
                         stop_coding_timer();  
                 }  
         }  
2122    
         emms();  
2123          updateFcode(&current->sStat, pEnc);          updateFcode(&current->sStat, pEnc);
2124    
2125          /* frame drop code */          /* frame drop code */
2126  #if 0  #if 0
2127          DPRINTF(XVID_DEBUG_DEBUG, "kmu %i %i %i\n", current->sStat.kblks, current->sStat.mblks, current->sStat.ublks);          DPRINTF(XVID_DEBUG_DEBUG, "kmu %i %i %i\n", current->sStat.kblks, current->sStat.mblks, current->sStat.ublks);
2128  #endif  #endif
2129    
2130          if (current->sStat.kblks + current->sStat.mblks <          if (current->sStat.kblks + current->sStat.mblks <
2131                  (pParam->frame_drop_ratio * mb_width * mb_height) / 100 &&                  (pParam->frame_drop_ratio * mb_width * mb_height) / 100 &&
2132                  ( (pEnc->bframenum_head >= pEnc->bframenum_tail) || !(pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP)) )                  ( (pEnc->bframenum_head >= pEnc->bframenum_tail) || !(pEnc->mbParam.global_flags & XVID_GLOBAL_CLOSED_GOP)) )
# Line 1911  Line 2150 
2150                  memcpy(current->mbs, reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);                  memcpy(current->mbs, reference->mbs, sizeof(MACROBLOCK) * mb_width * mb_height);
2151                  coded = 0;                  coded = 0;
2152    
2153                    BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2154    
2155                    current->length = (BitstreamPos(bs) - bits) / 8;
2156    
2157          } else {          } else {
2158    
2159                  pEnc->current->is_edged = 0; /* not edged */                  pEnc->current->is_edged = 0; /* not edged */
# Line 1939  Line 2182 
2182          }          }
2183          */          */
2184    
2185          BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */          return coded;
2186    }
2187    
2188          current->length = (BitstreamPos(bs) - bits) / 8;  static void
2189    SliceCodeB(SMPData *data)
2190    {
2191            Encoder *pEnc = (Encoder *) data->pEnc;
2192            Bitstream *bs = (Bitstream *) data->bs;
2193    
2194          return coded;          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);
2195            DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);
2196    
2197            int x, y;
2198            FRAMEINFO * const frame = (FRAMEINFO * const) data->current;
2199            MBParam * const pParam = &pEnc->mbParam;
2200            int mb_width = pParam->mb_width;
2201            int mb_height = pParam->mb_height;
2202            IMAGE *f_ref = &pEnc->reference->image;
2203            IMAGE *b_ref = &pEnc->current->image;
2204    
2205            int bound = data->start_y*mb_width;
2206            int num_slices = pEnc->num_slices;
2207    
2208            if (data->start_y > 0) { /* write resync marker */
2209                    write_video_packet_header(bs, pParam, frame, bound);
2210  }  }
2211    
2212            for (y = data->start_y; y < data->stop_y; y++) {
2213                    int new_bound = mb_width * ((((y*num_slices) / mb_height) * mb_height + (num_slices-1)) / num_slices);
2214    
2215                    if (new_bound > bound) {
2216                            bound = new_bound;
2217                            BitstreamPadAlways(bs);
2218                            write_video_packet_header(bs, pParam, frame, bound);
2219                    }
2220    
2221                    for (x = 0; x < mb_width; x++) {
2222                            MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];
2223    
2224                            /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */
2225                            if (mb->mode == MODE_NOT_CODED) {
2226                                    if (pParam->plugin_flags & XVID_REQORIGINAL) {
2227                                            MBMotionCompensation(mb, x, y, f_ref, NULL, f_ref, NULL, NULL, &frame->image,
2228                                                                                     NULL, 0, 0, pParam->edged_width, 0, 0, data->RefQ);
2229                                    }
2230                                    continue;
2231                            }
2232    
2233                            mb->quant = frame->quant;
2234    
2235                            if (mb->cbp != 0 || pParam->plugin_flags & XVID_REQORIGINAL) {
2236                                    /* we have to motion-compensate, transfer etc,
2237                                            because there might be blocks to code */
2238    
2239                                    MBMotionCompensationBVOP(pParam, mb, x, y, &frame->image,
2240                                                                                     f_ref, &pEnc->f_refh, &pEnc->f_refv,
2241                                                                                     &pEnc->f_refhv, b_ref, &pEnc->vInterH,
2242                                                                                     &pEnc->vInterV, &pEnc->vInterHV, dct_codes,
2243                                                                                     data->RefQ);
2244    
2245                                    mb->cbp = MBTransQuantInterBVOP(pParam, frame, mb, x, y,  dct_codes, qcoeff);
2246                            }
2247    
2248                            if (mb->mode == MODE_DIRECT_NO4V)
2249                                    mb->mode = MODE_DIRECT;
2250    
2251                            if (mb->mode == MODE_DIRECT && (mb->cbp | mb->pmvs[3].x | mb->pmvs[3].y) == 0)
2252                                    mb->mode = MODE_DIRECT_NONE_MV; /* skipped */
2253                            else
2254                                    if (frame->vop_flags & XVID_VOP_GREYSCALE)
2255                                            /* keep only bits 5-2 -- Chroma blocks will just be skipped by MBCodingBVOP */
2256                                            mb->cbp &= 0x3C;
2257    
2258                            start_timer();
2259                            MBCodingBVOP(frame, mb, qcoeff, frame->fcode, frame->bcode, bs, data->sStat);
2260                            stop_coding_timer();
2261                    }
2262            }
2263    
2264            BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */
2265            emms();
2266    }
2267    
2268  static void  static void
2269  FrameCodeB(Encoder * pEnc,  FrameCodeB(Encoder * pEnc,
# Line 1953  Line 2271 
2271                     Bitstream * bs)                     Bitstream * bs)
2272  {  {
2273          int bits = BitstreamPos(bs);          int bits = BitstreamPos(bs);
2274          DECLARE_ALIGNED_MATRIX(dct_codes, 6, 64, int16_t, CACHE_LINE);          int k = 0, bound = 0, num_slices = pEnc->num_slices;
2275          DECLARE_ALIGNED_MATRIX(qcoeff, 6, 64, int16_t, CACHE_LINE);          int num_threads = MAX(1, MIN(pEnc->num_threads, num_slices));
2276          uint32_t x, y;          void * status = NULL;
2277            int slices_per_thread = (num_slices*1024 / num_threads);
2278            int threads_per_slice = (pEnc->num_threads*1024 / num_threads);
2279    
2280          IMAGE *f_ref = &pEnc->reference->image;          IMAGE *f_ref = &pEnc->reference->image;
2281          IMAGE *b_ref = &pEnc->current->image;          IMAGE *b_ref = &pEnc->current->image;
2282    
2283            MBParam * const pParam = &pEnc->mbParam;
2284            int mb_width = pParam->mb_width;
2285            int mb_height = pParam->mb_height;
2286    
2287          #ifdef BFRAMES_DEC_DEBUG          #ifdef BFRAMES_DEC_DEBUG
2288          FILE *fp;          FILE *fp;
2289          static char first=0;          static char first=0;
# Line 2018  Line 2342 
2342          frame->fcode = frame->bcode = pEnc->current->fcode;          frame->fcode = frame->bcode = pEnc->current->fcode;
2343    
2344          start_timer();          start_timer();
2345    
2346          if (pEnc->num_threads > 0) {          if (pEnc->num_threads > 0) {
2347                  void * status;  
                 int k;  
2348                  /* multithreaded motion estimation - dispatch threads */                  /* multithreaded motion estimation - dispatch threads */
2349                  int rows_per_thread = (pEnc->mbParam.mb_height + pEnc->num_threads - 1)/pEnc->num_threads;                  while (k < pEnc->num_threads) {
2350                            int i, add_s = (slices_per_thread + 512) >> 10;
2351                            int add_t = (threads_per_slice + 512) >> 10;
2352    
2353                            int start_y = (bound * mb_height + (num_slices-1)) / num_slices;
2354                            int stop_y = ((bound+add_s) * mb_height + (num_slices-1)) / num_slices;
2355                            int rows_per_thread = (stop_y - start_y + add_t - 1) / add_t;
2356    
2357                            slices_per_thread += ((num_slices*1024 / num_threads) - add_s*1024);
2358                            threads_per_slice += ((pEnc->num_threads*1024 / num_threads) - add_t*1024);
2359    
2360                            for (i = 0; i < add_t; i++) {
2361                                    memset(pEnc->smpData[k+i].complete_count_self, 0, rows_per_thread * sizeof(int));
2362    
2363                                    pEnc->smpData[k+i].pEnc = (void *) pEnc;
2364                                    pEnc->smpData[k+i].current = frame;
2365    
2366                                    pEnc->smpData[k+i].y_row = i;
2367                                    pEnc->smpData[k+i].y_step = add_t;
2368                                    pEnc->smpData[k+i].stop_y = stop_y;
2369                                    pEnc->smpData[k+i].start_y = start_y;
2370    
                 for (k = 0; k < pEnc->num_threads; k++) {  
                         memset(pEnc->motionData[k].complete_count_self, 0, rows_per_thread * sizeof(int));  
                         pEnc->motionData[k].pParam = &pEnc->mbParam;  
                         pEnc->motionData[k].current = frame;  
                         pEnc->motionData[k].reference = pEnc->current;  
                         pEnc->motionData[k].fRef = f_ref;  
                         pEnc->motionData[k].fRefH = &pEnc->f_refh;  
                         pEnc->motionData[k].fRefV = &pEnc->f_refv;  
                         pEnc->motionData[k].fRefHV = &pEnc->f_refhv;  
                         pEnc->motionData[k].pRef = b_ref;  
                         pEnc->motionData[k].pRefH = &pEnc->vInterH;  
                         pEnc->motionData[k].pRefV = &pEnc->vInterV;  
                         pEnc->motionData[k].pRefHV = &pEnc->vInterHV;  
                         pEnc->motionData[k].time_bp = (int32_t)(pEnc->current->stamp - frame->stamp);  
                         pEnc->motionData[k].time_pp = (int32_t)(pEnc->current->stamp - pEnc->reference->stamp);  
                         pEnc->motionData[k].y_step = pEnc->num_threads;  
                         pEnc->motionData[k].start_y = k;  
2371                          /* todo: sort out temp space once and for all */                          /* todo: sort out temp space once and for all */
2372                          pEnc->motionData[k].RefQ = pEnc->vInterH.u + 16*k*pEnc->mbParam.edged_width;                                  pEnc->smpData[k+i].RefQ = (((k+i)&1) ? pEnc->vInterV.u : pEnc->vInterV.v) +
2373                                                                                            16*((k+i)>>1)*pParam->edged_width;
2374                            }
2375    
2376                            pEnc->smpData[k].complete_count_above =
2377                                    pEnc->smpData[k+add_t-1].complete_count_self - 1;
2378    
2379                            bound += add_s;
2380                            k += add_t;
2381                  }                  }
2382    
2383                  for (k = 1; k < pEnc->num_threads; k++) {                  for (k = 1; k < pEnc->num_threads; k++) {
2384                          pthread_create(&pEnc->motionData[k].handle, NULL,                          pthread_create(&pEnc->smpData[k].handle, NULL,
2385                                  (void*)SMPMotionEstimationBVOP, (void*)&pEnc->motionData[k]);                                  (void*)SMPMotionEstimationBVOP, (void*)&pEnc->smpData[k]);
2386                  }                  }
2387    
2388                  SMPMotionEstimationBVOP(&pEnc->motionData[0]);                  SMPMotionEstimationBVOP(&pEnc->smpData[0]);
2389    
2390                  for (k = 1; k < pEnc->num_threads; k++) {                  for (k = 1; k < pEnc->num_threads; k++) {
2391                          pthread_join(pEnc->motionData[k].handle, &status);                          pthread_join(pEnc->smpData[k].handle, &status);
2392                  }                  }
2393    
2394                  frame->fcode = frame->bcode = 0;                  frame->fcode = frame->bcode = 0;
2395                  for (k = 0; k < pEnc->num_threads; k++) {                  for (k = 0; k < pEnc->num_threads; k++) {
2396                          if (pEnc->motionData[k].minfcode > frame->fcode)                          if (pEnc->smpData[k].minfcode > frame->fcode)
2397                                  frame->fcode = pEnc->motionData[k].minfcode;                                  frame->fcode = pEnc->smpData[k].minfcode;
2398                          if (pEnc->motionData[k].minbcode > frame->bcode)                          if (pEnc->smpData[k].minbcode > frame->bcode)
2399                                  frame->bcode = pEnc->motionData[k].minbcode;                                  frame->bcode = pEnc->smpData[k].minbcode;
2400                  }                  }
2401          } else {          } else {
2402    
2403                  MotionEstimationBVOP(&pEnc->mbParam, frame,                  MotionEstimationBVOP(&pEnc->mbParam, frame,
2404                                                           ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */                                                           ((int32_t)(pEnc->current->stamp - frame->stamp)),                              /* time_bp */
2405                                                           ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */                                                           ((int32_t)(pEnc->current->stamp - pEnc->reference->stamp)),    /* time_pp */
# Line 2077  Line 2413 
2413          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);          set_timecodes(frame, pEnc->reference,pEnc->mbParam.fbase);
2414          BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1, frame->quant);          BitstreamWriteVopHeader(bs, &pEnc->mbParam, frame, 1, frame->quant);
2415    
2416            /* reset stats */
2417          frame->sStat.iTextBits = 0;          frame->sStat.iTextBits = 0;
2418          frame->sStat.iMVBits = 0;          frame->sStat.iMVBits = 0;
2419          frame->sStat.iMvSum = 0;          frame->sStat.iMvSum = 0;
# Line 2085  Line 2422 
2422          frame->sStat.mblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;          frame->sStat.mblks = pEnc->mbParam.mb_width * pEnc->mbParam.mb_height;
2423          frame->sStat.kblks = frame->sStat.ublks = 0;          frame->sStat.kblks = frame->sStat.ublks = 0;
2424    
2425          for (y = 0; y < pEnc->mbParam.mb_height; y++) {          /* multithreaded inter coding - dispatch threads */
2426                  for (x = 0; x < pEnc->mbParam.mb_width; x++) {          bound = 0;
2427                          MACROBLOCK * const mb = &frame->mbs[x + y * pEnc->mbParam.mb_width];          slices_per_thread = (num_slices*1024 / num_threads);
2428    
2429            for (k = 0; k < num_threads; k++) {
2430                    int add = ((slices_per_thread + 512) >> 10);
2431    
2432                    slices_per_thread += ((num_slices*1024 / num_threads) - add*1024);
2433    
2434                    pEnc->smpData[k].pEnc = (void *) pEnc;
2435                    pEnc->smpData[k].current = frame;
2436                    pEnc->smpData[k].stop_y = (((bound+add) * mb_height + (num_slices-1)) / num_slices);
2437                    pEnc->smpData[k].start_y = ((bound * mb_height + (num_slices-1)) / num_slices);
2438                    bound += add;
2439    
2440                          /* decoder ignores mb when refence block is INTER(0,0), CBP=0 */                  /* todo: sort out temp space once and for all */
2441                          if (mb->mode == MODE_NOT_CODED) {                  pEnc->smpData[k].RefQ = ((k&1) ? pEnc->vInterV.u : pEnc->vInterV.v) + 16*(k>>1)*pParam->edged_width;
2442                                  if (pEnc->mbParam.plugin_flags & XVID_REQORIGINAL) {  
2443                                          MBMotionCompensation(mb, x, y, f_ref, NULL, f_ref, NULL, NULL, &frame->image,                  if (k > 0) {
2444                                                                                          NULL, 0, 0, pEnc->mbParam.edged_width, 0, 0);                          BitstreamReset(pEnc->smpData[k].bs);
2445                            pEnc->smpData[k].sStat->iTextBits = pEnc->smpData[k].sStat->kblks =
2446                            pEnc->smpData[k].sStat->mblks = pEnc->smpData[k].sStat->ublks = pEnc->smpData[k].sStat->iMVBits = 0;
2447                                  }                                  }
                                 continue;  
2448                          }                          }
2449    
2450                          mb->quant = frame->quant;          for (k = 1; k < num_threads; k++) {
2451                    pthread_create(&pEnc->smpData[k].handle, NULL,
2452                          if (mb->cbp != 0 || pEnc->mbParam.plugin_flags & XVID_REQORIGINAL) {                          (void*)SliceCodeB, (void*)&pEnc->smpData[k]);
                                 /* we have to motion-compensate, transfer etc,  
                                         because there might be blocks to code */  
   
                                 MBMotionCompensationBVOP(&pEnc->mbParam, mb, x, y, &frame->image,  
                                                                                  f_ref, &pEnc->f_refh, &pEnc->f_refv,  
                                                                                  &pEnc->f_refhv, b_ref, &pEnc->vInterH,  
                                                                                  &pEnc->vInterV, &pEnc->vInterHV,  
                                                                                  dct_codes);  
   
                                 mb->cbp = MBTransQuantInterBVOP(&pEnc->mbParam, frame, mb, x, y,  dct_codes, qcoeff);  
2453                          }                          }
2454    
2455                          if (mb->mode == MODE_DIRECT_NO4V)          pEnc->smpData[0].bs = bs;
2456                                  mb->mode = MODE_DIRECT;          pEnc->smpData[0].sStat = &frame->sStat;
2457            SliceCodeB(&pEnc->smpData[0]);
2458    
2459                          if (mb->mode == MODE_DIRECT && (mb->cbp | mb->pmvs[3].x | mb->pmvs[3].y) == 0)          for (k = 1; k < num_threads; k++) {
2460                                  mb->mode = MODE_DIRECT_NONE_MV; /* skipped */                  pthread_join(pEnc->smpData[k].handle, &status);
                         else  
                                 if (frame->vop_flags & XVID_VOP_GREYSCALE)  
                                         /* keep only bits 5-2 -- Chroma blocks will just be skipped by MBCodingBVOP */  
                                         mb->cbp &= 0x3C;  
   
                         start_timer();  
                         MBCodingBVOP(frame, mb, qcoeff, frame->fcode, frame->bcode, bs,  
                                                  &frame->sStat);  
                         stop_coding_timer();  
                 }  
2461          }          }
         emms();  
2462    
2463          BitstreamPadAlways(bs); /* next_start_code() at the end of VideoObjectPlane() */          frame->length = BitstreamLength(bs) - (bits/8);
2464          frame->length = (BitstreamPos(bs) - bits) / 8;  
2465            /* reassemble the pieces together */
2466            SerializeBitstreams(pEnc, frame, bs, num_threads);
2467    
2468  #ifdef BFRAMES_DEC_DEBUG  #ifdef BFRAMES_DEC_DEBUG
2469          if (!first){          if (!first){

Legend:
Removed from v.1.133  
changed lines
  Added in v.1.134

No admin address has been configured
ViewVC Help
Powered by ViewVC 1.0.4