分享

C2采用1个CPU+3个DSP架构实现网络化多媒体平

 共同成长888 2015-09-25

  如何搭建一种架构,能够高效地处理各种多媒体数据,并且专门针对音频、视频进行优化?


  产品定义与芯片选型——搭建基于网络的多媒体平台,但排除ASIC、X86和通用DSP编程方式

  网络向我们提供日益丰富的内容(包括:文本、图像、视频和音频),这些内容的表现形式多种多样,仅视频和音频就有几十种格式。传统的ASIC芯片最大缺点是缺乏灵活性和通用性,例如DVD解码芯片通常只支持MPEG-2,MPGE-4和MP3标准,如果要处理更多的格式还需要设计新的芯片,因此ASIC类的芯片不适合网络功能的消费类电子产品应用。X86架构是针对数据处理而设计,可以高效的处理32位或64位整型数字流,但视频数据流的变长数据(不是32位或64位对齐的整型数据)处理和位运算量很大,由此,X86架构不能高效地处理各种媒体应用,而且成本也不适合消费电子产品。

图1C2 Micro的DSP SoC核心架构多处理器设计能够并行运行Linux应用程序和音 视频处理算法


  像ADI的Blackfin处理器和TI的DaVinci技术(采用ARM+通用DSP架构)都采用可编程DSP SoC芯片,因为通用DSP的体系结构加入长指令,针对乘法累加等运算优化,其效率比X86提高很多。通用DSP架构针对所有数字信号处理,强调

通用性,应用范围包括医疗、勘测和音/视频。但这种架构并没有专门针对音频、视频进行优化,这导致用于音视频处理的DSP主频通常很高,价格也较贵。那么,是否有一种架构,能够处理所有数字多媒体数据,并且专门针对视频和音频进行优化?专注于通信(Communication)与消费(Consumer)融合的北京希图视鼎科技有限公司(C2 Microsytems)向我们介绍了一种低成本、高性能的可编程平台CC1100,它可满足“网络化娱乐”的要求。该平台从形态上讲是DSP类型的可编程SoC,它是一个完整的编解码器,完全软件可编程性使它适合处理一切音、视频数据。目前C2自己开发了基于CC1100平台的MPEG-2、MPEG-4、H.264、Real Media、Flash和AAC、MP3、AC-3等的编解码算法。

  结构特点:1个CPU作主控,3个DSP分别为三类关键运算优化

  CC1100平台(见图1)采用C2公司自主设计的1个CPU+3个DSP架构,其中CPU是精简指令集计算机(RSIC)CPU,3个DSP分别针对三类计算进行优化。这三类计算分别是:1,运动估计,这是视频处理中最耗费时间的一类计算,块匹配和运动向量搜索都有专有的指令做运算加速;2,熵编码,这也是图像处理中使用频率很高的计算;3,向量处理,图像是二维数据,对于8×8的图像块,一行像素或者一列像素都视作一个向量进行处理,向量之间的运算在图像处理中也非常常用,另外,这部分也可以兼作音频数据的处理。除了CPU本身固化的加减乘除等指令外,C2公司将上述三类运算量最大的计算抽出来固化为指令库,通过CPU调用这些指令库中的指令,可大大提高运算效率。

  需要特别指出的是,在音频数据处理方面一般采用24位整数DSP处理(例如Blackfin),而CC1100平台集成了256位的向量处理器,支持浮点处理,可以支持7.1声道解码和添加复杂的音效处理。该平台架构对视频流码率并不敏感:已验证过15Mbps MPEG-2码流和8Mbps MPEG-4码流。CC1100单芯片支持网络接口和USB,SATA等存储接口,适用于公共场所网络监控设备、流媒体电视、时移电视、硬盘媒体播放机、IPTV等数字家庭娱乐设备以及个人娱乐(例如PMP)和汽车娱乐。关于CC1100是否能应用到手机上,C2公司总裁兼执行官刘锦湘指出,虽然手机也可以处理多媒体的需求,但手机和数字家庭娱乐设备对芯片的规格要求还是有差异的,比如手机芯片多集成基带处理器,功耗要求更低。手机应用不是CC1100的设计目标市场。C2的下一代平台CC1200将采用90nm设计,能够支持所有视频格式的高清解码,并且能够支持WinCE和Linux双系统,可以应用在更广泛的行业市场。CC1100芯片目前采用0.15mm工艺设计,在台积电(TSMC)制造流片。

  经验借鉴:找准软件和硬件实现的结合点

  CC1100平台最大的特点是实现了一种全新的处理架构,很好地平衡了硬件加速和软件可编程的灵活性。芯片运行在350MHz,视频编解码的性能可以超过700MHz的通用DSP SoC。软件可编程性的优点是使产品保持高度的灵活性、可重用和新产品面世时间短。硬件实现的优点是高性能、低功耗和小尺寸,其中的关键在于采用何种层次的实现,从而达到性能和灵活度的最佳结合。C2公司市场经理刘明璋分析了下一代平台的发展方向:除了降低功耗之外,CC1200平台一个主要的改进是增加一颗ARM CPU,以支持Window CE操作系统,这样原有CPU的处理负担可以减轻很多;另外,CC1200采用90nm工艺制造,而且适于处理高清1080p分辨率的视频应用。 

  附文:C2 Micro的DSP SoC核心架构(见图1),多处理器设计,能够并行运行Linux应用程序和音、视

频处理算法。其中:ME Engine是一个可编程子处理器,其体系架构可以高效率地执行视频压缩运算中的块搜索和运动补偿算法;Entropy Engine也是完全可编程的变长位运算处理器,其架构可以高效地解析处理MPEG-2, MPEG-4, H.264, VC-1和JPEG等位串码流数据中的语法元素,它还可以高效地运行CABAC/CAVLC等熵编码的压缩和解压缩算法;Vector子处理器支持专为音、视频处理而优化SIMD指令集,它内置64个256位的超宽向量寄存器,支持整点和浮点运算;RISC主处理器是一个超级标量处理器,支持硬件双线程技术,一个指令周期最多运行4条指令,可以运行Linux操作系统;片内集成指令和数据cache;HUBS/DMA控制器可以在子处理器和DDR内存之间建立高速数据交换的直接通道,不需要主处理器的干预和占用其它系统资源。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多