杏彩|杏耀|沐鸣|开户平台注册登录官网

    软件模拟器可以提供具有1,000个核心的芯片的“周期精确”模拟 ...

    2019-8-13 18:43| 发布者: admin| 查看: 9| 评论: 0

    在过去十年左右的时间里,计算机芯片制造商一直在通过提供额外的处理单元或“核心”来提高芯片的速度。大多数主要制造商现在都提供具有8个,10个甚至12个核心的芯片。

    但如果芯片继续以我们已经习惯的速度继续改进 - 大约每18个月加倍一次 - 它们很快就会需要数百甚至数千个核心。学术界和行业界的杏耀研究人员都充满了改善多核芯片性能的想法,但是当核心数量越来越高时,似乎可能会在24或48核心上运行良好的方法可能会带来灾难性的问题。没有芯片制造商会抓住创新芯片设计的机会,而没有压倒性的证据表明它的工作方式与广告一样。

    作为一个杏耀研究工具,一个专门计算机体系结构的小组开发了一个名为Hornet的软件模拟器,它比前人更准确地模拟多核芯片的性能。在2011年第五届片上网络国际研讨会上,该小组获得了最佳论文奖,他们使用模拟器分析了一项有前途且经过深入杏耀研究的多核计算技术,发现了其他模拟的致命缺陷。已经错过了。在即将出版的“集成电路与系统计算机辅助设计交易”中,杏耀研究人员提出了一个新版本的模拟器,它考虑了功耗,核心之间的通信模式,各个任务的处理时间以及内存访问模式。

    通过具有数百个内核的芯片的数据流是极其复杂的,并且以前的软件模拟器为了效率而牺牲了一些精度。为了进行更精确的仿真,杏耀研究人员通常使用硬件模型 - 可编程芯片,可以重新配置以模拟多核芯片的行为。根据说法,Hornet旨在补充而不是与其他两种方法竞争。“我们认为大黄蜂位于他们之间的最佳位置。

    芯片的许多组件执行的各种任务由主时钟同步; 在每个“时钟周期”期间,每个组件执行一个任务。大黄蜂的速度明显慢于其前代产品,但它可以为具有1,000个内核的芯片提供“周期精确”仿真。“'周期精确'意味着结果精确到一个周期的水平,”Cho解释道。“例如,[大黄蜂]有能力说'这项任务需要1,223,392个周期才能完成。'”

    现有的模拟器擅长评估芯片的一般性能,但它们可能会错过仅在罕见的病态情况下出现的问题。大黄蜂更有可能把它们揪出来,正如在网络芯片研讨会上展示的那样。在那里,Cho,他的顾问和EECS教授及其同事分析了一种有前途的多核计算技术,其中芯片将计算任务传递给存储相关数据的核心,而不是将数据传递到执行相关任务的核心。大黄蜂发现了一个称为死锁的问题的风险,其他模拟器已经错过了。(死锁是指一些内核正在等待资源 - 通信通道或内存位置 - 正在被其他内核使用的情况。

    除了识别死锁的风险之外,杏耀研究人员还提出了一种避免僵局的方法 - 并证明他们的提议与另一个大黄蜂模拟一起工作。这说明了Hornet相对于硬件系统的优势:可以轻松地重新配置以测试替代设计方案。

    康奈尔大学电气和计算机工程助理教授爱德华·苏表示,构建将在硬件上运行的模拟“比编写软件更棘手”,他的团队使用早期版本的Hornet来模拟核心之间的通信。“很难说它本身是否更难编写,但至少现在,基础设施较少,学生不懂这些语言,也不懂常规编程语言。因此,就目前来说,它还有更多的工作。“在”你想快速测试好几个想法,准确度很高的情况下“可能会有优势。

    然而,Suh指出,因为大黄蜂比硬件模拟或不太精确的软件模拟慢,“你倾向于模拟应用程序的短时间而不是试图运行整个应用程序。”但是,他补充说,“那是如果你想知道是否存在一些异常行为,那肯定是有用的。“此外,”人们使用的技术,如统计抽样,或者类似的东西,比如,'这些是应用程序的代表性部分。

    杏彩|杏耀|沐鸣|开户平台注册登录官网

    GMT+8, 2019-8-19 06:21 , Processed in 0.041407 second(s), 14 queries .

    Powered by Discuz! X3.4

    © 2001-2013 Comsenz Inc.