365外围靠谱么 开元棋牌辅助下载 365bet官网世界杯足球 手机开元棋牌app 365bet开户地址 365体育投注足球平台 开元棋牌技巧 bet365盘口 最新365体育投注官网 万狗比分网 开开元棋牌在线游戏 bet 365--体育投注 356bet体育盘口 sunbe365滚球t开户 狗万取现免手续费 365bet官网 提现多久到账 best365官网app 365bet官网 世杯投注 玖玖棋牌官网365 狗万没结算 狗万派彩 bet365真人手机投注 365体育投注-皇恩靠谱 狗万下载安装 365棋牌用户不记得可以找回来吗 365bet怎么充值 能提现的365棋牌游戏 365bet平台赌场 bt365提款 万博体育app世界杯版手机 大庆棋牌博弈365 bt365亚洲 365bet官网官网手机版 365足球外围网站下载 365体育投注线上棋牌 manbetx 万博app 开元棋牌有包赢的吗 开元棋牌会作弊吗 365bet体育平台 365体育投注投注在线 365棋牌微信群 如何辨别365体育真假 狗万发展集团 狗万是哪里有卖 356bet官网 世杯投注365 tv 356bet能看动画 cc国际和CC在线 365bet足球注册 365棋牌举报银商 bt365指数

2017年01月07日作品选用记录

2019-08-17 19:34 来源:黄河 新闻网

  2017年01月07日作品选用记录

    中国开放的大门会越开越大;抗癌药品争取降到零税率;全面放开制造业,在这方面不允许强制转让技术;避免多个大盖帽去管一个小商贩;给所有合法产权所有者都吃上长效的定心丸;决不允许有零就业家庭出现;不能让一个人患大病,全家都倒下,总理的这些回答尤其给公众留下深刻印象。购买和分享课程,其初衷究竟是分享知识,还是类似传销?有律师表示,实际上这种多级分销的方式已经符合法律上对于传销的构成要件,会对市场竞争造成不公平的影响。

之后9年,他在俄罗斯推行全盘西化和私有化经济改革,结果带来的不是他所许诺的人民资本主义的幸福天堂,而是野蛮资本主义寡头资本主义,俄罗斯社会深陷泥潭。  小王在暑假前夕与北京某教育咨询公司签订了一份《美国常青藤名校访问项目协议书》,约定该公司组织小王等一批学生参观白宫、国会大厦,同时参加教授课程、职场交流会等活动,活动时间10天,总费用33500元。

  一只鸡从农场到餐桌,如何才能保证全链条的透明?众安科技利用区块链建立了养鸡的溯源体系,将位于安徽的养鸡场各项数据保存在区块链上,除了作为食品安全信息提供给全国消费者之外,这些数据还将帮助农户获得银行贷款和农业保险。  "踹门一脚"利器更要成为坚强战士  歼-20,由中国自主研制的新一代隐身战斗机,那么未来如何在战场上发挥顶尖装备的作用呢?有网友称歼-20可以凭借隐身的能力摧毁地方的雷达,踹开敌人防御的大门。

  眼看高考的日子越来越近,最近的一次复查却让她的高考梦蒙上一层阴影。同年9月4日,旅法侨界组织了声势浩大的反暴力、要安全大游行,数万民众参与其中,写下旅法华侨华人维权史上不可磨灭的一章。

  艾利森教授研究了过去几个世纪一些类似案例后得出结论:在历史上,许多这样的情况都以战争告终。

  他说,对于质押比例接近50%的项目,即使做也会要求客户设置强担保措施,并签署授权处置条款。

  "此外,特斯拉还在电池组内部安装了防火墙,可以减缓火势在模块之间蔓延。  随着老干妈在美国各大监狱里面越来越受欢迎,随之而来的副作用也让不少老伙计们头疼不已。

    高莉说,积极创造条件让更多新经济企业在中国境内市场上市,是证监会贯彻党中央、国务院决策部署的具体措施。

    然而,没有老干妈和马应龙,你将在监狱里寸步难行。不到3年时间,戈尔巴乔夫不仅没能革新苏共,给苏联人民带来民主、人权和自由幸福,反而彻底搞垮了苏共和苏联,输掉了冷战,成就了西方资本主义的世界霸权。

  于是,美国便抛开契约精神和国际法原则,意图反悔甚至完全无视自己主导制定并承诺遵守的国际规则。

  根本性变化在于,随着券商、银行、信托等金融机构纷纷开始收缩质押业务规模,股权质押市场的蛋糕重新分配民间资本大规模进场。

    卡门丽奇  他们帮派认识中国线人,垄断了几乎整个东区的干妈交易,噢,天呐,这已经是这个月第十场战斗了,老哥,不说了,我先去了。我们要出台让民进党当局难以承受的更多主动措施,来抵消美台官员互访升级的负面后果。

  

  2017年01月07日作品选用记录

 
责编:
全球人工智能与机器人峰会 CCF-GAIR 2019
您正在使用IE低版浏览器,为了您的雷锋网账号安全和更好的产品体验,强烈建议使用更快更安全的浏览器
雷锋网
人工智能 正文
发私信给程弢
发送

0

2017年01月07日作品选用记录

本文作者:程弢 2019-08-17 14:03
导语:从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。
  欧拜赫维利耶华人市议员田玲3月15日告诉记者,今年1月底至3月14日,欧市华人商圈及附近居住区共有14起针对亚裔的偷盗和暴力抢劫案件统计在册,相关案件和数据发给省府和警方,当日迅即收到回复,警方介绍了当前的治安状况,并承诺将严打犯罪。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

在谷歌发布TPU一年后,这款机器学习定制芯片的神秘面纱终于被揭开了。

昨日,谷歌资深硬件工程师Norman Jouppi刊文表示,谷歌的专用机器学习芯片TPU处理速度要比GPU和CPU快15-30倍(和TPU对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

从这次发布的测试结果来看,TPU似乎已经超出了业界的预期,但是藏在这一芯片背后的内部架构究竟有什么秘密呢,我们从Jouppi此前发布的论文当中,可以找到答案。

据雷锋网了解,早在四年前,谷歌内部就开始使用消耗大量计算资源的深度学习模型,这对CPU、GPU组合而言是一个巨大的挑战,谷歌深知如果基于现有硬件,他们将不得不将数据中心数量翻一番来支持这些复杂的计算任务。

所以谷歌开始研发一种新的架构,Jouppi称之为“下一个平台”。Jouppi曾是MIPS处理器的首席架构师之一,他开创了内存系统中的新技术。三年前他加入谷歌的时候,公司上下正在用CPU、GPU混合架构上来进行深度学习的训练。

Jouppi表示,谷歌的硬件工程团队在转向定制ASIC之前,早期还曾用FPGA来解决廉价、高效和高性能推理的问题。但他指出,FPGA的性能和每瓦性能相比ASIC都有很大的差距。他解释说,“TPU可以像CPU或GPU一样可编程,它可以在不同的网络(卷积神经网络,LSTM模型和大规模完全连接的模型)上执行CISC指令,而不是为某个专用的神经网络模型设计的。一言以蔽之,TPU兼具了CPU和ASIC的有点,它不仅是可编程的,而且比CPU、GPU和FPGA拥有更高的效率和更低的能耗。

TPU的内部架构

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

该图显示了TPU上的内部结构,除了外挂的DDR3内存,左侧是主机界面。指令从主机发送到队列中(没有循环)。这些激活控制逻辑可以根据指令多次运行相同的指令。

TPU并非一款复杂的硬件,它看起来像是雷达应用的信号处理引擎,而不是标准的X86衍生架构。Jouppi说,尽管它有众多的矩阵乘法单元,但是它GPU更精于浮点单元的协处理。另外,需要注意的是,TPU没有任何存储的程序,它可以直接从主机发送指令。

TPU上的DRAM作为一个单元并行运行,因为需要获取更多的权重以馈送到矩阵乘法单元(算下来,吞吐量达到了64,000)。Jouppi并没有提到是他们是如何缩放(systolic)数据流的,但他表示,使用主机软件加速器都将成为瓶颈。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

256×256阵列缩放数据流引擎,经过矩阵乘法积累后实现非线性输出

从第二张图片可以看出,TPU有两个内存单元,以及一个用于模型中参数的外部DDR3 DRAM。参数进来后,可从顶部加载到矩阵乘法单元中。同时,可以从左边加载激活(或从“神经元”输出)。那些以收缩的方式进入矩阵单元以产生矩阵乘法,它可以在每个周期中进行64,000次累加。

毋庸置疑,谷歌可能使用了一些新的技巧和技术来加快TPU的性能和效率。例如,使用高带宽内存或混合3D内存。然而,谷歌的问题在于保持分布式硬件的一致性。

TPU对比Haswell处理器

在和英特尔“Haswell”Xeon E5 v3处理器来的对比中,我们可以看到,TPU各方面的表现都要强于前者。

在Google的测试中,使用64位浮点数学运算器的18核心运行在2.3 GHz的Haswell Xeon E5-2699 v3处理器能够处理每秒1.3 TOPS的运算,并提供51GB/秒的内存带宽;Haswell芯片功耗为145瓦,其系统(拥有256 GB内存)满载时消耗455瓦特。

相比之下,TPU使用8位整数数学运算器,拥有256GB的主机内存以及32GB的内存,能够实现34GB/秒的内存带宽,处理速度高达92 TOPS ,这比Haswell提升了71倍,此外,TPU服务器的热功率只有384瓦。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

除此之外,谷歌还测试了CPU、GPU和TPU处理不同批量大小的每秒推断的吞吐量。

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?

如上图所示,在小批量任务中(16),Haswell CPU的响应时间接近7毫秒,其每秒提供5482次推断(IPS),其可以实现的最大批量任务(64)每秒则可以完成13194次推断,但其响应时间为21.3毫秒。相比之下,TPU可以做到批量大小为200,而响应时间低于7毫秒,并提供225000个IPS运行推理基准,是其峰值性能的80%,当批量大小为250,响应时间为10毫秒。

不过需要注意的是,谷歌所测试的Haswell Xeon处理器似乎也不能完全说明问题,英特尔Broadwell Xeon E5 v4处理器和最新的“Skylake”Xeon E5,每核心时钟(IPC)的指令比这款处理器提升了约5%。在Skylake是28核,而Haswell为18核,所以Xeon的总体吞吐量可能会上升80%。当然,这样的提升与TPU相比仍有差距。

最后雷锋网(公众号:雷锋网)需要强调的是,TPU是一个推理芯片,它并非是要取代GPU,可以确定的是,TPU与CPU一起使用对训练分析更加有益。但对于CPU制造商而言,如何研发出像ASIC一样兼顾性能和能效的芯片是现在以及未来要做的。

可以确定的是,谷歌已经逐渐在自己的数据中心部署TPU,但是上述测试数据只是理论结果,实际应用表现如何?我们还不得而知。

Via nextplatform,雷锋网编译

雷锋网版权文章,未经授权禁止转载。详情见转载须知

谷歌硬件工程师揭秘,TPU为何会比CPU、GPU快30倍?
分享:
相关文章

文章点评:

表情

略懂技术的小编

关注一切有未来感的产品及技术!
当月热门文章
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为了您的账户安全,请验证邮箱
您的邮箱还未验证,完成可获20积分哟!
请验证您的邮箱
立即验证
完善账号信息
您的账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说
bet365-777体育在线 365bet官网在线娱乐城 365体育投注现在的网址是多少 狗万电话 365 棋牌客服 365棋牌网址是多少钱 365bet官网手机投注 365bet官网进不去 365棋牌一次能赢多少 万博app2.0 - 百度 365bet是哪的网站 能兑现的开元棋牌 365体育投注体育投注平台 365体育投注 .co 365bet官网亚洲真人
bet.365体育 英国365体育投注官网 国际cc网投平台代理 狗万 赞助商 365bet娱乐场 银行不能转账365体育投注 365棋牌唯一官网 皇冠开元棋牌吧 365bet官网怎么翻墙 365的高频体育 真人365体育 356bet的安全代码是什么 356bet中文 哪里可以下载BET365体育投注 体育彩票365充值 365棋牌可以短信充值吗 狗万取现额度 bet356 怎么样 365体育投注 365体育 平台 狗万取款审核被拒 365体育投注预测
365体育没返水 开元棋牌登陆 狗万垮了 狗万提现安心 赌球外围365 棋牌365棋牌商家 赌博365体育投注 356bet 足球比分视频 365棋牌苹果手机安装 bet365体育线上 356bet官网中国官网 谁有开元棋牌的辅助 365体育馆 狗万假不假 国内不能登365bet官网吗 cc国际彩球骗局 狗万提款很快么 狗万提款是怎么提 cc彩球网会员登录网址国际 bet365足球即时比分网 365体育投注外围投注网
早点加盟连锁 加盟包子 早点加盟好项目 流动早餐加盟 北方早餐加盟
早点加盟好项目 河北早餐加盟 早餐加盟开店 春光早点加盟 北京早点加盟
早餐包子加盟 美味早餐加盟 天津早点加盟 早点小吃加盟排行榜 早点小吃加盟网
油条早餐加盟 爱心早餐加盟 早点快餐加盟 安徽早点加盟 学生早餐加盟