全国服务热线:0898-08980898
当前位置: 首页 > 新闻动态新闻动态

zoty中欧体育|英特尔陈玉荣:全面解析英特尔人工智能计算平台|CCF-GAIR2018

发布时间:2024-09-21 03:52:45点击量:353
本文摘要:和结果共享。

和结果共享。虚线部分是计算出来密集型的模型训练部分,它十分最重要,但是它只占到了深度自学开发周期的较小一部分,约30%左右。另外,大家可以看见深度自学的研发也只是整个解决方案研发的一小部分,很最重要的是说道你怎么样用于IT的支出更慢的部署人工智能解决方案,而不是花上额外的钱来加快整体解决方案的一小部分。还是用缺失检测这个例子,我们来想到一个确实的端对端深度自学解决方案是如何部署的。

左边是案例的功能布局图,它用10个摄像头来对生产设备展开监控,以检测缺失。最先要做到的事情是人类的专家对有缺陷的图片展开标示,产生相当大的数据集,这样就可以用来训练一个神经网络模型。训练好的模型被存储和部署在系统上,来对后继的视频展开推测。

找到缺失时,不会把推测结果发送到服务层和解决方案层。推测结果可以作为决策的依据,我们就可以采行一些行动,比如调用技术人员或者重开生产线。从右边的数据中心设计图中,你可以看见里面有很多种硬件。

这里想要说道的是,深度自学的部署是多方面的,深度自学的训练也只是其中较小一部分,更加最重要的是解读整个解决方案是怎么运作的,以及怎么样无缝的构建到更大的数据分析的流程里面去。我很赞成很多学者的众说纷纭,我们正处于人工智能计算出来时代的早期,或者说是黎明时期。英特尔不仅致力于为人工智能发展铺平道路,而且在引导这一新兴领域方面也正处于最不利的方位。

我们通过获取业界最全面的计算出来平台,协助用户取得更加智能的结果,而所有这一切都是由用户的市场需求和细分市场的市场需求来驱动的。用于人工智能第一步是要准备好数据,我们和我们的很多合作伙伴获取很多种解决方案来存储、处置和管理数据。作为全球领先的计算出来硬件厂商,我们的硬件反对从混合型到专用型,从云端到终端的最普遍的AI应用于阻抗。除了硬件,软件也是十分最重要的。

刚才魏老师(魏少军)也说道了,人工智能在某种程度上是软件比硬件更加最重要。我们保证所有的英特尔硬件引擎具备标准化的AI体验,具备仅次于的一致性、互操作性和安全性。我们获取多种软件工具人组来协助加快AI解决方案的开发周期。

除了硬件和软件工具外,我们还采行基于社区和解决方案驱动的方法,以扩展AI和非常丰富每个人的生活。我们和我们的合作伙伴一起获取多种行业现成的解决方案,还包括金融、身体健康、零售、工业、政府、能源等等。面向未来,我们通过领先的研发和投资,还包括资助顶尖的学术研究,内部研发和对领先创新者的投资,以及更进一步推展政策和道德领导力来之后推展人工智能的发展。

在工具方面,英特尔投资于电子货币的AI软件工具,来协助大家用好英特尔的每一种硬件,修改研发过程,最后延长整体解决方案的研发时间。对于应用于开发者,我们获取了很多工具来提高性能和协助加快解决方案的部署。

针对深度自学,开源的OpenVINO和英特尔Movidius SDK 可以通过模型的切换和优化,获取针对英特尔各个目标硬件优化的深度自学推测部署。我们也正在研发英特尔深度自学Studio,需要协助延长端对端深度自学解决方案的开发周期(还包括训练)。

除了深度自学,英特尔Saffron AI还需要获取理解推理小说的解决方案,可以用作反洗钱和预测性确保的应用于。对于数据科学家,我们致力于优化一系列普遍用作机器和深度自学的开源库。

目前早已有一些机器学习库可以充分利用英特尔硬件,还包括Python 、R、分布式的一些库。我们还对常用的深度自学框架必要做到优化,保证所有主要的深度自学框架和流形需要在英特尔硬件上运营较好。目前已完成CPU优化的框架还包括Tensor flow 、MXNet、Caffe等,未来期望需要通过英特尔nGraph编译器构建更好的框架。对于库开发者,我们获取了很多基础建构模块,需要充分利用英特尔的硬件。

其中还包括针对机器学习优化的英特尔Python发给版以及包括机器学习的英特尔数据分析和加快库DAAL,还有针对英特尔CPU和集成显卡优化的DNN基础函数库MKL-DNN和clDNN,这两个库对于深度自学的模型研发是最涉及的。刚才我提及英特尔nGraph编译器,这个编译器可以协助我们从有所不同框架里面提供计算出来图并切换为一个中间回应,这个中间回应可以调用英特尔针对特定硬件的计算出来加快软件来继续执行。这样,开发者就可以不必须用于底层软件和数学加快库对每个目标硬件展开深度自学框架和模型的必要优化。

英特尔硬件方面,除了深度自学以外的其它人工智能应用于,比如刚说道的数据分析、机器学习还有推理小说等,就可以用于至强劲或者其它的CPU做到,因为这些计算出来阻抗并不像深度自学那样具备低计算出来强度和低并行度的特点。针对深度自学,英特尔获取了一个普遍的产品组合来符合有所不同客户的独有市场需求。

对于训练,目前可以用于至强劲或基于至强劲的集群做到训练。如果必须加快也可以考虑到用加速器,明年英特尔不会有专门针对深度自学训练的英特尔Nervana神经网络处理器。

对于推测,目前在数据中心和工作站,实质上至强劲处理器还是当今市场的标配(更加多还是用至强劲处理器)。如果必须做到高强度的推测,也可以考虑到用加速器,英特尔有很多加速器可供大家自由选择。下面讲解一下英特尔的深度自学推测加速器。

大家告诉数据中心、边缘计算出来和终端设备,对于深度自学推测的性能、功耗和成本拒绝,实质上是有相当大区别的。英特尔FPGA可以在数据中心和边缘计算出来设备上对深度自学的推测展开自定义和较慢原型设计。英特尔Movidius VPU是低功耗计算机视觉和深度推测的解决方案。

在边缘计算出来方面,可以通过用于多个Movidius VPU,构建高强度、高效的媒体和视觉推测。在终端,Movidius VPU在超强低能耗下可以获取出色的推测吞吐量,可以用作物联网传感器、个人计算机和其他终端产品中展开视觉处置和推测。英特尔Mobileye EyeQ技术是自动驾驶的推测平台,同时也可以作为一个原始的自动驾驶解决方案获取给客户。

英特尔GNA,混合高斯模型和神经网络加速器IP是一个超强低功耗的语音和音频推测解决方案,它可以被设计构建到很多智能音响、移动设备、智能汽车方向盘或者PC芯片里面。最后是英特尔集成显卡,大家很更容易忽视,实质上它内置深度自学推测加快的能力。下面讲讲英特尔Movidius VPU和集成显卡。去年公布的Myriad X是英特尔Movidius近期一代的VPU,它是一款低功耗的SoC,可以用在低能效图象处理、计算机视觉和深度自学的设备里面,还包括服务机器人、监控摄像头、可穿着设备、无人机、AR-VR头盔和智能家居设备等。

比起上一代产品Myriad 2,Myriad X多了一个神经计算引擎(Neural Compute Engine),这是一个构建在芯片上的DNN加速器。有了这个加速器,深度自学推测吞吐量可以超过1TOPS,也就是每秒多达1万亿次运算,理论峰值可以超过4TOPS。

英特尔Movidius VPU的微小尺寸和良好的每瓦特计算出来性能很大的符合了广大用户对计算机视觉和深度自学在终端设备上的市场需求。因应Movidius VPU,我们公布了Movidius的软件开发包在,它是一个面向视频处理单元的综合软件开发套件。

它用于内置的有向图框架减少原型系统研发时间和复杂性,可以用于它展开较慢原型研发。它也包括很多库,比如计算机视觉和图像信号处理以及一些线性代数库。

这样可以用于C/C++编程来达到最佳的性能,同时它也反对用于非常丰富的工具套件来展开图形化研发。英特尔Movidius技术早已被广泛应用在很多智能设备里面,还包括海康威视智能摄像头、大疆无人机、宇视IP摄像头、摩托罗拉360度照相机、大华工业照相机、谷歌AIY视觉套件和Clips智能照相机等。英特尔集成显卡获取内置的深度自学推测加快能力,只是大家用得较为较少。实质上英特尔集成显卡不存在于很多英特尔SoCs中,还包括英特尔凌动处理器、英特尔酷睿处理器和英特尔至强劲E3处理器等。

英特尔集成显卡具备领先的媒体性能,包括较慢视频实时技术,用于相同功能媒体处置模块来降低功耗、提高性能,可以较慢、便利处置媒体以及创立和切换视频。另外就是英特尔Media SDK,它获取采访硬件加速的编解码器的API,这是大家用得较为多的。

此外,英特尔集成显卡还反对非常丰富的数据类型和SIMD乘相加指令。同时CPU和GPU之间使用片上共享内存架构,可以减少延后和功耗。

现在大家用于英特尔clDNN,就可以很便利的构建英特尔集成显卡上的深度神经网络计算出来。clDNN是英特尔集成显卡上的深度自学加快中间件,上个月我们刚在GitHub上开源,大家通过网页可以理解更加多信息。

另外,clDNN是英特尔深度自学部署工具包和英特尔OpenVINO工具包的组成部分。OpenVINO也是一个新的开源软件工具包在,上个月刚公布,用作协助在英特尔平台上提升计算机视觉解决方案的性能,同时减少解决方案研发时间。

OpenVINO包括英特尔深度自学部署工具包,还包括模型优化器和推测引擎,模型优化器可以将Tensorflow、Caffe等框架的推测模型切换为中间回应,这个中间回应通过推测引擎自带的用作英特尔CPU、GPU、VPU和FPGA的插件,就可以反对跨平台的深度自学推测部署和加快。OpenVINO还包括很多针对英特尔平台优化的传统的计算机视觉工具和函数库,还包括针对英特尔CPU和GPU优化的OpenCV、OpenVX和英特尔自己的摄影视觉函数库,以及针对英特尔集成显卡优化的Media SDK和OpenCL驱动程序和运营时,还有针对英特尔FPGA优化的运营时环境和比特流,所有这些都是为了便利大家更加慢更佳的研发计算机视觉应用于,而不必须关心更加多底层优化的部分。

下面主要讲解我们自己涉及的深度自学加快的研究工作。大家告诉,网络模型传输是深度自学推测加快的一个主要方式,这方面我们做到了很好的研究工作,我们明确提出了一个领先的较低精度深度传输解决方案,这个解决方案可以将DNN模型的权值和转录值都切换为较低精度的二进制回应,并构建百倍级无损压缩。这为深度自学的高效推测引擎在硬件和软件构建上铺平道路。这个技术本身包括三个模块:优化DNN结构的动态网络手术技术DNS,用来减少DNN权值精度的趋向网络分析技术INQ,还有减少DNN转录值精度的多尺度编码分析技术MLQ,这三项工作都在顶级的机器学习和人工智能会议上公开发表。

它们可以确保模型的预测准确率不减少的情况下构建DNN模型的传输。以AlexNet为事例,使用较低精度深度传输解决方案,我们首次构建了相似可用的、压缩比超过100倍以上的二进制DNN模型。

由于传输模型的权值和转录值都是二进制回应,从而使所有的乘法操作者都可以变为非常简单的移位操作者。用于自定义硬件就可以构建数十倍甚至上百倍的加快。我们的传输技术和英特尔低功耗硬件结合,就可以为雾计算出来、边缘计算出来获取深度自学推测的硬件加速能力。

使用FPGA友好关系的DNN设计,并融合较低精度深度传输解决方案可以充分利用FPGA的逻辑计算出来单元,在边缘计算出来或者雾计算出来的场景里面来提升DNN计算出来的速度,降低功耗和延后,提升吞吐量。另外,刚才早已提及,英特尔Movidius VPU本身早已不具备一个DNN计算出来加速器,融合我们的较低精度传输技术,将来就可以获取对较低精度DNN计算出来的反对,从而在边缘设备上更进一步提高DNN计算出来的速度和吞吐量。当然,我们也不只仅限于设计专用神经网络处理器,英特尔研究院正在展开一系列智能万物的变革性研究,还包括先进设备算法、神经拟态计算出来、自律系统和量子计算出来等。今年CES展上我们公布了神经拟态研究芯片Loihi以及具备49量子位的超导量子测试芯片Tangle-Lake。

这两项研究有可能协助各个行业、科研机构以及全社会解决目前后遗症着传统计算机的问题。我们的前瞻性研究正在急剧前进,期望需要为人工智能的未来发展以及反对未来新型计算出来作好打算。

最后,我期望用“闻未来 创未来”完结我的演说。英特尔不改为初心,一直坚决合作和创意,我们期望需要和学术界、产业界一起通过合作和创意,来联合建构人工智能的美好未来。谢谢大家!涉及文章:英特尔AI事业部三位负责人介绍:AI技术如何落地应用于英特尔戴金权:编撰全新大数据分析+AI平台Analytics Zoo | CCF-GAIR 2018公布新一代NNP芯片外,英特尔AI软件和应用于更加透漏其AI野心原创文章,予以许可禁令刊登。下文闻刊登须知。


本文关键词:中欧体育,中欧体育(zoty),zoty中欧体育

本文来源:中欧体育-www.dcqxxx.com

地址:河南省南阳市卧龙区展展大楼14号  电话:0898-08980898  手机:17752788332
Copyright © 2000-2024 www.dcqxxx.com. 中欧体育科技 版权所有  ICP备案编号:ICP备45101733号-4