分享

旷视Brain ,华为ModelArts,海康AI平台,殊途同归

 乐纳己 2020-03-09

未来AI的竞争,只有少数企业能够参与“基础部分”,主要有四个派系,百度代表的BATJ,海康代表传统安防、华为代表ICT、商汤旷视代表AI新生代。

AI的竞争,变成大企业间的竞争之后,小企业可“坐享其成”,分享大企业生态下的各种算法和计算资源,大企业则进行生态级别的角逐。

AI算法成本巨大,即便是对相对成熟的 AI 企业来说,算法的生产过程也是一套庞大的系统工程,人力和算力的投入都是巨大的。而一旦大企业投入完成,中小企业可以借助进行自己的“AI算法及产品生产”。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

好在百度、海康、华为、旷视等都基于自身实力,进行了平台开放或算法框架开源。海康的AI开放平台,可以让用户利用少量图片,基于海康的硬件,快速进行个性化算法的部署;华为的ModelArts,让零AI基础的业务开发者可快速完成模型的训练和部署,无需任何代码开发,自动生成满足用户精度要求的模型。而最近旷视发布的Brain++战略,则是更深层次,相当于AI操作系统层面的开放,让研发人员获得了从数据到算法产业化的一揽子技术能力。

以“烹饪”为例看AI算法生产过程

如果把算法比喻成烹饪:一个餐馆核心价值是为客人提供美味的菜品呈现(就像 AI 产业的核心价值是提供专业可靠的 AI 方案输出),那么实现这个价值最重要的人则是大厨(开发者)。小作坊(中小企业)里的厨师需要自己洗菜择菜(数据清洗)、配菜(搭模型)、炒菜(训模型)、调火候和口味(调参数),一天他也许只能为三桌客人(几个客户)提供菜品。而在现代化、自动化中央厨房(大型AI企业)里工作的大厨,他将拥有标准化、流水线管理的配菜间和智能化的炉灶等套件工具,那么或许他一个人就可以搞定整个饭店甚至更多菜品供应。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

海康的AI开放平台,相当于对于在海康购买锅碗瓢盆炊具硬件(摄像机及录像机)的用户,免费提供大厨指导和菜谱(算法框架)和开放厨房炊具电力燃气基础(芯片算力),用户自己携带食材(数据及标注),用户自己烹饪,自己调火候和口味(算法及模型优化),直到炒出优质可口的美味(个性定制算法)。整个过程,用户只携带食材,不需建立自己的厨房,便得到了想要的菜肴(算法);而海康,提供了大厨(算法框架)指引和厨房(计算资源),得到了用户的菜谱(个性算法)及硬件销售机会。这就是海康AI开放平台的“共赢生态”大概意思。

华为云一站式AI开发平台ModelArts是面向开发者的一站式AI开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。ModelArts的优势是可以帮助用户简化洗菜和配菜工作(洗菜配菜是很多饭店没有技术含量但不得不占用很多资源的工作),可以协助提供菜谱,可以协助进行菜谱的个性化调优,可以提供厨房基础,可以协助用户的菜肴再分销出去。

旷视的Brain++覆盖从数据的生成、清洗、预处理、标注和存储,到算法架构设计、实验环节设计、训练环境搭建,再到训练、加速、调参、模型效果评估和产生模型,以及模型分发和部署应用的全流程。可以说,Brain++的特点是开发了自有的算法架构,不仅对外提供厨房和现成菜谱,还将自主菜谱体系开源。

海康AI Cloud开放平台介绍

近年来包括BAT等企业在内,都在主推“开放平台”,开放平台本身是主打的合作共赢的模式,对提出者的要求是“有实力、有影响力”。2018年10月10日,海康威视AI开放平台V1.0在萤石云正式上线。据悉,该平台提供数据采集服务、数据标注服务、模型训练服务、云边部署服务四个核心服务能力,结合海康行业应用平台和海康云眸平台,分别满足私有化和互联网场景下视频联网、AI模型管理、AI应用的需求,从而覆盖需求产生到应用落地的完整流程。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

海康AI Cloud开放平台相当于他提供神经网络算法和现成的GPU资源,你可以接口调用TA现成模型或者自己训练,免费试用或商用收费。海康无偿贡献了算法模型和算力资源,得到了更多的数据、算法反馈及用户赢家绑定等反馈。

开放的AI平台极大的提升了AI普及使用,降低了算法场景落地难度,比如带口罩识别、安全帽识别、超市货品清点、三分钟人脸识别签到系统,三分钟车型识别,菜品识别等等,这些小众又有价值的AI应用,用户借助AI平台三五分钟就能做出一个非常实用的AI系统,在过去想都不敢想,现在很容易实现。

AI开放平台服务流程:

数据准备: 通过摄像机采集符合模型训练要求的场景图片素材,起步要求100张。

数据标注: 对于图片分类任务,为图片素材创建分类和绘制感兴趣区域;对于物体检测任务,通过标注工具对图片中的目标物体进行框选和标记。

模型训练: 创建训练任务,将标注完成的图片导入训练任务,进行自动化模型训练。

模型校验: 导入用于校验的图片素材对训练生成的模型进行初步校验,校验完成后可进行模型发布。

模型部署: 可将校验完成的模型发布到萤石云,生成云端推理服务;或下载模型并通过行业应用平台/云眸部署到摄像机或“超脑”NVR中,用于边缘推理。

通过一个“戴口罩”的案例,来说明怎样通过 AI 开放平台实现特定场景的算法训练和部署。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

首先用户在AI开放平台上创建算法模型,并上传少量现场的图像,然后进行数据标定,标定过程非常简单,只需要完成物品的框选和分类选择。完成标注后,在线训练算法模型。最终用户将训练好的算法模型部署到海康的摄像机中。就这样一台具有“戴口罩检测及提醒”的智能摄像机就开发完成了。整个过程在一个小时内完成。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

海康AI开放平台的先进性:第一、基于很少数据,快速生成满足场景化的算法(背后的技术是算法模型迁移);第二、算法训练、编译、优化全部自动实现,一站式服务;第三、基于海康的硬件基础,开放了具有强大感知能力的产品(独立算法企业可以快速落地)。

华为ModelArts平台

ModelArts的'自动学习'功能,让零AI基础的业务开发者可快速完成模型的训练和部署,比如口罩识别。依据开发者提供的标注数据及选择的场景,无需任何代码开发,自动生成满足用户精度要求的模型。可支持图片分类、物体检测、预测分析、声音分类等场景。可根据最终部署环境和开发者需求的推理速度,自动调优并生成满足要求的模型。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

'一站式'是指AI开发的各个环节,包括数据处理、算法开发、模型训练、部署都可以在ModelArts上完成。ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

  • ModelArts平台之数据处理

当前做AI开发,“大头”是数据的采集和数据的处理。据说数据准备就要占掉整体开发时间的70%。数据的处理难!效率低呢!

人工智能,人工在前,智能在后。因为目前实现人工智能的主要方法是机器学习(目前火热的深度学习也是机器学习的一部分),而机器学习中目前大部分应用都是有监督的学习,即需要大量的标注样本去训练人工智能算法模型。

例如图像识别任务中,必须有大量已经标注好的图片,比如一张猫的图片,狗的图片等,你必须明确的告诉AI算法,这些图片里面是什么东西,它再从中去学习出相应的“知识”。

ModelArts在数据管理方面,会将数据进行预处理,用AI的数据去标注数据,即自动化标注和半自动化标注。ModelArts可对数据采样和筛选,预标注,缩减需要标记的数据量,降低工作量。

  • ModelArts平台之算法开发

ModelArts还有一个特色,就是面向应用开发者。对于有经验的开发者,可以在ModelArts上自行编写并导入算法代码,核心组件MoXing SDK支持丰富的模型库、优化算法和各类工具库;支持自动超参数调优;包含训练-验证-预测-模型导出的整套框架;开发者只需要编写一套代码就能自动实现单机及分布式化。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

对于编程苦手却想快速生成模型的AI初学者,ModelArts也预置了能够覆盖大部分常用应用场景的算法模型(如RestNet_50、Faster_RCNN、SegNet_VGG_16等,未来还将上线更多算法模型),所有预置模型的基于开源数据集训练,模型精度领先。只需配置数据路径/日志输出路径和Hyper Parameter自动选择设置就可以一键启动训练。

  • ModelArts平台之模型训练

在模型训练部分,ModelArts通过硬件、软件和算法协同优化来实现训练加速。尤其在深度学习模型训练方面,华为将分布式加速层抽象出来,形成一套通用框架——MoXing(“模型”的拼音,意味着一切优化都围绕模型展开)。

  • ModelArts平台之算法部署

现如今,纵观整个AI产业,不仅仅是云,还会有边和端都需要部署的场景。然而,在AI规模化落地的场景下,模型部署会非常复杂,需要写代码集成到应用系统,维护、更新。例如在智慧交通领域,更新后的模型,需要一次性同时部署到各种不同规格、不同厂商的摄像头上,这是一项非常耗时、费力的巨大工程。

对于此类场景,ModelArts可以一键推送模型到所有边缘、端的设备上,云上的部署还支持在线和批量推理,满足大并发和分布式等多种场景需求。

旷视自研人工智能算法平台Brain++

人工智能浪潮中,智能算法从研发到部署是一套庞大的系统工程,深度学习框架作为通用性的底层支持平台,可实现算法训练和模型部署的高效流程化和深度神经网络模型设计自动化。(其意义相当于操作系统和编译系统,能为算法训练、模型改进提供支持,之于人工智能技术及应用研发人员的重要性不言而喻。),不仅关乎相关产品和服务的开发,还直接影响到AI芯片指令集的设计。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

和PC拥有多个操作系统流派一样,深度学习框架在全球也有不少种类。比如早先一代曾经使用非常广泛的著名框架Caffe,这是一款加州大学伯克利分校的学生开发出来的深度学习框架。还有诞生于蒙特利尔大学 LISA 实验室的Theano。目前流行的深度学习框架包括2015年11月10日Google推出全新的机器学习开源工具TensorFlow,这款产品已经成为目前最流行的深度学习框架。2016年11月,被AWS选为云计算官方深度学习平台的MXNet。2017年1月,Facebook人工智能研究院(FAIR)团队在GitHub上开源了深度学习框架PyTorch;还有,国内百度公司推出的Paddle Paddle(飞桨)深度学习框架。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

值得注意的是,上述这几款深度学习框架都是开源的。目前国内大多AI技术的产品应用开发人员都采用的是:选择一种大厂推出的开源深度学习框架,在此基础上进行开发。当然也有例外的,不用开源框架的,自己写框架的,比如百度的Paddle。Brain++是旷视始于2014年就开始开发的深度学习框架,早期限于旷视内部使用。在旷视,上千名研发人员全部都在使用Brain++进行技术研发。

随着旷视上市的临近,旷视公布了其Brain++开源计划。Brain++,覆盖从数据的生成、清洗、预处理、标注和存储,到算法架构设计、实验环节设计、训练环境搭建,再到训练、加速、调参、模型效果评估和产生模型,以及模型分发和部署应用的全流程。可以说,旷视Brain++让研发人员获得了从数据到算法产业化的一揽子技术能力,不用重复造轮子也可以推进AI快速落地。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

在具体架构上,旷视Brain++包括深度学习框架MegEngine、深度学习云计算平台MegCompute、以及数据管理平台MegData三个部分,分别针对框架、算力和数据三个核心要素。其中,深度学习框架MegEngine主要用于旷视内部进行计算机视觉领域的算法开发工作,包括大规模的图像检测、分割、识别任务等;深度学习云计算平台MegCompute主要用于协助研究人员部署训练环境、设计训练流程、提供算力和资源分配服务、监控实验进程、提供可视化效果展示、管理用户权限、存储数据等;数据管理平台MegData能够提供数据方面的服务,包括数据管理、数据标注、数据处理和数据安全。

将三个核心组件整合为人工智能算法平台Brain++,旷视得以无需依赖第三方平台开发的深度学习框架就可展开全部研究。正是基于Brain++,旷视开发出了大量部署于云端、移动端、边缘端全计算平台的先进深度神经网络,打造了全栈式人工智能解决方案,并成功落地城市物联网、供应链物联网、个人物联网三大垂直领域,为行业发展赋能。

旷视Brain++,华为ModelArts,海康AI平台,殊途同归

小结:疫情逐渐散去,“数字基建”正在全国范围如火如荼地兴起。在互联网生态的基础上,以AIoT、5G、大数据、人工智能、云计算等新技术为核心驱动力的智能化时代也即将来临。在新时期,只有先把“数字基建”打扎实,“数字中国”才能有稳固的底座。为何海康、华为、旷视力推将算法平台或者算法框架进行不同层次的开放或开源?首先,以上企业自研的 AI 生产力流程及体系已经能够满足企业发展需要,希望把自己用着好用的工具向业界分享,同时也激发中小企业的创造力;其次,开放及开源是推进技术实现产业发展的催化剂;第三,企业可以在生态开源过程中,拉动自身生态的地位及价值反馈。目前 AI 实现产业要大规模部署 AI 能力,需要在数据、计算、场景、硬件解决方案上具备一系列“工业级”的基础,但眼前AI 技术的基础条件尚未成熟,百度、海康、华为、旷视都希望能够基于自身体量及影响力、资源优势,通过开放或者开源为 AI 产业赋能助力。


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多