分享

AutoML进入商用化阶段,探智立方推出自动化全生命周期管理平台

 有点小搓 2020-04-30

    ​近年来,自动化机器学习(AutoML)因可大幅降低机器学习的门槛和人力成本受到了学术界和工业界的广泛关注。其在超参数优化、模型选择、神经网络搜索和特征工程等方面显示出其强大的功能。近年来AutoML逐渐进入商用阶段,国内人工智能独角兽企业——探智立方也创造性地推出自动化全生命周期管理平台DarwinML。

  传统上,术语AutoML用于描述模型选择和/或超参数优化的自动化方法。这些方法适用于许多类型的算法,例如随机森林、神经网络等。说白了,AutoML 最核心的内容其实就是用计算力和数学方法自动做数据特征提取以及模型建模。

  而在业界,大多数的数据科学家和算法科学家的工作内容就是模型调优和设计,但既有的模型无法满足业务需求,定制化的设计开发又很耗费时间,对于一些企业来说,招聘博士专家又面临各种困境。

  由此,探智立方自动化全生命周期管理平台DarwinML应运而生,它不仅能够解决”效率“的问题,将模型优化的过程抽象成纯数学问题,利用机器学习的算力、以搜索拟合的方式在尽可能短的时间内寻找全局最佳解决方案,而且相较传统的机器学习模型,由专家驱动的机制转换成了由业务驱动,极大程度上释放了分析师、开发者的时间。

  时效方面,通常用户把比较好的论文的模型转换成自己可用的模型并且优化需要2个深度学习模型开发人员2个月左右的时间,而DarwinML只需要1周的时间。

  内容方面,直接使用开源模型或论文模型,会使得计算力有浪费的情况,而DarwinML平台从数据特点出发,效率和准确率都得到了保证。

  我们经常听说的一些机器学习的项目,实际它的结构差别是很小的,一个效果好的模型通常需要大量的经验调优,这个过程包括:数据预处理、特征选择、模型算法的选择、调参、上线后的模型优化升级、效果评估。

  首先,DarwinML 平台会提取数据的统计信息。

  然后它开始自动进行模型设计。在进化到每一代时,都会对模型进行一次评估,以选择继续演化的方向,同时防止种群,也就是所有模型的整体早熟(避免重复使用前期效果比较好的相同或者相近的模型,尽量让选择在解空间里分散化)。

  当演化到达客户的准确率或者时间限制要求后,DarwinML 平台会再固定模型结构进行一次参数精调,同时进行超参数的局部优化。

  最后,在整个过程结束后,以报告的形式将模型的特征、硬件配置、各项表现指标返回给用户。

  值得一提的是DarwinML平台是一个全生命周期管理平台,基于其基因库,平台具有自我演化、自主设计的特性,可以加快模型设计收敛速度,提供ML模型可解释性,能够无缝与生产系统对接,并对生产模型实时优化。最终实现AI真正的“平民化”,重构人工智能开发生态。

  至少现在,DarwinML已经可以大幅度提高数据科学家的工作效率了。「一个由3个人组成,经验2-4年的数据科学团队,在一到两周时间内设计出来的模型,在使用DarwinML的情况下可以做到效果更好,而且机器的模型生成时间不超过一天。」宋煜表示。

  探智立方解决方案总监徐宁和产品总监宋煜

  在人工智能逐渐进入落地阶段的今天,AutoML等技术正逐渐成为趋势。「AutoML 的方法很多,但这些技术的发展仍处于初期,」探智立方创始人、CEO 施东峰说道。「在这个过程中,我们会在应用行业中找到一个端到端的,具有商业价值的场景。」自动化全生命周期管理平台DarwinML的推出,将是探智立方在AutoML商用化的积极探索。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多