首页 > 资讯 > 正文
Qzone
微博
微信

澎峰科技张先轶:做嵌入式AI工业级领域落地先行者

资讯 TOM    2019-05-29 10:46

导语:澎峰科技用三年的时间来打磨沉淀自己的技术产品,并在商业路径上积极探索。下一步目标明确:加速落地,生产嵌入式AI领域最棒的产品,做工业级产品先行落地的供应商。

澎峰科技张先轶:做嵌入式AI工业级领域落地先行者

爱玩少年、科学家、创业者,如果给张先轶人生最近20年里贴上几个标签,这似乎是他身上最鲜活的关键词。从喜欢玩儿游戏开始迷恋代码、到大学选择计算机专业、博士毕业后海外深造,再到开源矩阵库OpenBLAS的开创者,现在的他,是一家名为澎峰科技(PerfXLab)的公司创始人兼CEO。

澎峰科技关注的是近年来的风口——嵌入式AI,其产品则是基于ARM/FPGA/GPU/RISC-V等终端平台的技术解决方案,包括应用算法、框架、性能库、硬件板卡等,可应用于手机、无人机、智能出行、安防等不同场景。

业界共识:商业化落地的能力最能体现一个科技项目的商业价值。澎峰科技作为端上智能领域的先行者,从2016年开创至今,从未停止在产品路径和商业路线的升级和探索。

过去的三年里,从最初想做嵌入式人工智能的底层软件,到如今做软硬件一体的解决方案,从最初提供一个“铲子或一块砖”,到如今能提供“一座桥或一座房子”,随着在AI领域应用端上的产品和技术的逐渐成熟,澎峰科技的市场认知和商业化发展都已步入快车道。

在IP workshop与张先轶4个多小时的访谈中,你会发现他并不是一个“擅长讲故事的人”,他身上更多的是学者的严谨和质朴。相比较澎峰的优势,他讲得更多的是行业现状与如何打破瓶颈。

眼下,对于公司的使命,他反复强调“加速商业化”,工业级产品落地和面向个人开发者生态构建同时进行。

如今,从安防再到航空航天,澎峰的产品已经在多个场景中开始实测应用,预计2019年年底将实现盈亏平衡。但目标不止步于此,下一步:加速落地,生产嵌入式AI领域最棒的产品,做工业级产品先行落地的供应商。

与嵌入式AI结缘

大四的时候(2005年),通过一场比赛,张先轶与嵌入式AI“结缘”。

微软举办了(Windows Embedded Student ChallengE contest)一个主题叫做Going Beyond the Boundaries “超越边界”的比赛,这是一场团队作战,4个本科生、2个研究生一组,根据不同的主题进行不同的开发设计。张先轶那一组拿到了嵌入式系统的话题,他们的设想是做超市购物车上的一个交易系统,且应用人脸识别技术。

中国大陆地区最后选拔出10组入围前30名,张先轶团队名列其中。虽然在那场比赛他们没能最终获奖,但对于第一次来美国,参观了微软总部,并在欢迎晚宴上见到了主办方致辞嘉宾比尔盖茨的张先轶来说,对技术探索与学习的视野已经打开。这次经历也为日后他前往美国深造埋下了伏笔。

2005年,张先轶本科毕业并被保研,继续在北京理工大学深耕计算机专业。在2006年,他再一次与原来的小伙伴组队参加了《第三届趋势科技百万程序竞赛》,主题方向是网络安全,从初赛350支参赛队伍中脱颖而出了10支队伍,张先轶所在的Collapsar队名列其中,并最终斩获冠军,还拿了几个单项奖。

这对于张先轶而言,除了拿到丰厚的奖金,体验技术与场景结合的实战,更大的回报则是在技术领域坚定前行的信心。

2007年硕士毕业后,张先轶进入中科院软件所工作,从事高性能计算、性能优化、矩阵计算等方面的研究工作。2011年读博期间,在中科院软件所担任助理研究员的张先轶带领团队开创了开源矩阵计算库——OpenBLAS,他本人也是该项目的主要维护者。在矩阵计算的细分领域,这是一个优质的开源项目。

OpenBLAS被认为是业界领先的开源矩阵计算库,支持几乎全部的主流CPU处理器和常见的操作系统,同时能实现较好的性能优化。它在2016年获得了中国计算机学会科技进步二等奖,同时也进入了很多主流的Linux安装包,比如Ubuntu里包含了OpenBLAS Package。

除此之外,OpenHPC的套件里也运用了OpenBLAS。其用户广泛,从开源项目Julia语言、GNU octave,到深度学习的mxnet、Caffe,乃至IBM、ARM、英伟达等公司也都在他们的产品里边使用了OpenBLAS。“特别是嵌入式AI的很多库,都调了我们的OpenBLAS。”整体上看,从适配的处理器范围和支持的操作系统,在开源库中算是最广泛的实现。

2014年张先轶博士毕业后,他得知UT Austin之前研发GotoBLAS的那支团队有交流访问机会,于是他萌生了去美国的想法。此时,深度学习和人工智能已经逐渐火热起来。

在2016年,张先轶前往MIT继续进修。一个机缘巧合,在MIT-CHIEF中国创业论坛上,张先 轶结识了深圳晶泰科技的创始人温书豪,向他介绍国内正值AI创业风口,这也坚定了他创业的决心。

彼时,人工智能已经真正进入大众视野,深度学习算法成为人们关注的焦点,计算机视觉识别领域在创投界开始获得追捧。张先轶决定离开MIT,回国发展,2016年底澎峰科技(PerfXLab)创立。

随后不久,PerfXLab便获得了紫牛基金与明势资本注入的天使轮融资。张先轶也完成了人生的一次身份转换。

找寻商业场景

在AI逐渐探索商业化的道路上,人们逐渐发现,要实现技术的落地,不仅需要性能优越的算法模型以及可靠的硬件支持,还需要把 AI 技术和硬件环境进行结合,再应用到实际的生活中,以此来满足用户需求。

为此,澎峰科技用近三年的时间沉淀迭代自己的技术,从最初想做嵌入式人工智能的底层软件,到目前做软硬件一体的解决方案,并已成为国内在嵌入式AI工业级领域落地的首个供应商。

在框架层,澎峰科技推出了轻量级的深度学习推理框架InferXlite,支持ARM CPU,ARM Mali GPU,AMD APU SoC,以及NVIDIA GPU,相比较目前的传统通用框架具备小、轻、快的优势,代码<100k,接口支持任何网络模型,可移植任何硬件平台,几乎没有依赖库,框架设计与性能加速分离,从框架层面对于算法加速给予了充分的考量。

基于OpenBLAS的成功经验,团队打造了PerfBLAS——针对ARM等嵌入式平台进行深度学习卷积算法优化,可用于移动平台,手机、机器人、无人机等领域,提供的主要功能是让深度学习模型能够比较流畅地在这些硬件平台上“跑起来”。也因此,澎峰科技最初的客户大多是手机厂商或手机相关软件服务商,比如陌陌、360,都是他的客户。

“找手机厂变成手机里边的一部分”是澎峰科技在2017年最重要的工作之一。但很快,张先轶意识到只是做一个软件服务商是远远不够的。他一直在思考:“我们可扩展商业模式到底是什么?”

到了2018年,张先轶发现客户的需求有所变化,更多的是软硬件结合的方向。“这是一个比较大的改变,背后意味着,可能会有一些比较好的定价(商业)模式。”

张先轶做了这样一个比喻,在此之前,澎峰科技提供的服务更像一个合适的铲子或一块砖,“但面对更大量的客户,是需要你提供一座桥或者一个房子。这对于我们来说,就需要产品能整合更多东西。”

因此,基于核心的软件框架和多种计算库,澎峰科技集成了一体化的硬件产品:嵌入式深度学习开发平台PerfBox、Perf-FPGA、Perf-APU和Perf-V工程板。

PerfBOX采用64位ARM处理器,集成了InferXLite和PerfBLAS等软件套件,可用来做为学习、开发、部署深度学习应用的平台。Perf-FPGA和Perf-APU分别是面向FPGA平台和AMD嵌入式GPU平台的深度学习应用部署平台。

Perf-V工程板则是澎峰科技为RISC-V开源社区设计的FPGA开发板,具备很强的灵活性,移植了多种RISC-V处理器架构,并配备丰富的学习资料,为RISC-V处理器设计和FPGA产品开发提供了一个很好的实验平台。

市场反馈和需求的变化都证明,澎峰科技选择的软件和硬件相结合的产品路径决策是符合目前消费端诉求的。

张先轶举例,在2018年的一个展会上,他团队带了一些基于ARM的硬件产品去参展。“行业人士感兴趣的程度和我们之前只做软件展示,明显不一样。”

他也意识到,嵌入式软件单独去卖钱并不容易的,用的人少、单价低、难以走量,但当把软件承载到硬件上,用户可以触摸到产品的时候——无论是板卡或者盒子,软件的附加值也能有最大的体现。

另一个变化是,张先轶发现手机厂商的集中度越来越高,这也昭示着与客户的合作需要不断找寻新的增长点。

新的未来

在成长的过程中,澎峰科技的产品路径也由原来的纯软件,发展为目前的“软件+硬件+算法”结合的做厚模式,围绕ARM、FPGA/DSP、GPU,三个技术方向发力,而FPGA是其核心路径并已经商业落地。

对比三个技术方向,ARM具有比较强的事务管理功能,可以用来跑界面以及应用程序等,其优势主要体现在控制方面。

一段时间以来,ARM曾一度占据市场90%的份额,最初澎峰科技技术路线是基于ARM的开发,其硬件产品应用于安防领域或某些工业级场景等。但慢慢地,张先轶发现了FPGA和AI结合上正在兴起,且强强劲。

FPGA和DSP都可以应用于工业级产品,实时性非常高、对坏境的适应性比较广。基于此,澎峰科技的核心产品Perf-FPGA,已经开始布局和用于人脸,行人,车辆等多种目标和物体检测与追踪等场景,支持无人机、安防、科研等应用领域。

Perf-FPGA涵盖了深度神经网络算法压缩,定点量化以及根据FPGA部署平台的生成加速器。压缩与量化工具DL-Quants可以导入多种主流深度学习模型, DL-Compiler可以快速生成DL加速器和运行代码。DL-Accelerator采用RTL实现,底层针对不同平台做了适配和优化,使资源占用和性能达到极致。

张先轶团队已经把它的产品应用在航空航天领域,比如无人机、野外值守等领域,“我们遇到一个潜在客户,产品要放在自然保护区。”就如一个电子警察眼,要迅速识别进入相应区域的车辆或人员,这对产品来说有很大挑战——野外环境复杂,供电难度系数大,环境多变,要求产品更高的可靠性。

张先轶强调这一产品的一大特点是在复杂场景的高速识别——检测反应速度高达70帧每秒,“需要迅速地辨别出是何种车辆,人员等。能做到这个级别是非常不容易的。”在一业务板块,澎峰科技与合作伙伴联合开发并提供可行性解决方案,目前产品已经进入市场应用和测试阶段,市场反馈后,将很快进入批量化生产。

在FPGA实现落地的基础上,DSP相关的技术产品也已经成熟并加速布局,嵌入式GPU方面也与AMD公司展开合作。

显然,在国内工业级产品智能化领域,澎峰科技是首个发力,并率先将产品落地的企业。而这一市场,“规模将是千亿元级别的巨大蓝海。”澎峰科技已先行一步——从研发到卖产品,需要几年的时间。现在,这无疑给后来者将带来一定的市场压力。

与此同时,澎峰科技正在开发一个面向个人开发者的FPGA AI平台。“相当于是一个FPGA的开发版。”张先轶说,“这有助于获客,增进市场容量。让更多的人越早了解我们技术,才能越早的用我们的解决方案。”

此前,在这一领域,澎峰科技最大的竞争对手是深鉴科技。在2018年下半年,全球最大的 FPGA 厂商赛灵思对它进行了收购。深鉴科技成立于2016 年,一直基于赛灵思的技术平台开发机器学习解决方案,深鉴科技推出的两个用于深度学习处理器的底层架构——亚里士多德架构和笛卡尔架构的 DPU 产品,都是基于赛灵思 FPGA 器件。

深鉴科技通过神经网络与 FPGA 的协同优化,提供高性价比的嵌入式端与云端的推理平台,应用于安防、数据中心、汽车等领域——这也是澎峰科技一直在做的。

而深鉴科技高价被收购,足以证明FPGA这个领域的市场空间和巨大前景,而这对张先轶团队而言,也是一个好的预见:在被赛灵思深度绑定之后,一些以前深鉴科技的客户将寻求新的供应商,而澎峰科技在近一段时间内迅速地成长与布局,无疑已成为这一业务领域拥有顶尖技术,并且率先实现在工业级场景快速商业化落地的公司。

为此澎峰科技,持续获得了资本的认可和加持。张先轶透露,在继Pre-A轮融资后,近期将完成Pre-A+轮融资,将持续加大在工业级落地应用、以及面向个人开发者开源开放平台/社区的生态培育两大商业领域的投入和拓展。

“穿透客户的需求场景是我们要持续地做,在这个基础上继续迭代升级,铸就自己的商业壁垒。”张先轶如是说。

 

责任编辑: WY-BD

责任编辑: WY-BD
人家也是有底线的啦~
广告
Copyright © 2018 TOM.COM Corporation, All Rights Reserved 雷霆万钧版权声明
违法信息/未成年人举报:010-85181169     举报邮箱/未成年人举报:jubao@tomonline-inc.com