AI 新贵:梦想撞上现实

2019-10-25 原文 #Nei.st 的其它文章

私募市场热捧的中国 AI 独角兽预备上市,却突遭美国钳制,短期调整供应链后,更大的挑战是固有的技术瓶颈和落地难题

中国 AI 新贵的首个 IPO 即将出炉。正在积极备战的旷视科技将其境外上市计划命名为「金刚」,取意「程序猿」长成了庞然巨兽。

成立于 2011 年的旷视科技,有着中国这一轮人工智能 (AI) 创业潮的标准形象:创始团队履历光鲜,国际比赛频繁获奖,是各地政府的座上宾,公司估值动辄数十亿美元。

天有不测风云。就在旷视备战境外上市的关键时刻,美国向中国 28 家公司发出了出口禁令。美国东部时间 10 月 7 日,美国商务部产业安全局 (BIS) 把 28 家中国实体加入出口管制实体清单,其中包括海康威视 (002415.SZ)、科大讯飞 (002230.SZ)、大华股份 (002236.SZ)、旷视科技、商汤科技等八家中国科技企业。

中国人脸识别领域的「四小龙」:商汤、旷视、依图和云从,前三家均未能逃过出口管制。

在一级市场上,商汤是比旷视更为耀眼的企业。创始人汤晓鸥是香港中文大学信息工程系教授,商汤成立五年间融资 30 亿美元,以 75 亿美元的估值成为全球最贵 AI 初创企业。

对于禁令,独角兽们并非毫无准备。一名接近旷视的 AI 行业人士称,旷视此前已接触过国产 AI 芯片,但内部员工多不愿意使用,因为国产芯片对算法的支持不够好,重新适配优化可能要花费数月的时间。不过旷视首席技术官唐文斌坚决要求内部先作好准备,以防 GPU 市场巨头英伟达 (NASDAQ:NVDA) 断货。

GPU (图形处理器) 是 AI 的算力基础,在 AI 模型开发上不可或缺,各家 AI 公司甚至以 GPU 数量多寡来显示自身实力,而英伟达正是这一市场的长期主导者。

目前,商汤科技部署的 GPU 数量已超 1.5 万张,年采购量至少有数千张。单张企业级 GPU 的价格都在数万元,再加上服务器等相关成本,单季度开支就可能达到亿元级。同样地,英特尔 (NASDAQ:INTC) 的 CPU (中央处理器)、赛灵思 (NASDAQ:XLNX) 的 FPGA (可编程芯片) 等也都几乎没有替换选择。

市场咨询机构 IDC 的一位资深分析师告诉财新记者,AI 公司在禁令下将失去稳定的芯片供应,而为第二货源或替代方案承受更高的成本。

不过,相比出口管制的影响,更让市场疑虑的还是 AI 业务的真实前景——无论技术还是商业化,均有眼下无法解决的问题。

AI 领域目前最流行的深度学习存在「死穴」。林倞曾在商汤担任执行研发总监。他曾指出,目前的 AI 公司,无论是巨头或独角兽,大多依赖大数据,而且模型往往只适用于个别特定任务,不具备解释性和不同场景泛化的能力。

AI 应用也远非商业计划书和招股书上描述的那么光鲜。「在人脸和车牌之外还有什么?」一家风险投资机构的合伙人称,国内 AI 应用场景集中,多为单点应用,且算法本身门槛不高。他笑称,如果一定要选一家公司投资,会选择商汤。不是因为技术,而是它成功树立了最贵、最大 AI 公司的形象。商汤的融资能力,恰是不少投资人决定投资它的原因。

旷视一名管理层甚至判断,未来两年内,「四小龙」里只有两家公司能活下去,更小的 AI 企业处境可想而知。近两年,不少以 AI 视觉和语音算法起家的公司,纷纷宣布投入开发芯片。「过去比算法指标,现在没有人稀罕『千足金』(识别准确率) 了。落地也没什么好讲的,『自研芯片』是新一轮的资本故事。」

无论是在美国、欧洲,还是在以色列的分析报告中,中国都是 AI 全球竞争中不得不提的主角之一,但是中国 AI 公司要成为真正的「金刚」,道阻且长。

「裸露」的业绩

「我们先把衣服脱了,他们自便。」旷视内部对过往披露的融资真实性和增长曲线颇有自信,但能否说服二级市场为 AI 公司埋单,则是另一回事。

8 月底,旷视在港交所披露上市文件,2019 年上半年营收 9.49 亿元,同比增长 210.3%;经营亏损 1.15 亿元,较上年同期缩减 17.2%。在调整后的口径下,即不算入 1047 万元应占联营公司亏损、1.1 亿元以股份为基础的报酬开支和 329 万元收购产生的无形资产摊销等,旷视上半年实现净利润 3268 万元,去年同期为亏损 1.37 亿元。若使用更加严格的会计准则,旷视则仍处于显著亏损中,但幅度已有所收窄。

旷视如今最主要的业务是向城市提供物联网解决方案,占总收入的 73%。其中最主要的便是城市、楼宇、厂区等的安防。毛利率约为 60%,上半年营收 6.9 亿元,同比增长 273.7%。旷视剩余业务主要是软件服务,毛利率约为 80%,此类软件服务门槛较低,可替换性强。

如何定义一家 AI 视觉公司?旷视的产品线由软及硬,64.6% 的整体毛利率介于视频监控公司海康威视的 46.3% 和纯软件公司虹软科技 (688088.SH) 的 94.3% 之间,与 AI 语音公司科大讯飞的 50.4% 相近。

旷视内部则将美国老牌工业视觉企业康耐视 (NASDAQ:CGNX) 列为对标。康耐视于 1981 年由当时麻省理工学院的讲师施尔曼 (Robert J. Shillman) 创立。公司的第一个客户是一家打字机厂商,他们购买康耐视的字符识别系统,来检测每个打字机上的按键是否在正确的位置上。康耐视在 1987 年初首次实现盈利,并在两年后上市。

康耐视 2018 年收入同比增长 5% 至 8.1 亿美元,净利润同比增长 24% 至 2.2 亿美元。借着美国科技股大潮,康耐视股价从 2016 年初的 15 美元飙升至 2017 年底的 72 美元,现回落至 50 美元左右,市值约 85 亿美元。

康耐视毛利率一直保持在 75% 上下,净利润率在 20% 到 30%。与中国企业级公司不同,海外老牌企业的产品颗粒度更高,仅针对汽车轮胎系统,其中又分为车轮紧固件检测、轮胎总成检测、轮胎和车轮识别等的标准化方案。

这也反映在更高的人效上。至 2018 年底,康耐视员工总数为 2124 人,人均创收约 38 万美元 (270 万元人民币),远高于同期科大讯飞的 72 万元、旷视的 73 万元和海康威视的 145 万元。

国内科技公司相对平庸的人效表现,并不符合人们对硬科技的印象,以致于有投资人将国内 AI 算法公司形容为「劳动密集型行业」。以色列辅助驾驶公司 Mobileye 在被英特尔以 153 亿美元收购时,公司不到 800 人,人均创收超过 45 万美元 (约 320 万元人民币),而旷视的员工数则已在今年上半年达到 2349 名。

由于下游消费电子和汽车市场的衰退,康耐视今年二季度营收和利润都出现同比下滑。那些受到中国经济降速影响的客户,正在削减和推迟大型项目。已有美国投资人开始怀疑计算机视觉还是不是一个增长的市场、抑或过去几年汽车和手机企业的资本开支过高。

这对国内 AI 视觉创业公司来说同样是个警示信号。随着下游安防投资退潮,营收高增速恐难以为继。一家 AI 语音公司的 CEO 称,过去几年间,AI 视觉企业跑得更快,主要得益于政府在安防上的大额投入,而在安防之外的领域收入寥寥。

资本接力到尽头

不停歇的高额融资,是 AI 头部初创企业的一大壁垒。2016 年至 2019 年上半年,旷视各期的经营和投资现金流均为负值,且呈扩大态势。与此同时,旷视融资所得水涨船高,今年上半年达 38.6 亿元,维持着现金流整体为正。

据招股书,在今年 4 月,旷视完成了上市前最后一轮 5.9 亿美元融资,以发行的股份计算估值约为 40.9 亿美元 (约 290 亿元人民币)。蚂蚁金服目前是旷视最大的股东,通过全资子公司持有 15.1% 的股份;阿里巴巴通过淘宝中国持股 14.3%。公司三位创始人合计持股 16.8%,通过「同股不同权」在投票权上形成控股。

商汤 CEO 徐立也在今年 9 月公布了最新 75 亿美元的估值。而在今年初以来,行业中甚至传出商汤估值百亿美元的消息,据财新记者了解,中美贸易摩擦对商汤的境外融资确实造成过影响,商汤也更倾向于和旷视一样到中国香港上市。

旷视们的上市之路注定将面对巨大的不确定性,香港市场对远大故事的热情向来不高。财新记者近日向多家香港投行、长线基金和对冲基金负责 TMT 或中国市场的人士问询,普遍的态度是听说过旷视,但没有深入了解过。

至于为何依然在这个时点选择境外上市,一位了解过 AI 项目的香港投行人士分析,相比科创板,中国香港市场锁定期更短,套现更容易,能避开未来公司和市场的不确定性;相比香港,登陆美股的难度则更大,投资人不买账。港股的风险则是在糟糕的流动性上。

目前 A 股市场 AI 概念股中,科大讯飞的 PS (市值/营收) 约为 7 倍,海康约为 4.8 倍;港股软件和 SaaS (软件即服务) 供应商金蝶国际 (00268.HK) 约为 7.5 倍;康耐视约 11 倍。

假设旷视下半年营收增速与上半年相仿,全年营收达到 40 亿元,以超过 7 倍的 PS 值上市定价,其市值才能勉强追平私募市场最后一轮 40 亿美元的估值。而香港市场人士则告诉财新记者,旷视想在二级市场保住 40 亿美元的市值「有相当难度」。

境内投行分析师也称,这一批 AI 视觉公司估值已相当高。未来能否顺利摆脱对融资的依赖、在两到三年内进入盈利期并维持现有估值,都是未知数。

在一轮轮闪光的融资之后,如何满足资本的期待成为全行业的焦虑。骄傲的年轻科学家们决心放下身段,联手职业经理人。

2014 年成立的第四范式,在完成 C 轮超 10 亿元融资后,也到了时常会被人问起上市计划的阶段。

第四范式创始人戴文渊在今年夏天请来新帮手裴沵思担任第四范式的总裁。技术出身的戴文渊,曾是百度最年轻的高级科学家,而裴沵思曾任 SAP 全球副总裁,显然更像是做企业级生意的人。科学家搭配跨国公司大销售的组合,成为越来越多 AI 公司的标准配置。

裴沵思的前同事悄然间遍布中国的 AI 战线,如百度智能云总经理尹世明、创新奇智 CEO 徐辉、商汤科技副总裁柳钢等。IBM、微软和甲骨文等老牌企业服务公司员工转投 AI 圈的更是比比皆是。

裴沵思相信,第四范式如今的模样便是十几年前的 ERP (企业资源规划) 企业,能引起客户的战略性思考。「没有 AI 公司关心利润」,投身 AI 公司的销售们当下的重点是画出更陡峭的增长曲线。

进入垂直行业后,AI 公司开始从大客户挖人,公安、银行、能源,每进入一个新行业就能看到 AI 公司扩充行业专家。

然而,并不是所有公司都能跑到 IPO 那一步,科学家创业的公司一旦无法建立包括销售、客服等一系列组织和业务能力。最好的选择往往是由大公司接手。财新记者两次询问裴沵思,第四范式会不会考虑接受收购,都得到了毫不犹豫的肯定回答。

相比旷视、商汤、第四范式这样的算法公司,AI 芯片公司更加焦虑。因为其估值和算法公司相当,业绩确有数量级的差距。国字头「大基金」(国家集成电路产业投资基金) 的投资人对于投资 AI 芯片全无兴趣,甚至将其形容为下一个共享单车般的资本泡沫。

「作坊」与「工厂」

相较业绩与估值,AI 更大的挑战还在于它的技术前景。酷炫的想象力与满足真实需求之间,究竟还有多大差距?

美国加州大学洛杉矶分校教授朱松纯早在十几年前就试过了如今年轻一辈在走的路。

上世纪 90 年代,数码相机的出现,让朱松纯意识到一场感知革命即将到来——AI 有了数据。朱松纯希望建设全球最大的标注图像数据库。他回到老家湖北鄂州,在 2005 年带头设立了莲花山计算机视觉研究院。

当时朱松纯雇了几十位平面艺术等专业的年轻人标注图像,连杯子和盖子都要分开标记。朱松纯自称,即便到今天,那也是标注得最细致的数据集。

为了给 AI 准备足够多的「燃料」,数据标注如今成了 AI 行业再寻常不过的工种。以旷视为例,到今年上半年末,公司内部便有 405 名数据标注人员,是研发之外最大的职能部门。

「为什么这么流行?因为它容易。」朱松纯认为,近年深度学习「大行其道」有其道理,如果数据量足够大,用「题海战术」能解决特定的问题,但这不是人类解决问题所用的办法。

到 2008 年前,朱松纯就发现「大数据,小任务」这条路有巨大的问题。首先是盈利难,任务和场景稍有变化,就需要重新收集、标注数据,训练模型。朱松纯曾尝试在视频监控上应用计算机视觉,以辅助行为分析。这也是如今随处可见的应用之一。但朱松纯发现,白天或黑夜、不同摄像头位置、不同地区都在影响 AI 的表现,哪怕是「旁边多了个路灯就又不对了」。

如果使用通用的算法模型,就会发现一大堆错报、误报,只能人为重新调整,时间和人力成本都高。「一折腾就不赚钱了。」朱松纯称,直到今天,这个问题依然没有被解决。

国内 AI 初创企业之所以必须用人海战术,除了数据标注要人,还需要养一大批负责技术支持的工程师,以应付因各种细微变化引起的「算法不适」。

近日,在高通的一场工业零部件视觉检测演示中,工程师在工业流水线上部署了一只摄像头,用于识别下方传送带上快速滑过的各类器件,几无漏检。当财新记者用手稍稍挡住摄像头一面的光线时,AI 立即就像被蒙上了眼睛,接连不断地将传送带上的阴影识别为器件,识别率都已无从谈起。

虽然高通以无线技术见长,该演示只为了模拟工厂互联网场景,但深度学习算法之「娇气」可见一斑。

在数据依赖之外,由于缺少理论基础,调整模型参数是深度学习中最为「玄学」的部分。一名旷视员工将其比作厨师的手艺,「加盐少许究竟是多少?全凭感觉」。

美国卡耐基梅隆大学教授邢波曾向财新记者称,如今的 AI 工艺不过是「作坊」的程度,难以标准化输出,「就像陶器,师傅和学徒做出的品质不同,甚至师傅做两遍,品质也不同」。

「打造 AI 工厂」于是成了全行业努力的目标。人力成本更高的美国,在此走得更快。谷歌在 2018 年初推出一款自主生成 AI 模型的工具,名为 AutoML (图像版)。用户只需要提供一定数量的图像训练样本,AutoML 就能自动生成对应的定制化 AI 模型。在气象应用中,过去的通用 AI 模型能够识别出「照片中的是天空」,定制版模型就能识别出云的类型,如卷云、层积云等。亚马逊云 AWS、微软、百度、腾讯等大企业都将其视为 AI 的趋势。

但批评的声音也随即而至。AI 领域历来有所谓「黑箱」担忧,即 AI 导出结果的过程对于人类来说不可知。自动化生成 AI 被指「在黑箱外创造更大的黑箱」。

这并不只是科学伦理问题,而已在阻碍 AI 向社会的底层渗透。服务电信运营商的爱立信东北亚区数字服务部产品经理舒迪向财新记者称,电信业在 AI 使用上仍属早期,若想大规模应用,则「必须是可信赖的 AI」,不光可以解释 AI 决策背后的逻辑,还要确保 AI 不会有任何不良倾向。「电信行业需要 99.999% 的可信赖度,任 AI 自由发挥,运营商怎么敢用这样的系统?」

人人皆有 AI

「AI 作坊」注定不是通向通用 AI 的道路,更有野心的技术人已在尝试让普罗大众都拥有属于自己的 AI。

「为什么牛一生下来就能自己生活,这自然不是依靠大数据。」2008 年之后,朱松纯一直在寻找一条走向通用 AI 的道路。2017 年夏天,朱松纯成立了将 AI 落地教育产业的新公司。

与市面上背靠大规模题库的教辅应用不同,朱松纯的产品不依赖于题库,AI 能自己出题、讲题,清楚题目的难易。交互过程中若发现学生还有不理解的知识点,还能生成新的题目来讲解,因材施教。

而微软 (亚洲) 互联网工程院副院长李笛作为 AI 机器人「小冰」的「爸爸」,想创造的则不是一位 AI 老师,而是陪伴人类的 AI 伙伴。自 2014 年诞生以来,小冰做过主播、歌手、诗人、记者、作家和设计师,今年夏天刚刚从中央美院毕业,办了自己的首场画展。

微软在 8 月宣布将创造小冰能力的框架对外开放,企业和个人用户未来可通过新发布的 Avatar 框架,定义专属的 AI being (人工智能存在):可以是一位处女座的 AI 少女,或是一位 38 岁的 AI 大叔,「能听、能说、能看、能创造」。

在性格设置上,框架内支持 76 项基本信息和 27 项性格特征,用户还可以设置 AI 的三观 (世界观、价值观、人生观)。小冰团队提炼了若干问题,比如能否接受相亲、是否会因寂寞而恋爱等,只要给 AI being 设置这些问题的答案,AI 对爱情的理解基本就确定。小冰团队的徐翔发现,「是否相信男女之间有纯粹的友情」这个问题的答案对 AI being 的爱情观影响特别大。

不过,人人皆有专属 AI 的愿景,实现起来绝非易事。即便是多年迭代后的小冰,仍时常理解不了人类的调侃。

5G 寻找「化反」

在 2019 年将 5G 时间表提前,中国第一次站在全球无线网络建设的最前线,给了中国科技企业又一个梦想和焦虑的理由。

「以后这些站点全部云化,不用布线还能省钱。」在 8 月底上海的世界人工智能大会上,华为的销售卖力地向 AI 初创企业创新奇智的员工兜售 5G+AI 的愿景。

在他们身旁是创新奇智展示的一套 AI 成衣质检一体机,利用摄像机拍摄成衣图像,机器便能判断衣服在尺寸、对称性、质量上的问题,以分担人力。「有了 5G,就不用每个工作台都放一套设备,计算都能在云端完成。」

5G 是 4G 之后的新一代移动网络,可提供每秒数千兆比特的峰值速率、数毫秒级的时延和每平方公里上百万的连接容量。随着国家工信部在 6 月提前发牌,中国 5G 商用拉开大幕。垂直行业一直被视为 5G 独树一帜的应用场景,被寄予厚望。AI 能否与 5G 迸发出火花,引人关注。

李笛从去年开始就特别关注 5G,期待着 5G 的商用。他相信,5G 的低延时在 AI 与人的交互上能派上大用场。「低时延不能说是给我们量身定制的,但是我们特别需要。」李笛向财新记者称。

应用的雏形已经出现。2019 年 2 月,微软团队将日本版小冰「凛菜」做成一款安卓应用,让她在手机上陪伴用户逛东京的水族馆,凛菜会根据所见所闻跟人交流。例如当凛菜通过摄像头看到水母时,就主动和人搭话:「水母晃来晃去的,如幻想中一样,真浪漫。」

在此般测试中,机器不仅仅用语言,还能基于视觉等多感官的认识来与人交流。背后实时视觉和语音语义的决策判断,都对网络提出了更高的要求。

小冰团队技术负责人周力向财新记者称,虽然 AI 有不少突破,但计算仍非常复杂,使得很多算法在手机上都难以运行,更不要说耳机、头戴设备等。5G 可以将移动设备上的任务真正移到云上,因为 5G 足够快,「以前认为不太可能做到的 AI 应用,会渐渐地铺开」。

不是每个人都如此乐观。「都说 5G+AI,接着再加什么呢?」一家千人规模的 AI 企业高管蔡强 (化名) 曾在华为工作,他认为应用开发者还没有想清楚把 5G 这项技术用在什么地方,更何况 4G 在大城市都还有余量。自动驾驶之外的 AI 任务也不需要那么低的延时。至于 5G 大连接的特性,物联网的标准尚不统一,短期难成气候。

在公司的战略会议上,蔡强向老板建议,在 5G 上不要做先行者,等等看,以免栽跟头。若不是政府有意加速 5G 建设,他甚至担心 5G 会重蹈「奇数代」通信技术翻车的「魔咒」。

No More.


文章版权归原作者所有。
二维码分享本站