新三合一

人工智能的成功倚赖优良的数据和廉价的劳动力

中国是人脸识别之国。在广州和深圳等大城市的街道上，能够从路人身上提取面部图像的摄像头随处可见。在机场四四方方的自动售货机前，你可以扫描面部来购买一杯机器人现榨的绝对新鲜的橙汁。从去年 12 月 1 日起，所有向中国移动等中国的电信公司申请帐户的人都必须提交面部扫描。以前的规定要求提供身份证明，而拥有用户的面部照片将使公司能够通过智能手机的摄像头实时验证身份。

考虑到这项技术的压制性用途 (尤其是在中国西北部穆斯林占多数的地区)，中国对它的迅速推广最多只能说是一项技术上的成功。人们不大注意到的一个事实是，这个领域里的领头羊的发展更依赖于巧妙部署的廉价劳动力而不是任何技术优势。这是要在宣布中国赢得技术战争时要谨慎的另一个原因。但尽管如此，了解中国如何让人脸识别蓬勃发展大有裨益。全球估值最高的两家创业公司——旷视科技和商汤科技——都是专注于这一领域的中国人工智能公司，分别价值 40 亿美元和 75 亿美元。仅凭它们的应用就将让人脸识别成为世界上部署最广泛的人工智能形式之一。

像大多数部署智能软件的公司一样，旷视和商汤依靠一种被称为「机器学习」的技术。它不要求人类程序员把区分一张脸和另一张脸的规则写进计算机程序。相反，程序员会向计算机提供有关人脸的大量数据 (通常是照片)，并编写软件来读取这些照片，以寻找能够可靠地将每一张独特的脸区分开来的模式。机器学习软件获得的模式比人类程序员能够明确描述的任何规则都能更好地识别人脸。人类很善于识别人脸，但使用了正确的软件的计算机可以通过学习而远胜于人类。相比人类识别者，人脸识别软件的部署要容易得多也便宜得多。它只需要软件、功能强大的计算机，以及数据——这就是人工智能的新三合一。

人们会提醒你，中国的最大优势在于这第三项。中国拥有大量数据。但它的优势比这更精细。单凭数据本身对于构建人工智能软件来说派不上多大用场。必须先给它们做上标记。也就是说数据集必须具有计算机所需的上下文信息，才能了解该数据集的成分之间的统计关联，以及它对人类的意义。

为了学会区分猫和狗，首先要给计算机看正确标注了每只动物的图片。为了学会区分一个人和另一个人的脸，必须首先使用标注好的数据向计算机展示是什么脸，然后是颧骨和眉毛有什么差异——同样靠人工标注。只有有了足够多的做好标记的指示，它才能在没有人工帮助的情况下开始识别人脸。

支持旷视和商汤等公司的是一个庞大的数字基础架构。通过它，数据被收集、清理和标注，然后再处理成可以快速识别人脸的机器学习软件。就像苹果公司给主要由廉价的中国劳动力组装的手机打上品牌那样，中国的人工智能公司设计人工智能软件和服务并创建品牌。它们位于一个数据供应链的顶部——这个供应链在默默无闻的中国数据工厂中使用廉价劳动力。从招股说明书来看，旷视在过去三年半中在已标注数据上花费了 2.18 亿元人民币。它们使用的许多算法中并没有多少内容是地球上随便哪个计算机科学研究生拿不到的。没有中国无与伦比的数据标注基础设施，这些数据成不了气候。

刘端阳是中国最大的数据工厂莫比嗨客的创始人之一。他在中国最贫穷的省份雇用了 30 万数据标注人员。每名标注员每天工作六小时，为一连串人脸、医学图像和城市景观做标注。莫比嗨客把数据流推给他们，就好像有一条数字传送带一样。然后他们处理数据，为机器学习创建课程提纲。他们可以把它关掉去上个洗手间，但也仅此而已了。他们不能选择要标注的数据，数据已经为他们做出了选择。

刘端阳称，莫比嗨客的诀窍不仅在于数字，还在于该公司向工人高效分配标注工作的方法。它的做法和美国电子商务巨头亚马逊向客户推荐产品的机器学习系统类似，只不过它不是向购物者推荐商品，而是将标注任务分配给工人。首先，它会在员工执行标注工作时收集数据。刘端阳说，公司记录了工人的目光、鼠标移动和键盘击键。它也记录下工人正在执行哪种数据标注任务，是医学图像标注还是文本翻译等等。他说，通过根据任务类型衡量绩效，就能够找到在某些任务上尤为娴熟的工人，并将这些任务分给那些工人。

当莫比嗨客的客户向这家公司提供任务时，所有这些都会自动发生。刘端阳说，经过最精细的调整，这些系统使他的员工队伍几乎可以实时对数据进行分类。在为总部位于北京的字节跳动公司的流行短视频应用「抖音」工作时，他说自己的数据标注员们处理抖音的自动化系统无法判定是否为色情的图像。莫比嗨客向数百或数千名人类员工推送这些可能属于色情的图片，而他们就像波特·斯图尔特大法官一样，在看到时就知道它是不是色情。然后，公司会在不到一秒钟的时间内将汇总的答案返回给抖音。

人工智能套利

莫比嗨客的工人每月平均工资为人民币 3000 元，是中国最贫困地区人均工资的三倍。刘端阳可以使用互联网在最富有和最贫穷的地区之间进行工资套利。莫比嗨客的业务在许多方面都与网约车公司优步相似——它是将劳动力供需联系在一起的众包平台。但是，优步可以合理预期其司机拿到手的最低工资受到地理位置的限制，因为司机必须居住在距离市场几个小时以内的地方。这将他们限制在生活成本高的城市地区，公司再吝啬也有个下限。刘端阳则没有任何此类限制。来自那些月薪 3000 元已算很不错的地区的工人会很高兴地为位于深圳的人工智能公司标注数据，而在深圳这点工资就行不通了。

许多省政府都渴望让刘端阳在其辖区开设数据工厂，提供人们急需的工作。在每个月里，地方政府都会向莫比嗨客支付每 5 千名本地工人 5 万元人民币的资助。公司共雇有 30 万名工人，所以每个月的政府资助就达 300 万元人民币。

刘端阳说，与 2017 年顶峰时期相比，如今公司接到的人脸识别标注的任务越来越少。现在越来越多的是对医学图像的标注请求，让软件从中学习如何诊断疾病。还有无穷无尽的街景，一旦标注好，就可以让无人驾驶汽车了解它们将要驶过的城市。这些标注任务难度更大。每个人都知道脸是什么样，但并不是每个人都知道 X 光片上的肿瘤是什么样。标注这些疾病需要专业知识，这意味着莫比嗨客必须向标注员支付更高的酬劳。尽管如此，这些标注要求表明了几年后中国可能会广泛采用什么样的人工智能服务。刘端阳表示，明年他将把员工队伍扩大 50%。

没有这种数据标注基础设施，中国的人工智能服务就无法起飞。像莫比嗨客这样的标注服务使阿里巴巴能够创建强大的机器学习服务，例如淘宝基于图像的产品搜索。阿里巴巴的购物者可以在实体商店里拍下某件商品的照片，然后立即被导向可以买到它的淘宝页面。阿里巴巴每天处理十亿张这样的图像。它还依赖已标注数据来实现在其盒马品牌零售商店中部署的机器学习算法。在这些时尚的新超市中安装的摄像头可以跟踪商店中的购物者，并识别他们从货架上拿走的商品。

大量已标注数据不仅仅支撑起了功能强大的机器学习软件。通过研究这些软件的内部工作原理，微处理器架构师们可以炮制出功能强大的新芯片，专门用于运行机器学习任务。中国的数字基础设施已经催生了一些位列世界最强大的机器学习系统。现在，这些系统又在生成能与硅谷最好的产品竞争的人工智能芯片。

Technology Quarterly Technology in China

人工智能套利

#Nei.st 的其它文章