第四次革命

cou_03-18_big_data_01.jpg

《反思·二》（Reflection#2）巴西艺术家拉克尔·科根（Raquel Kogan）的装置艺术作品。计算机生成的数字投射在漆黑的房间，使

继互联网和移动互联网引发第三次工业革命之后，以大数据驱动的人工智能技术正在推动第四次工业革命，这可能会撼动全球平衡。

杨强；王超担任采访

人工智能与大数据融合是如何兴起的？

人工智能与大数据崛起于21世纪初，当时新兴的搜索引擎Google和百度把人工智能驱动的推荐系统用在广告上，结果发现效果非常好，远远超过预期，而且数据越多，效果越好。但当时没有人意识到在其他领域也是如此。

真正的转折点是ImageNet的兴起。ImageNet是世界上最大的图像识别数据库，其设计初衷是用予视觉对象识别研究。该数据库由美国斯坦福大学和普林斯顿大学的计算机科学家建立，被公认为是深度学习革命的开始。ImageNet大量的图像数据把错识率降低了10%。由此表明，深度学习和大数据的融合可以帮助掌握极其复杂的计算。

您如何定义深度学习与大数据的关系？

如果人工智能系统设计得好，产品就会更加便于使用、更加精准，因此也更加有用，这样就会带来更多用户。随着用户量的增加，数据也会随之增加，这反过来又会改进人工智能系统。二者是一种互相强化的关系。

大数据和人工智能可以融合成为一种新的人工智能，称作“数据智能”。

您能定义一下什么是大数据思维吗？公司如何才能适应这种思维方式，需要做出哪些改变？

大数据思维，第一点就是有意识地去收集数据。也就是在开展业务之前，先要想好如何收集数据。

第二，数据收集和核心算法密切相关。要从算法当中了解自己缺少什么，然后有的放矢地去收集数据，包括收集不同来源的数据等。

第三，要形成一个闭环。软件系统提供的服务要能刺激来源产生更多的数据，而这些数据又能够回到系统当中，从而形成闭环。这就使系统能够实现持续的自我改进和自我完善。闭环需要采用特殊设计，它与以往商业所用的设计大不相同。

您能否进一步说明什么是人工智能与大数据的闭环设计？

首先要考虑的是数据提供方，比如用户。所有的用户行为都要以数据的形式记录下来。其次是服务提供方，比如像中国的移动钱包微信支付和中国电商网站淘宝。根据数据生成智能反馈，目的是了解用户的需求。用户将反馈数据提供给服务方，服务方又将服务数据提供给用户，这样就形成了闭环。

要想迅速发展，第一，闭环要足够短，最好不要有人的参与，因为有了人的参与，闭环就无法彻底实现自动化。第二，要经常更新环路，最好一天进行多次更新，因为这样才能确保系统不断得到更新。第三，必须持续进行更新，这样才能促使用户不断提供反馈。所以，这个过程总结下来就是三个字：短、频、快。

在您看来，这个闭环实际形成需要多长时间？

我认为，人工智能发展会分为两个阶段。第一个阶段是所有行业都会去尝试使用人工智能。例如，安保服务会用人脸识别技术，银行部门会用人工智能技术进行风控，等等。这些都是为现有产业服务的独特技术和解决方案。

第二阶段将会出现以人工智能为核心的全新产业。例如，将人工智能作为核心技术的银行，它在投资、服务、信贷等方面可以完全采用人工智能，只有在进行微调时才需要职员。此外，银行也有可能建立全新类型的客服系统。

我认为，第二阶段才是人工智能真正带给人类社会的未来形式。就像互联网刚刚兴起的时候，在第一阶段，传统书店做了一个网页，就认为自己是网上书店了，但事实并非如此。到了第二阶段，亚马逊之类的网站出现了，它们与传统书店完全不同。

大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。如何保障大规模的数据正常流动，而又不侵害个人隐私呢？

利用大数据和人工智能技术创造出的产品，会带来极佳的新商业模式。但其大规模应用的前提是要确保用户隐私。这里有三点考虑：

首先，我们要有一套法律和社会规则来保护数据的所有权，明确数据在何处可用、在何处不可用。我认为，用户数据应当分门别类。比方说，红区数据不能动，黄区数据只让某些人接触，绿区数据则人人可用。当然，目前对数据的划分还莫衷一是。另外，也没有法律明确阐述责任人的定义，以及违反这些法律会受何处罚。

其次是从技术方面保护数据隐私。比如，第四范式公司（一家总部设在北京的人工智能技术服务提供商）目前正在研究用“迁移学习”来保护隐私，这是一个比较新的领域。它可以协助不同企业彼此交换数据，比如说，A做了一个模型，然后把这个模型迁移到B场景，数据不是在A和B之间直接交换，而是被载入了模型之中。这样就可以更好地保护用户隐私。

第三，我们需要深入研究用户隐私和数据定价。比如说，用户通过人工智能推荐系统在网上点击了一个广告，这个推荐系统是不是也应该从中得到一些好处呢？如果搜索引擎有收入，是不是应该分给用户一些？这些问题都值得探讨。

未来几年，人人都会认识到人工智能“落地”的重要性，我们需要更多地关注人工智能如何“落地”，以找到适合应用人工智能的领域。目前来看，金融、互联网和无人车都是比较适合人工智能“落地”的领域。

从全球角度来看，大数据和人工智能相结合会对发展中国家产生什么影响？

我认为大数据与人工智能技术可以使一些新兴国家赶上、甚至超过传统发达国家。因为在未来，经济竞争不仅仅是比拼金融和经济的规模，更重要的是比拼数据的规模，比拼拥抱数据经济的速度。比如说，中国互联网和移动互联网的迅速发展，使我们得以收集大量数据。这也将加速中国人工智能产业的发展，世界格局可能会因此而改变。

另一方面，一个国家如果已经拥有良好的基础设备和高质量的教育，就可以利用人工智能提高生产效率，就像当年的工业革命一样，蒸汽机的使用让一些国家得到了快速发展。

图片：Raquel Kogan

杨强

杨强 (中国）人工智能和数据挖掘领域的国际领军人物，国际人工智能联合会（IJCAI）首位华人主席、国际人工智能协会（AAAI）院士、香港科技大学计算机科学及工程学系主任、第四范式联合创始人兼首席科学家。

王超

王超（中国）网易新闻智能工作室记者兼主管，负责报道人工智能领域的重大事件。

Social Media

第四次革命

cou_03-18_big_data_01.jpg

cou_4_18_pdf_zh_page_01.png