<
 
 
 
 
×
>
You are viewing an archived web page, collected at the request of United Nations Educational, Scientific and Cultural Organization (UNESCO) using Archive-It. This page was captured on 16:02:51 Dec 05, 2020, and is part of the UNESCO collection. The information on this web page may be out of date. See All versions of this archived page.
Loading media information hide

于人之思想中构建和平

广角

第四次革命

cou_03-18_big_data_01.jpg

《反思·二》(Reflection#2)巴西艺术家拉克尔·科根(Raquel Kogan)的装置艺术作品。计算机生成的数字投射在漆黑的房间,使

继互联网和移动互联网引发第三次工业革命之后,以大数据驱动的人工智能技术正在推动第四次工业革命,这可能会撼动全球平衡。

杨强;王超 担任采访

人工智能与大数据融合是如何兴起的?

人工智能与大数据崛起于21世纪初,当时新兴的搜索引擎Google和百度把人工智能驱动的推荐系统用在广告上,结果发现效果非常好,远远超过预期,而且数据越多,效果越好。但当时没有人意识到在其他领域也是如此。

真正的转折点是ImageNet的兴起。ImageNet是世界上最大的图像识别数据库,其设计初衷是用予视觉对象识别研究。该数据库由美国斯坦福大学和普林斯顿大学的计算机科学家建立,被公认为是深度学习革命的开始。ImageNet大量的图像数据把错识率降低了10%。由此表明,深度学习和大数据的融合可以帮助掌握极其复杂的计算。

 

您如何定义深度学习与大数据的关系?

如果人工智能系统设计得好,产品就会更加便于使用、更加精准,因此也更加有用,这样就会带来更多用户。随着用户量的增加,数据也会随之增加,这反过来又会改进人工智能系统。二者是一种互相强化的关系。

大数据和人工智能可以融合成为一种新的人工智能,称作“数据智能”。

 

您能定义一下什么是大数据思维吗?公司如何才能适应这种思维方式,需要做出哪些改变?

大数据思维,第一点就是有意识地去收集数据。也就是在开展业务之前,先要想好如何收集数据。

第二,数据收集和核心算法密切相关。要从算法当中了解自己缺少什么,然后有的放矢地去收集数据,包括收集不同来源的数据等。

第三,要形成一个闭环。软件系统提供的服务要能刺激来源产生更多的数据,而这些数据又能够回到系统当中,从而形成闭环。这就使系统能够实现持续的自我改进和自我完善。闭环需要采用特殊设计,它与以往商业所用的设计大不相同。

 

您能否进一步说明什么是人工智能与大数据的闭环设计?

首先要考虑的是数据提供方,比如用户。所有的用户行为都要以数据的形式记录下来。其次是服务提供方,比如像中国的移动钱包微信支付和中国电商网站淘宝。根据数据生成智能反馈,目的是了解用户的需求。用户将反馈数据提供给服务方,服务方又将服务数据提供给用户,这样就形成了闭环。

要想迅速发展,第一,闭环要足够短,最好不要有人的参与,因为有了人的参与,闭环就无法彻底实现自动化。第二,要经常更新环路,最好一天进行多次更新,因为这样才能确保系统不断得到更新。第三,必须持续进行更新,这样才能促使用户不断提供反馈。所以,这个过程总结下来就是三个字:短、频、快。

 

在您看来,这个闭环实际形成需要多长时间?

我认为,人工智能发展会分为两个阶段。第一个阶段是所有行业都会去尝试使用人工智能。例如,安保服务会用人脸识别技术,银行部门会用人工智能技术进行风控,等等。这些都是为现有产业服务的独特技术和解决方案。

第二阶段将会出现以人工智能为核心的全新产业。例如,将人工智能作为核心技术的银行,它在投资、服务、信贷等方面可以完全采用人工智能,只有在进行微调时才需要职员。此外,银行也有可能建立全新类型的客服系统。

我认为,第二阶段才是人工智能真正带给人类社会的未来形式。就像互联网刚刚兴起的时候,在第一阶段,传统书店做了一个网页,就认为自己是网上书店了,但事实并非如此。到了第二阶段,亚马逊之类的网站出现了,它们与传统书店完全不同。

 

大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。如何保障大规模的数据正常流动,而又不侵害个人隐私呢?

利用大数据和人工智能技术创造出的产品,会带来极佳的新商业模式。但其大规模应用的前提是要确保用户隐私。这里有三点考虑:

首先,我们要有一套法律和社会规则来保护数据的所有权,明确数据在何处可用、在何处不可用。我认为,用户数据应当分门别类。比方说,红区数据不能动,黄区数据只让某些人接触,绿区数据则人人可用。当然,目前对数据的划分还莫衷一是。另外,也没有法律明确阐述责任人的定义,以及违反这些法律会受何处罚。

其次是从技术方面保护数据隐私。比如,第四范式公司(一家总部设在北京的人工智能技术服务提供商)目前正在研究用“迁移学习”来保护隐私,这是一个比较新的领域。它可以协助不同企业彼此交换数据,比如说,A做了一个模型,然后把这个模型迁移到B场景,数据不是在A和B之间直接交换,而是被载入了模型之中。这样就可以更好地保护用户隐私。

第三,我们需要深入研究用户隐私和数据定价。比如说,用户通过人工智能推荐系统在网上点击了一个广告,这个推荐系统是不是也应该从中得到一些好处呢?如果搜索引擎有收入,是不是应该分给用户一些?这些问题都值得探讨。

未来几年,人人都会认识到人工智能“落地”的重要性,我们需要更多地关注人工智能如何“落地”,以找到适合应用人工智能的领域。目前来看,金融、互联网和无人车都是比较适合人工智能“落地”的领域。

 

从全球角度来看,大数据和人工智能相结合会对发展中国家产生什么影响?

我认为大数据与人工智能技术可以使一些新兴国家赶上、甚至超过传统发达国家。因为在未来,经济竞争不仅仅是比拼金融和经济的规模,更重要的是比拼数据的规模,比拼拥抱数据经济的速度。比如说,中国互联网和移动互联网的迅速发展,使我们得以收集大量数据。这也将加速中国人工智能产业的发展,世界格局可能会因此而改变。

另一方面,一个国家如果已经拥有良好的基础设备和高质量的教育,就可以利用人工智能提高生产效率,就像当年的工业革命一样,蒸汽机的使用让一些国家得到了快速发展。

 

图片:Raquel Kogan

 

王超

王超(中国) 网易新闻智能工作室记者兼主管,负责报道人工智能领域的重大事件。