每日有书: 终极算法


——· 关于本书 ·——

《终极算法》告诉我们,超级算法是一种可以将过去、现在、未来的所有数据转化为知识的规则,神经科学、进化论、统计学这三大领域都有令人信服的证据能够证明超级算法的存在。此外,终极算法的世界,会同时存在两个我,一个是“实我”,一个是“虚我”,他们互相分工合作,共同描绘人生画卷。

——· 关于作者 ·——

作者佩德罗•多明戈斯,美国华盛顿大学计算机科学教授,国际机器学会联合创始人,机器学习与数据挖掘方面的领军人物,荣获数据科学领域的最高奖项——SIGKDD创新大奖。《终极算法》被称为近20年来人工智能领域最轰动的著作,作者佩德罗用精准而浅显易懂的语言阐释了机器学习背后的思想源泉,如果你要了解人工智能将如何改变我们的生活,这本书就足够了。

——· 本书金句 ·——

1. 所有知识,无论是过去的、现在的还是未来的,都有可能通过单个通用学习算法来从数据中获得。我将该学习算法称为“终极算法”。

2. 机器学习算法的首要任务就是区别可预测的事与不可预测的事,但终极算法的目标是要学习一切能认知的东西。

3. 学习算法并不是完美的,决定的最后一步通常还得由人来做,但学习算法很智能,为人们减少了需要做的选择。

4. 未来属于那些深深懂得如何将自己的独特专长与算法的擅长结合起来的人。

——· 核心内容 ·——

一、终极算法的概念

1. 什么是终极算法?

现阶段,机器学习由很多种算法来实现部分所需的功能,比如,朴素贝叶斯算法可以用来诊断癌症和分类垃圾邮件,最近邻算法可用于人脸识别和内容个性化推荐等。也就是说,机器学习存在很多算法,每一种算法可以实现一种或多种功能。这里就出现一个疑问,既然一种算法可以完成多项任务,那么,有没有一种可能的情况是,有一种算法可以处理世界上所有的事情、解决所有的问题呢?

作者为此做出了一个大胆假设,即所有知识,无论是过去的、现在的还是未来的,都有可能通过单个通用学习算法来从数据中获得,这种学习算法被称为超级算法。简单来说,只要能提供充分的、合理的数据,超级算法就能将其变为相应的知识:输入天体运行观测数据,它就能发现物理定律;输入DNA结构数据,它就能解密遗传信息;输入情感需求,它就能写出动情的诗歌、小说乃至电影作品。

2. 终极算法必然存在的原因有哪些?

很多人对计算机可以自主学习这件事儿持怀疑态度,超级算法的强大功能更是被认为遥不可及。但实际上,种种证据表明,现代科学在很多领域都预示了超级算法在不久的将来就会出现。

首先看来自神经科学的证明。神经学家将雪貂的视觉神经连接到听觉大脑皮层上,然后听觉大脑皮层出现了视网膜图像。可见,大脑皮层自始至终只使用了一种学习算法,那些负责不同知觉的区域,区别也仅仅在于与其相连、输入信息的器官不同。

其次看来自进化论的证明。著名计算机先驱查尔斯•巴贝奇说过,上帝创造的不是物种,而是创造物种的算法。进化论就是一种超级算法,只要输入一定量的遗传数据,在其与环境规则的互动中,在求生本能的推动下,不断实现种族的延续和扩张。

最后看来自统计学的证明。贝叶斯定理,常常是统计学派用于机器学习的理论方法。贝叶斯定理的运行逻辑十分简单,即使用“后验”更新“先验”。“先验-修正-后验”,如此简洁的循环过程中创建新知识,贝叶斯定理一定会成为推动终极算法的重要发展力量。

二、机器学习的五大学派

1.符号学派

符号学派的核心理念是逻辑推理,它认为所有信息都可以简化为操作符号,新知识的产生,都是建立在已经存在知识的基础上,通过逻辑推理从而获得。

2.联结学派

联结学派的核心理念是神经网络,它认为所有知识都是通过神经元之间的联系而储存起来的。联结学派就是通过模仿神经网络学习过程来探寻终极算法的。

3.进化学派

进化学派的核心理念是遗传程序,它认为所有形式的学习都源于自然选择,携带遗传信息的染色体在分裂交叉过程中创造出多样化的物种以供自然选择。进化学派是通过模仿基因遗传过程来探寻终极算法的。

4.贝叶斯学派

贝叶斯学派的核心理念是概率推理,它最关注的问题是如何从不确定信息中发现新知识。通过对各种情况可能出现的概率大小进行综合评估,从而发现新知识。贝叶斯学派正是通过概率推理过程来探寻终极算法的。

5.类推学派

类推学派的核心理念是相似性判断,它认为知识学习的关键是要找到事物的相似性。类推学派正是通过寻找事物间的相似性这一路径来探寻终极算法的。

三、终极算法的影响

1. 终极算法是如何改变我们的?

在终极算法的世界里,我的程序就是另一个我。未来社会中,会出现两个我,一个是在现实生活中的我,我们称之为“实我”,主要负责体验和决策;另一个是在虚拟生活中的我,我们称之为“虚我”,主要负责探索和预测。当面对问题时,在“实我”做任何决策之前,“虚我”都会提前完成信息收集、加工、分析和预测整个过程,充分发挥潜能,为“实我”提供最好的选择方案。

2. 为什么说数据公开是未来社会的基石?

现代社会中,相信很多人都会谈数据公开色变,认为数据公开会造成信息泄露,对人身安全有严重的威胁。但未来社会中,大部分情况下是“虚我”与“虚我”之间的沟通联系,这就需要完全的、透明的“实我”信息进行充分交换,虚假的、片面的信息会让这一切都变得毫无意义。比如,如果“实我”想换一个新工作,那么“虚我”就去应聘市场中寻找合适的职位面试,因为“虚我”具有“实我”所有的意识特征,所以“虚我”完全能够代表“实我”参加整个面试过程,由于面试公司也可以根据自己的需求创造一个“虚我”,所以,这场面试就是拥有特定目的和自主意识的虚拟程序之间的交流与博弈,这不仅节省了“实我”的时间,而且也提高了面试公司的工作效率,一举多得。这就是建立在信息公开透明的基础上的未来世界,没有这一基础,这个世界便无法正常运行。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章