三观颠覆之五:智慧中的三位一体

Alphago智慧的三个基石:1直觉系统,2蒙特卡洛搜索,3价值系统。

直觉系统根据当前棋盘画面来感觉哪些点比较好。纯粹的直觉。

蒙特卡洛搜索自己跟自己下,穷尽几十步双方的招数。进而推算当前每个点的赢棋概率。

价值系统评估当前局面的优劣。

三位一体,缺一不可。

计算机左右互搏,也算是蒙特卡洛搜索。左右互搏积累大量的经验,经验被吸纳到直觉系统和价值系统。直觉系统和价值系统的改善,又促进左右互搏的质量。这构成了一个智慧增长的正循环。

它不断的进化。以至于无论是直觉系统还是价值系统都超过了人类,更不用说几百几千个GPU执行蒙特卡洛搜索了。以至于它的棋和对局势的判断已经超出了人类的理解范畴。就像当初吴清源的棋超出了众日本高手的理解范畴。

这一天竟然在有生之年到来了,真是三生有幸啊。

Alphago就像一面镜子,照出人类的狂妄,自大和无知。

三位一体。任何一位出了问题都不可以。那么,人活在这个世界,他的正确的直觉系统和价值系统又该是什么呢?又该如何训练呢?

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s