[三观颠覆之四]元智慧,第四次工业革命的开端?

第一次工业革命,机器取代手工。纺织机发明,蒸汽机车发明。

第二次工业革命,电力,电话,汽车。

第三次工业革命,电脑,互联网?

每一次进步,都是生产效率的极大提高。每一次,都是机器的进步。

alphago的横空出世,会算是第四次工业革命的开端么?

很多年前学习马列,说工业革命时机器吃人。而那时,我们还觉得机器,也就是重复做一些事先制定好的动作的东西而已。没有人的智慧,机器不过是废铁。或者说,机器的智慧,归根结底是人的智慧。

电脑出现后,计算机的运算能力瞬间超越人类,并且突飞猛进。人类写各式的软件,帮助做各类的运算。但是,我们还是觉得这还是人的智慧。不过是人设计的算法加上高速的运算而已。

即使是深蓝战胜了卡斯帕罗夫,也不过是穷举而已。

围棋是个特殊的东西。穷举行不通。下围棋的人讨论的很多都是大场,厚味,打入,先手,本手这些很虚但又是大家能理解的东西。这些东西无法定义。它是棋手共有的一种感觉。从来没有人说通过计算来衡量这种感觉。

alphago如何学到这种感觉的?它又是如何定义这种感觉的?

当alphago战胜创始人时,它是如何自我超越的?

当它的技术和机器人结合,可以自己学习投篮,踢球,做汉堡,炒菜,送货,开车,甚至设计。

alphago所拥有的智慧,是一种元智慧么?meta intelligence。一种能自我寻找并且掌握智慧的能力。

这一次,人类会真的被机器吃掉么?

[三观颠覆之三]机器成为人类的老师

樊麾获应氏杯参赛资格 将执裁谷李人机大战

代表法国参赛的樊麾二段表现出色,击败各路竞争对手,取得冠军,获得代表欧洲参加今年4月举行的第8届应氏杯世界职业围棋锦标赛的资格。
取得欧洲职业冠军杯后,樊麾表示自己状态回升不错,而且感觉与电脑对弈之后,实力境界有所提升

三人行,必有我师焉

在未来,机器必为我师

人类老师是人,精力有限,耐心有限。而机器的精力和耐心是无限的。

人类老师很多是庸师,毁人不倦。而机器的质量是绝对有保证的。

人类老师很容易被超越。而机器的水平可以超过人类一大截。

我看到在一个大山上,机器站在高处,拖住人类往上攀登。

[三观颠覆之二]成长,学习和经历

“读万卷书,行万里路” — 董其昌

“读书破万卷,下笔如有神。”– 杜甫

alphago的智能系统来自于三个支柱:1,读谱,学习前人下法,policy network通过阅读数百万的棋谱来预测棋盘上每一点的价值。2,价值评估,value network,这个也是通过无数的棋谱来获得一种局面优劣的的直觉,3。计算,蒙特卡洛树搜索,形势复杂时,必须算很多步才可以找到安全或者好的一招。

这三个支柱基本上跟人下棋用到的方法一样。

但是alphago的终极武器不是这个,而是自我学习。

而自我学习,也是一个人,一个社会进步的终极动力。

一个人从诞生之日,就开始了自我学习之旅。它开始只能躺着,转动眼球,小手胡乱挥舞。它不断的动五个指头,挥动手臂,慢慢它学会抓东西。慢慢学会翻身。慢慢学会爬,慢慢学会直立,慢慢学会行走,慢慢学会跑。每一个进步,在成人看来理所当然,而对它来说是费尽了无数次的失败与尝试的结果。它很辛勤的学习,让自己健康的成长。

当我们逐渐长大,我们反而忘记了学习的重要,丧失了学习的热情。我们骄傲的以为我们学够了。

而alphago就像一个初生的婴孩,它不知疲倦的学习。

三月初人机大战之时,它能达到李世石的高度吗?

达到之后,它还能进步多远?人类会被它甩多远?

自我学习又是什么?

婴孩是如何学会抓东西的?它如何学习直立起来的?

也许答案都可以从alphago里面找到。

这个玩意叫reinforcement learning,强化学习。

很多年前读人工智能时,学到过一个算法。但是这么些年还从未用过。

一个人在学习投篮时,他必须不断的练习,不断的尝试,根据反馈来调整自己的动作。这就是强化学习。

一个人之所以成熟,乃是经历了很多的风霜。

爱迪生尝试了很多的材料,经历了无数的失败,终于发明灯泡。

可以说,进步源于不断的尝试。失败是成功的必要组成部分。

而这本质上都是强化学习。

alphago通过不断的左右互搏来进化自己。它终将成为什么样的超级怪兽呢?

[三观颠覆之一]向机器学习

这几天几乎每天跟crazy stone下棋

发现收获不少东西

最重要的一条收获是

当你棋形很薄时,机器会毫不留情的进行攻击,直到把你摧毁

以前跟人下棋,即使你的棋很薄,人家不一定会攻击,即使攻击也会谨慎再三。

但是机器不一样。在几乎所有攻击前,它已经算得很清楚。结果只有一个,就是你肯定吃亏。

棋下得薄一般是因为攻击别人后不愿意多花一两手补棋。攻击有成就感,会有优势感。而补棋则缺乏成就感,让人觉得浪费宝贵的一手。

其实在生活和工作中这样的例子很多。我们总是去做很多事情,去接很多事情做。但是往往一个事情做一半或者糊弄糊弄就结束了。然后又忙着开始下一个事情。后来到处起火,因为之前事情没做周全。

比如写代码,如果前期缺乏详尽的测试,后面bug迟早会冒出来,搞得你焦头烂额。

比如政府的initiatives。前两天又看到奥巴马要花40亿美金搞计算机教育。政府的工程一个又一个,出来的时候漫天新闻。结果是绝大部分失败。失败的时候基本上没人关注。

比如读书。读了一本又一本,却很少有消化,很少有回头再读,很少有应用到生活中。

比如我们的生活。我们总是想做好人。答应这个,答应那个。结果一个也干不成。

我们的应酬和工作总是应接不暇。以至于没有时间陪伴家人。没有时间好好反省。

计算机的每一步都是深思熟虑,而我们很多时候都是用下半身思考。

计算机会注意到潜在的危险而甘愿补棋。而我们总是心存侥幸以至于真的被自己蒙蔽。