乱七八糟

这两天圣诞节放假

难得有一天在家休息,啥也不用干

弄了一天的reinforcement learning,用别人的代码做了些小实验

感觉又回到大学的美好时光

脑子里想着新学到的东西,用新学到的东西解决什么样的事情,还有很多不明白的地方反复咀嚼

感觉真好

扫过一片网上文章,说machine learning大概三块,supervised learning, unsupervised learning和reinforcement learning。

前两个都比较熟,reinforcement读书的时候看过,但是从来没机会用到过

现在因着alphago的缘故又火起来了,自己也趁着搞计算机围棋的缘故重新学这些东西

发现这个领域其实近十年还是进展了不少。特别是解决了以前从来没想到过的问题。比如打游戏。从pixel到决策这个事情以前可能大家想都没想过。

又一个基础设施进步推动上层进步的案例。

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s