data centric

其实任何系统应该是data centric

而不是program centric

program只是一个工具,用来呈现,收集和存储数据

数据本身才是真正有用的东西

program centric的问题之一就是data quality的问题缺少关注

一个程序员似乎写完程序就算是交差了,就算是完成任务了

但真正的任务才刚刚开始

每个程序都会有很多的对数据的assumption

一旦坏数据流进来,或者corrupt,系统就会崩溃

而这些都是不可预期的

所以持续的数据质量监测非常有必要

也许比系统延迟,测试覆盖,正常编译这些系统健康指标更加重要

data centric带来的另一个改变是把data作为最关键的资产,比程序更关键

虽然传统的database提供了很多好的工具,但是database本身仍然只是工具

与先进的source control工具比起来,database的工具这么多年也没有什么变化

source control工具的一个关键理念是immutable。而database没有。

source control工具还有很多merge, release, version的概念,database也没有。

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s