不检查是一种骄傲

今天本来想找一下2005年写的blog

之前blogdriver要关的时候写过一个crawler把内容弄下来过,存成xml文件

今天打开发现只有从9月开始的

又跑到internet archive上去找,有一些能看到,但是大部分都找不到

数据丢失了就再找不回了,哎

当初把数据抓取完为什么不仔细检查一下内容呢

其实就是太骄傲了,觉得自己写的程序肯定没问题

这些日子在公司做数据处理也发现了这种情况

很多人写完程序运行一下就完事了,也不好好看看数据对不对,有没有问题。有问题是什么原因造成的?哪儿出了问题?

这种情况一定得想办法解决。数据量小,就人工看看。数据量大,得弄些摘要和规则检查一下。

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s