Google Earth Blog

http://www.gearthblog.com/

第一条category:3D Models

Google Earth的野心只可能比Google Search还大

Advertisements

How Google Works 摘抄

http://www.baselinemag.com/article2/0,1540,1985040,00.asp

"Would any of you be really proud to have this in your data center?" Merrill asks, pointing to the disorderly stack of servers connected by a tangle of cables.

"But this is the start of the story," he adds, part of an approach that says "don’t necessarily do it the way everyone else did. Just find some way of doing it cheap and effectively—so we can learn."

Previous search engines had not analyzed links in such a systematic way. According to The Google Story, a book by Washington Post writer David Vise and Mark Malseed, Page had noticed that early search engine king AltaVista listed the number of links associated with a page in its search results but didn’t seem to be making any other use of them. Page saw untapped potential.

To cope with these demands, Page and Brin developed a virtual file system that treated the hard drives on multiple computers as one big pool of storage. They called it BigFiles. Rather than save a file to a particular computer, they would save it to BigFiles, which in turn would locate an available chunk of disk space on one of the computers in the server cluster and give the file to that computer to store, while keeping track of which files were stored on which computer. This was the start of what essentially became a distributed computing software infrastructure that runs on top of Linux.

The idea is to "store data reliably even in the presence of unreliable machines,"

A GFS cluster consists of a master server and hundreds or thousands of "chunkservers," the computers that actually store the data. The master server contains all the metadata, including file names, sizes and locations. When an application requests a given file, the master server provides the addresses of the relevant chunkservers. The master also listens for a "heartbeat" from the chunkservers it manages—if the heartbeat stops, the master assigns another server to pick up the slack.

Having studied Google’s publications, he notes that the company has had to tinker with computer science fundamentals in a way that few enterprises would: "I mean, who writes their own file system these days?"

For all the papers it has published, Google refuses to answer many questions. "We generally don’t talk about our strategy … because it’s strategic," Page told Time magazine when interviewed for a Feb. 20 cover story.

"PageRank is well known because Larry published it—well, they’ll never do that again,"

Today, Google seems to have created a very effective "cult of secrecy," he says. "People I know go to Google, and I never hear from them again."

Consider how Google handles project management. Every week, every Google technologist receives an automatically generated e-mail message asking, essentially, what did you do this week and what do you plan to do next week? This homegrown project management system parses the answer it gets back and extracts information to be used for follow-up. So, next week, Merrill explains, the system will ask, "Last week, you said you would do these six things. Did you get them done?"

"What we’re looking for here is lots of accidental cross-pollination," Merrill explains, so that employees in different offices, perhaps in different countries, can find out about other projects that might be relevant to their own work. Despite Google’s reputation for secrecy toward outsiders, internally the watchword is "living out loud," Merrill says. "Everything we do is a 360-degree public discussion."

仍然是视频

互联网周刊:Google的软肋

“ 据美国Hitwise公司5月20日公布的最新数据显示,全球排名前十的视频网站总访问量在过去三个月增加164%。而一个让众多视频服务巨头震撼的数据是,创业仅一年多的视频网站YouTube的访问量一举成为行业之首。YouTube在十大视频网站总访问量中已占43%,远远超过了MySpace.com的24.2%,另外,雅虎视频搜索引擎占9.6%,MSN网站占9.2%,Google网站占6.5%,AOL网站占4.3%。

 正是基于对版权的考虑,Google最初推出视频上传服务的时候设置了诸多障碍,也正是这些障碍影响了用户的参与度,从而导致Google的视频访问量被名不见经传的YouTube轻松超越。

recommended news

 from http://news.google.com/intl/en_us/about_google_news.html#recommended

What are recommended news stories?

Google News can suggest news stories just for you. If you have Personalized Search enabled, you can sign in to your Google Account to get recommended news stories based on your past news selections. These stories are highlighted just under the top news stories on your News page, in a clearly marked section. You can also get a full page of recommended stories by clicking on the section.

Here’s how it works: By signing in to personalized news and keeping Personalized Search enabled, you allow Google to track and save your news selections. Then, Google News can automatically recommend relevant stories just for you by using smart algorithms that analyze your selections. The algorithms compare your tastes to the aggregate tastes of other groups of similar Google News users. Simply put, we recommend news stories to you that have been read by many other users who’ve also read similar stories as you in the past.

The more you use Google News while you’re signed in to your Google Account, the better your recommendations will become over time. Note that we cannot provide recommended news for you if you do not sign in to your Google Account or if you turn off Personalized Search component of personalized Google News.

http://www.enet.com.cn/article/2006/0703/A20060703122423.shtml

google除了搜索外,成功的产品并不多,主要有gmail, news, map。也许跟市场本身有关。开始很火爆的桌面搜索并没有想象中的大红大紫,人们找信息主要还是去网上,自己家的东西不会那么容易找不到,而且也没多少东西。图片,视频,人们已经习惯放到网上共享,或者从网上获取,也就成就了flickr和youtube。桌面其实越来越不重要。互联网是每个人的终极归宿。今天偶尔从NewYork Times看到纽约要在二十个公园里安装无线网,也就是说,你可以惬意的坐在公园的一条长凳上check你的email,聊天,看球,等等,等等。无限的无线互联已经越来越触手可及。

一切仍然跟信息有关。信息只会变得越来越重要。

干任何事情都需要信息。信息是终极决定要素。信息就是这个世界。

越来越多的信息可以直接从网上获取,不需要以咨询任何人。去奥兰多,去西雅图,吃住行都只依赖互联网。google/yahoo map解决行的问题。网上订旅馆解决住的问题,google local搜索附近的中餐馆。天气,景点信息,都可以轻松获得。

我们的需求就是信息的需求。无限的需求就是无限信息的需求。

所以Google只会越来越火爆。所以Google Map/Earth将会成为下一个杀手级应用。真实的世界,虚拟的世界,界限越来越模糊。我们将更加依赖虚拟的世界。因为,我们依赖的只是信息。Google News还没有颠覆传统,但是,他的访问量每年都回翻番。搜索引擎是空气,Map是水,News是早餐。

很显然,Google在个性化的道路上已经走了很久。用户体验是产品竞争力的最关键要素,而个性化则是用户体验的终极目标。某一天,当你走进一家早餐店,你面对的不再是品种齐全却无一符合胃口,而是全都是你所喜欢的口味,还有店主根据你的口味推荐的其他好东西。

信息过剩已经是很多年的词汇了。搜索解决了大部分问题。不过看新闻不能通过搜索解决。新闻与一般的信息不同。新闻就像清晨的蔬菜,越新鲜越好,过了日头就一钱不值了。而且,我们喜欢看什么,不喜欢看什么,并非一两个关键字就可以解决。google recommended news从介绍上来看有点儿类似于amazon的推荐,也就是协同过滤。这已经是很老的技术。为什么一直没有新的技术?难道这个技术已经足够好了么?

继续

改进后,发现我的Google种子已经不比Google的差了,除了没有摘要之外。

http://www.gougou.com/1OQTHE3N

Google的重复性太高,前天出现的新闻今天又会冒出来。而且聚类方面也太过宽泛。

昨天跟老板meeting,没想到他还关心我的抽取想法。给他show了一下这个Google种子,说很popular。老板让我继续,并写一个两页的summary,描述一下背景前途。我当然求之不得。说实话,现在的这个东西已经让我开始蠢蠢欲动了,都想休学创业了。

当然,仅凭一个Google种子是没有前途的。

已经开始考虑自动门户了。嗯,已经有了基本的想法,一些触手可及的想法。

可惜接下来要去实习,真是不爽,若不是因为要挣个买房钱,。。。。

Google SketchUp

http://news.com.com/1606-2_3-6067686.html?part=rss&tag=6067686&subj=news

虽然前几天调试程序时老是看到相关的消息,但一直没有点入链接细看。今天偶尔看到了这个video,又是一身的震撼。也就是说,我的那个什么鸟想法又泡汤了。准备搞什么local map的三维重建的。google的这个东西一出来,所谓的computer vision的方法就可以彻底报废了。虽然是手工建模,但是这个video所展示出来的效率绝对不比所谓的重建低,而且毫无疑问,绝对更加精确,更加漂亮。有一个想法是重合的,那就是每个用户都可以自主提供他们周围常见的三维模型,而所有的这些三维模型,将被集成到google map。google map一旦有了三维模型,virtual city tour就不成问题;接下来,在房屋上贴广告,在马路上贴广告,甚至在天空上贴广告。

Google's works

//昨天去交表,等待的一阵无聊时间里翻了一下Google上次来招聘留下的材料,发现有一张之前没见过,而这一张,却是我最感兴趣的,也是跟我最相关的。这一张基本解答了我的很多问题,比如Google正在干什么?要干什么?要招什么样的人?嗯,不是那种什么一般的engineerer。

//这份材料上的信息网上没有搜到,所以只能摘抄几段了:

//首先最感兴趣的:

We designed and developed a fully automatic news system (news.google.com), which has rapidly become a standard tool for journalists. Custom algorithms group together articles about the same story from different news organizations from around the world, providing diverse viewpoints about the day’s events. Heuristics judge the importance of each story relative to other stories in the news around the world to generate our headline summary pages automatically.

We’re exploring large-scale machine learning as a means of improving search quality. Our spelling correction system is one excellent example (spehl korector? phonitick spewling? who needs a dictniary?). People searching for Britney Spears have clearly found it useful on many occasions. In more recent work, we have been working on algorithms and techniques to construct very large Bayesian network models to help understand the relationships between words.

//ft,又找到链接了:http://labs.google.com/why-google.html

Google购买以色列博士生搜索算法

首先在csdn看到这条消息的

马上搜了一下英文版的消息,有很多,不过大多描述不清,跟中文版的差不多。也就了解那个算法的作者已经到加州工作了。

searchenginewatch上有很详细的报道,不止报道,发现那个作者orion还发过几片帖子

http://blog.searchenginewatch.com/blog/060410-075616

以色列大学网站新闻原文在这儿:

http://www.eurekalert.org/pub_releases/2005-09/uons-nse090605.php

这个地方似乎有详细一些的算法:

http://forums.searchenginewatch.com/showthread.php?p=78298#post78298

还没来得及看。

更早的是去年九月份这个作者贴的一条消息:

http://forums.searchenginewatch.com/showthread.php?t=7757

那个传说中的搜索引擎是不存在的,也许还在假想之中。不过牛逼的概念就已经足够,据说这家伙受到Google, Yahoo和microsoft三方的追逐。另一个方面看,这三家公司是很关注searchenginewatch的,包括他们的论坛。也就是说,即便你是不知道哪个国家的一个无名小子,你在上面写的东西也会时刻被这三家搜索巨头所偷窥的。

//咱们是不是该做些什么了?

再会google

今天Job Fair。本来也要求要事先申请的。但因为昨天的经历,我还是理直气壮过去了。不到3点。幸好去得早,第一,果然放我进了;第二,我出来的时候人都排到街上去了。另外还碰到那个越南同学,他五月份毕业。不过他也不用愁,都公民身份了。

去之前,老板让我询问CPT的有关事宜。他说他又跟那边人电话聊了一下,估计我拿offer应该没问题了。

按理我是不应该再找了。不过还是要去经历一下。

打印了五份简历。还专门针对google改了一下。以前每次打印十份,最多投出去5份,今天?

由于去得早,进屋的时候,各公司招聘的人比学生还多。一Microsoft的家伙竟然直接走过来主动找cindy聊。Google那桌已经有两个学生了。不过昨天那个看起来很cool,满脸胡子,觉得很牛逼的那个家伙闲着。我望着他,他也看到了我。于是我走过去,把简历递给他。不过交流并不是很顺畅。他说我的objective太general,要写清楚。大概是应该写申请什么职位,哪个地方等等。他说他们过滤得很快,直接看objective是不是match。疏忽阿疏忽。然后又聊了些乱七八糟的问题。他有些话我也没听懂。不过给人感觉是他们主要也就是招编程的。也确实,job介绍都要求BS/MS之类。他可能觉得我强调research,就说Google里的每个人都要编程!我说其实我也喜欢编程。他没有问我多少,基本上都是我在问,然后听他将,然后又没听懂,也不知道是不是屋子太小人太多声音太嘈杂的缘故。总之,我估计这次是没什么戏了,简历可能直接就被扔掉了,以后要申请的话,还是要到网上去找,有针对性地写简历和投简历。跟那个Googler说完,想离开了。反正其他的不可能去申请也没多大兴趣。这儿还有Microsoft和Intel。这时人还不多,我四处乱看的时候,一闲着的Microsoft小伙盯着我,我看向他的时候,他还点了一下头,看来不得不过去了。把简历递给他,他问我哪个系的。我说CSE。他来神,问我老板是谁,我说Baoxin。新来的。他说不认识,又问做什么方向,我说computer vision。他说是不是prism?他怎么什么都知道?我说是cubic。他看来知道。他说他也是asu毕业的,2003年,老板是xxxx,他搞操作系统。我问你们要招什么样的人?他拿了一张宣传单,一个职位一个职位给我讲。我有些不耐烦。这些东西跟前N此都一样的。太范。而且这时Yao yisheng站到我后面来了。我有些想尽快结束,把机会让给yao。不过接着还是问了两个问题,第一,你们都用些啥语言?他说主要是c/c++。第二,做啥项目?其实我本意想问项目怎么分配的?他说了一大陀,windows阿,office阿,kernal阿,graphics阿之类。天下人都知道。他说得很兴奋,还滔滔不绝了。等这个问题回答完,我就说直接thanks了,临走他还不忘给我拿了一堆东西,从来不变的那些东西,我都有N份了。投了两份简历,byebye,要去上课了,已经迟到了。出门发现一条长龙排到街上。

前几次Job Fair,对Microsoft哈得一塌糊涂。今天Google来了,感觉他们,算什么阿?当然啦,如果任何一个公司给我offer,再臭再烂,我不会介意的。

对Google心存幻想,是否是虚荣心作怪?

Google Panel Discussion

下午收到系里email。5:00~6:00pm有Google Panel Discussion。但是“ Google will be meeting with students who have submitted an RSVP for the Panel Discussion.  RSVPs are no longer being accepted, due to venue size. ”。我搞忘submit了,wk!两个星期前就收到通知,但当时看到信没有立即回,结果就彻底搞忘了,wk~。郁闷阿郁闷~

cindy submit过了。我让她帮我问几个问题,第一个是搜索引擎还有多大发展余地?还有一个是中国研究院的定位是什么?那时困得厉害,打算回去睡觉。结果拖着差不多要到5点了。虽然不能参加,还是跟cindy过去看看,瞧瞧也是好的。

一路上埋怨自己“人怎么做成这样?”

果然,门口有个人对照名单check名字。我说这下彻底傻逼了,回去吧?不过还是赖着没走,就算陪着cindy吧,这会儿也没啥人,离开始还有几分钟。这时见一mm走出来,华人,准确地说感觉她是中国人,面容可掬,让人觉得亲切,不是特别漂亮,但漂亮得刚刚好。她的衣服上有Google的logo。看来是Google员工。我很想立马走过去,问她两个问题,是不是中国人?怎么进Google的?不过这些都是想法,还没成为现实,也不可能成为现实。我傻站着,浑身发热。想进去,不能,想回去,不舍。我站着干嘛呢?cindy在那边折腾了半天,我走过去。那个看门的一直没找到她名字。最后怀疑她是submit了明天的job fair,而不是今天的panel discussion。看来cindy也不能进去。不过cindy不甘。她说那个人说过,我们可以先等着,如果有空位的话就进去。有可能有空位么?外面都已经站四五个人了。我说回吧。但她坚持不走,其实我也不愿。我说那就到旁边的lab歇着吧。刚刚进去,她说她有email!于是急忙跑回去打印email。果然,凭借那个email,她能进去了。我呢,继续干坐着。准备等没什么人了就回去。感觉过了很久很久,5点过两分的样子,突然听见一阵掌声。立马提起书包,冲了出去。门口有些人,屋里面有人站着!这些人肯定没门票吧?心中一喜。这时cindy看到我,朝我直招手,让我进去。我于是毫不犹豫冲了进去,在门口和看门的ppmm擦背而过。还好,她没拦我。

站着真舒服~

大家已经各就各位,包括Goolge的几位员工。有两位员工没凳子,就直接做到了旁边的桌子上,嗯,够随意。这几位员工没一人穿西装,没一人穿衬衫,大多T恤。有一哥们,上面短袖衬衫,下面一短裤,加一球鞋,小腿的黑毛暴露无遗。还把其中一只腿盘在椅子上。

学生仍然陆续涌进来,不断填充本来已经很拥挤的屋子。一哥们没地方站,怕挡住别人视线,就直接跪在我前面了。哦,我好幸福。

看了一下Job简介的材料。看到很多东西。

1。四种职位,有三个明确要求Java。

2。也有c/c++,但没见到c#, .net这类的词。

3。XP。也就是extreme programming。看来Google是用XP的。

4。没有PHD这个字眼。都是BS/MS。而且in CS。

5。Perl, Python, such Scripting Language。

6。Internet/Web

7。MySQL database experience is ideal, but other major database such as Oracle are also acceptable

8。A track record of "getting things donw" and ability to make pragmatic compromises to make progress.

9。billing and financial system。看来取代ebay的新闻非虚。

现在手头只有一张单子,还缺一张。不过就这张已经给出了很多信息。比上次Microsoft的job description明确多了。

这个Panel Discussion基本上也就是Googler简单介绍,然后大家提问题。开始第一个人滔滔不绝介绍的时候,旁边一家伙就突然打断,冒昧提了一个问题。我觉得很好。就是Google内部是不是有个Ajax的开发框架,或者工具包之类的东西。年纪最大的那个发话了。那个家伙一直很cool,不苟言笑,还似乎漫不经心,满脸胡子,但一看就知道是高手那种。他说他们内部经常开发各种各样的工具,甚至还有语言!这个一下把我给震蒙了。就凭这一句,站一个多小时,值了!接下来的一些东西,基本都在意料之中。有人提问80/20。也就是工作时间20%干任何自己想干的活儿,可以跟工作无关。这个老早就知道。不过陆续还是了解到很多新的东西。

1。最大的team是9个人,这已经算是huge team了。所以一般大家坐在一起。

2。flat management。而且程序员不用给那个似乎有点儿manager职责的人汇报任何东西。manager相当于不存在。

3。内部很开放。大家随便聊,不同项目的人相互接纳,相互演示。如果你觉得你有改进的点子,即使你不是这个项目组的,你也可以去做,去check out source code,研究研究,改进改进,没人反对。不像很多其他公司,项目组成员对外封闭,生怕人家碰,也懒得介绍。

4。没有什么时限压力。不是接一个又一个单子,一定要赶在什么什么时间前完成。也不做这样的项目。

5。为什么选tempe?说是其实调查过很多地方,有N个criteria。而tempe,已经被选中的,就是最合适的了。其中提到说是有些员工喜欢溜狗,需要选一个可以溜狗的地方。

7。广告市场有400billion的份额。google目前只占1%。所以,。。。如果能再扩大1%,是什么结果?

还有很多东西,不过记不清了。很多老外的话也没听清楚,也不知道是不是因为下午很困又没睡觉脑袋不清醒的缘故。

另外还有一点,就是没有提到search engine这个东西。job里也没这个。也就是说,只要你编程牛逼就行?

有人问research之类的东西,也没听清回答。感觉上他们不是很care。但是Dr. Ye前几天跟我说,只要是搞data mining的,很容易进Google。

之前还想申请internship的,还想在春假改进RSS种子,以做一个show的,结果。。。而且,老板力荐我去sharp,星期一的电话面试也感觉很好。。。。明天的job fair还是去还是不去?还恰好有课。

散场的时候cindy问了那个华裔mm一堆问题。说完那个mm也朝我笑了笑。但终究我没上前搭话,挥了挥手,扭头跟cindy一起出去了。出门就一直后悔。哎,真是没出息!

无论如何,就像上次,参加Google的活动感觉就像过节。兴奋、期盼、回味。

嗯,对了,还搞了件印有Google logo的T恤。还是cindy给我的,她不小心(还是故意?)拿了两件。我挤呀挤,开始拿了一件,XL,可为什么还这么小?后来有人说我拿的是girl的,仔细一看,果然。又挤呀挤,挤呀挤,好不容易挤到桌子前,可是茫茫一片好干净,桌子空空如也。旁边的一个个,人手一件,满足的散开了。哎,真是没出息啊!我摊开空白的双手,向cindy讲述我悲惨的遭遇,“无所谓了”我说。她说,她多一件!

不过即使有了我也不敢穿,名不副实。要人家问我怎么办?我岂不是冒牌?