夏武

夏武的分享

他的个人主页  他的分享

ALEXA创始人布鲁斯特·卡尔:互联网档案(Internet Archive)

夏武   2009年09月16日 星期三 12:31 | 0条评论

对网络有一些了解的人应该都听说过或使用过网站流量分析公司Alexa的产品,这间于1999年被亚马逊公司(Amazon)收购的其创始人正是布鲁斯特·卡尔(Brewster Kahle)。除了广为人知的Alexa外,卡尔于1996年创办了互联网档案(Internet Archive)公司,致力于建造一座基于互联网的数字图书馆。他尝试像亚马逊一样,按照文字、音频、视频等分类,将人类有史以来的知识全部有条理地进行归档。在他看来,我们再也无需运输图书到偏远地区,通过一辆带有打印机、装裱机、并可联网的小面包车,即可无国界传播知识。人们仅需花费1美元便能获得一本新鲜出炉的图书,并且不用将这本书归还给图书馆。

这一工程更为重大的意义在于,知识从此变得真正唾手可得,自古至今全人类的智慧将在我们面前全然展现。经过成本核算和方法考证后,卡尔得出结论,我们完全有能力将世界上所有的知识归档存储。

卡尔建造数字图书馆的方法并不复杂。他采取扫描的方法来收集图书,采用录制来的方法收集音像,通过截屏来记录互联网发展进程。卡尔想过用100美元笔记本儿童笔记本电脑(OLPC)或亚马逊公司的Kindle作为阅读工具,但他最终还是选择了用数字的方式存储知识,用纸张的方式学习知识。这种传统的终端虽然不怎么酷,但可以更有效地传播知识。

获得世界银行资助后,卡尔在硅谷招兵买马前往乌干达开始他们的第一次尝试。他们在乌干达国家图书馆建立了第一个互联网连接点,努力了解当地人民的需求,并在乌干达郊区开设制作图书的项目。卡尔向我们介绍了一种使用传送带运作的图书制作工具“浓缩图书机器”,就好象用浓缩咖啡机制作咖啡一样,只需按下按钮,10分钟即可制作出一本图书。

当然,扫描并储存图书的过程是有些枯燥的。经过一番实践后,卡尔发现应当让大家扫描自己的图书,而不是请专人进行全盘扫描,因为只有非常在意自己手中的图书,才会认真扫描,并乐在其中。而如果是新书的话,人们宁可捐赠掉再去买一本。卡尔告诉我们,迄今为止,印度人已经扫描了大约30万册图书,中国人扫描了超过100万册,而埃及人大约扫描了3万册。

一旦形成规模,卡尔的互联网档案公司即可以10美分/页的成本建立数字图书馆。一般的图书平均300页,也就是说,制作一册数字图书的成本是30美元。如果要将美国国会图书馆的2600万本藏书全部归档,需要耗资7.5亿美元。卡尔认为可以先从100万册图书开始做,那就只需3000万美元了。互联网档案公司已经扫描了20万册图书,他们目前每月扫描1.5万册,并在互联网上公开了25万册图书。卡尔建议将稀有或已经过了版权保护期的图书的数字资料,放到网上让大家免费阅读。

音频记录 方面,互联网档案公司只需10美金即可归档一张唱片,并将其放到互联网上。在这里,版权自然是一个很重要的问题。卡尔开玩笑说,如果向慈善机构或者公众捐赠,可以免税,然而在互联网上,却可能因为提供免费产品而破产。但是知识的传播不应该受到金钱的限制。卡尔表示,互联网档案公司将向任何想要和数字图书馆分享知识的人,永远提供无限量存储和无限量带宽。目前,每天大约有2-3支乐队同互联网档案公司签约,同意他们录制乐队的演唱会。互联网档案公司每天需要录制40-50场演唱会。光是Grateful Dead乐队,互联网档案公司已经录制了四万场演唱会,人们可以自行在网上收看或收听。

视频 方面,卡尔还带领他的团队存储了一些政治题材和非专业类电影。他并不是要将自己变为YouTube,而是旨在让人们以后可以重新使用这些影片中的素材制作新的电影。而电视方面,他们则全天录制20个电视频道的节目,包括俄罗斯、中国、日本、伊拉克、半岛电视台、BBC、CNN、ABC、CBS和NBC电视台,目前存储规模已达到千兆兆字节。不过出于成本因素,他们目前只在网上放了911事件发生那一周的电视节目。人们可以看到不同国家对于这次事件的不同观点。归档这些电视视频的成本是每小时15美金,电影存储的成本则为每小时100-150美金。目前,互联网文档公司仅在网上放了约万条视频,主要的障碍还是法律和版权的问题。

除了图书、音频和视频,卡尔最为著名的归档项目仍然是在他的老本家互联网行业。互联网档案公司从1996年开始每隔2个月抓取每一家网站的每一张页面,并发明了一种 时光机 ,让人们可以看到这些网站从前的模样,比如Google的Alpha测试版本、尚在斯坦福大学运行的版本等。

通过存储在图书、音频、视频和互联网四大类别的信息,卡尔和他的团队可以将人类文明囊括其中。其实,这种收藏人类知识的想法,早在图书馆诞生之处便已经有了。著名的古埃及亚历山大图书馆就是以收藏人类所有知识作为目标,皓首穷经,在2000多年之前就能集50万馆藏之巨。可惜的是,这座图书馆于公元五世纪毁于一场火灾,其珍藏的大量古代智慧也随之永远消逝。

为了防止类似的灾难,互联网档案公司将他们的存储制作了多份拷贝,并将其中一份放在了重建后的亚历山大图书馆中。他们目前正在阿姆斯特丹的洪水区储存第二份拷贝,并计划在旧金山圣安德利亚断层和中东都放置一份拷贝。

卡尔的举措无疑令人感到振奋。借助高科技的手段,人们得以重现亚历山大图书馆昔时的辉煌,记录和传承悠久的人类文明。从这一角度来说,任何法律、版权都不应当是绊脚石。毕竟,法律和版权的限制正是为了鼓励知识创新,而建立公众图书馆的目的也是为了通过传授知识实现创新。剩下的问题恐怕是,如何在信息四通八达,所有知识都伸手可及的情况下,有效找到自己需要的信息,在茫茫书海中寻到适合自己的图书?

评论

我的评论:

发表评论

请 登录 后发表评论。还没有在Zeuux哲思注册吗?现在 注册 !

暂时没有评论

Zeuux © 2024

京ICP备05028076号