中国开发网: 论坛: 程序员情感CBD: 贴子 619460
haitao
美国国会图书馆不堪 数据爆炸 重负
美国国会图书馆不堪数据爆炸重负

ugmbbc发布于 2008-04-10 18:30:42|1636 次阅读 字体:大 小 打印预览


如果你认为你的企业在处理日益增长的数据方面已经遇到问题,不妨考虑下国会图书馆的做法.美国国会图书馆负责战略计划部副主管Laura Campbell说:"数字化革命的意义,堪比500多年前利用活字印刷技术印刷出的第一本书."在国会图书馆成立以来的208年历史中,它一共收集了1.38亿册图书,那些书籍包括450种语言文字,从手稿到图册以及录音各不相同,但是网络时代的来临,又给国会图书馆提出了新的挑战.



Campbell在今天早上发表演讲时说:"我们估计在如今这个数字信息时代,每15分钟创造出的信息数量相当于国会图书馆目前保存的所有数据和信息的总量. 图书馆已经不能再毫无选择地兼收并蓄了."

  从电视节目到网页,从地图到电子文档,Campbell和同事们不得不设法为国会图书馆制定一套全新的收藏策略.

  图书馆现在拥有500多TB的数字资料,分别存储在三个数据中心,采用了各种存储技术.她说:"我们利用了各种数据存储,包括在线的、本地的以及磁带. 大约有一半的数字资料是存储在本地存储和网络存储上."

  虽然存储的成本一直在下降,但是国会图书馆仍然遇到了数量多得难以想象的数据,最终图书馆不得不与大量政府和商业组织合作才能解决数据的存储问题.

  为了帮助图书馆设计其存储系统以及开发具体的维护工具,官员们还必须决定保存哪些数字资料而不保存其他的数字资料.

  Campbell说:"从学术界到技术公司,合作伙伴们免费提供了大量的技术. "

  图书馆与合作伙伴们启动了大量的计划,包括图书馆与电影艺术与科学学院合作展开的"保留创意的美国"计划等.另一项重要的保存措施是图书馆联合100个州政府和商业合作伙伴成立了全国内容管理员联合会,到目前为止,这个联合会已经保存了300TB的数字资料.

  Campbell说:"到2013年时,这个数据将增加到650TB."她解释说,国会图书馆还同微软和谷歌建立了合作伙伴关系.另外,谷歌也同密执安大学共同展开了规模宏大的图书数字化工程.

  虽然数字化保存并不难,但是官员们敦促存储厂商们协助图书馆解决各种数据问题.她说:"对于我们图书馆的网络来说,第三方存储是一种很重要的服务. 我希望你们会对此感兴趣并与我们联系加入事宜."

  除了国会图书馆的技术主管之外,其他许多人也在今天的SNW大会上谈到了数字保存的问题. IBM的系统存储业务总经理Andy Monshaw在发表演讲时说:"我在欧洲见过一些大型国立图书馆,它们保存的许多内容所需的应用软件现在已经不存在了."

  他说:"他们现在正在考虑如何解决这个问题. 这主要是维护和确保今后可以使用的问题."

文/存储在线
我的blog:http://szhaitao.blog.hexun.com & http://www.hoolee.com/user/haitao
--以上均为泛泛之谈--
不尽牛人滚滚来,无边硬伤纷纷现 人在江湖(出来的),哪能不挨刀(总归是要的)
网络对话,歧义纷生;你以为明白了对方的话,其实呢?

您所在的IP暂时不能使用低版本的QQ,请到:http://im.qq.com/下载安装最新版的QQ,感谢您对QQ的支持和使用

相关信息:


欢迎光临本社区,您还没有登录,不能发贴子。请在 这里登录