Archive互联网的博物馆存档 查看不同时期的网页!

Archive互联网的博物馆存档 查看不同时期的网页!
SunwayWayback Machine介绍
互联网历史博物馆( Internet Archive: Wayback Machine )是一个帮你找回网站历史的在线博物馆,相当于页面快照,能查看一些被404的页面缓存,从1996年以来,它就开始给整个互联网做备份。该网站创建于1996年,由Alexa创始人布鲁斯特·卡利( Brewster Kahle )创办,是一个公益性质的计划,通过定期收录和抓取全球网站的信息,并进行保存,
到目前为止,它已经保存了6350亿个网页(截止2021年12月)
正确的来说,这是全球Internet Archive 互联网档案计划、互联网档案馆(The Internet Archive),自1996年成立起,The Internet Archive定期收录并永久保存全球网站上可以抓取的信息。
看看QQ.COM存档了多少网页快照
简介
由 Alexa 创始人布鲁斯特·卡利(Brewster Kahle)创办,是一个Wayback machine公益性质的计划。Internet Archive 非正式中文名有“网站时光倒流机器”、“互联网档案馆”等。对于不同的网站,其收录的网页数量和收集周期也不相同,一些大型网站可能每天都会被“备份”一次,每次可能收录数十个以上的网页,而一些小型网站可能每年收录几次,每次只有几个网页。对网站不同时期的历史资料进行研究,是互联网档案馆最大的价值所在。用户可以通过 Internet Archive 的“Take Me Back”对网站的发展与历史资料进行研究。
互联网档案计划
“互联网档案计划”分为六大部分:
一、电子书
这个部分,我以前已经介绍过了,它专门收集公共领域的书籍和文档,任何人都可以免费下载。截至到今天,共有29万多种材料,堪称互联网上最好的公共领域图书搜索引擎。
它主要收集英语书籍,但也包括少部分其他语种的书籍,比如朱熹的《论语集注》。
二、网页
光倒流机器”截图 2012.08
这个部分有个专门的名字,叫做”时光倒流机器“(Wayback Machine),它像收集旧报纸那样收集旧网页。举例来说,Yahoo!的首页就有5000多份档案,最早的可以回溯到1996年10月17日,最近的则是2007年8月30日。
要将全世界的网页都保存下来,这需要多大的存储容量啊?根据2006年的统计,当时Wayback Machine的存储容量有2000T,然后还在以每月20T的速度增加。
三、视频
这个部分收集视频材料,你在其中可以找到动画片和电影。
四、音频
音频材料主要是有声书籍和音乐。
五、软件
六、教育材料
这部分主要是美国大学课程,有视频和文字材料下载,相当于不去北美就可以上那里的课,比如麻省理工学院的《微分方程》和Naropa大学的《艾伦·金斯堡的诗歌》。
延申阅读
印度:宝莱坞封禁互联网档案馆
日前,互联网档案馆在印度遭到封杀。此举似乎是两家宝莱坞电影生产公司试图禁止国内用户在线观看盗版电影的结果。政府机构向英国广播公司发送了一份法院判决的副本,其中列出了2650个法官下令封禁的互联网提供商,也包括互联网档案馆。
互联网档案馆成立于1996年,这项旧金山非营利计划以其“时光倒流机器”(Wayback Machine)而闻名。“时光倒流机器”是允许公众查看旧版网站的在线工具。
8月2日,印度马德拉斯司法部高等法院正式颁布网站禁令。印度的用户一旦尝试访问网站就会被告知:“该页面已受到政府电信部限制”。由于这一举措并没有说明屏蔽的原因,所以一度引发了混乱。政府新闻信息局局长Shambhu Choudhary告诉英国广播公司:“法院和安全机构封禁某些网站,有时是可以不公开原因的。”
互联网档案馆曾将此事告知Medianama新闻网站,办公室经理Chris Butler表示:“显然,我们对此事感到既失望又担心,迫切需要了解为什么会出现这种情况,并希望能够尽快恢复网民的访问权限。”
据印度互联网和移动协会统计,在2016年年中,全国共有462.1万互联网用户,其网民数量在中国之后位居世界第二。而早在2014年,政府为防止社交媒体为“圣战”宣传提供途径,印度电信部曾要求本地互联网服务提供商与Vimeo,Daily Motion以及其他29家热门网站共同封禁互联网档案馆。
很多人说,以后都无纸化办公了,是不是就没有档案了。我们了解一下档案的定义为:
档案是指过去和现在的国家机关、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史纪录。
从定义上我们就不难看出档案的载体不只局限于纸张,包括了以往历史产生的:竹简、甲骨,金石等各种载体档案,还包括了目前产生的:网页、电子数据等等。
有趣的事情,可以自己手动给某个觉得有意思的网站拍个照!
以后就不怕找不到了!!