-
archive
(位於舊金山的互聯網檔案館)
鎖定
提供數字數據如網站、音樂、動態圖像、和數百萬書籍的永久性免費存儲及獲取。迄至2012年10月,其信息儲量達到10PB。除此之外,該檔案館也是網絡開放與自由化的倡議者之一。
- 中文名
- 互聯網檔案館
- 外文名
- archive
- 應用程序
- archive -archive.exe- 進程信息
- 進程名稱
- : BW-based SpyWare
- 出品者:
- 未知N/A
archive組織簡介
互聯網檔案館(英語:Internet Archive)是一個非營利性的數字圖書館組織。成立於1996年,由Alexa創始人布魯斯特·卡利創辦。提供數字數據如網站、音樂、動態圖像、和數百萬書籍的永久性免費存儲及獲取。迄至2012年10月,其信息儲量達到10PB。除此之外,該檔案館也是網絡開放與自由化的倡議者之一。
其數據是由自帶的網絡爬蟲自動蒐集的,其網站典藏檔案館網站時光機,抓取了超過1500億的網頁。
archive組織歷史
1996年,卡利在創建盈利性的Alexa Internet時同時也創立了互聯網檔案館;同年10月開始收集存儲數據。不過,直到2001年開發了“時光機”前,這些數據都無法訪問。1999年末擴展收集範圍。
2012年8月,宣佈將在其現存的130萬文件的下載選項中加入BitTorrent。因為通過兩個文件數據中心協調,這成為從該檔案館下載數據的最快方法。
2013年11月6日,檔案館在里奇蒙德區的總部失火,損壞了許多設備和一些附近的公寓,預計損失達到60萬美元。
archive網頁存檔
時光機
網站時光機是互聯網檔案館最重要的服務之一。其名取自一部名為The Rocky and Bullwinkle Show的美國卡通片,時光機允許人們去搜索和訪問其網頁存檔。在一些國家和地區,時光機這個術語的使用已經非常普遍,“時光機”和“互聯網檔案館”甚至開始被當做同義詞使用。
Archive-It
Archive-it是一款幫助機構和個人創建存檔的工具。一旦目標網站的URL被輸入並保存且該網站允許互聯網檔案館所使用的Robots.txt訪問,該網頁將會成為時光機的一部分。截至2014年3月,Archive-it在美國的46個州和其他16個國家共有超過275個機構是其合作伙伴,共有超過74億個網頁的在線存檔。
[1]
archive收集書目
互聯網檔案館收集了世界各地的數字化圖書以及各大圖書館和文化遺產機構的特殊藏品。互聯網檔案館在5個國家經營着33個圖書掃描中心,其活動受圖書館和基金會的財政支持。截至2013年7月,檔案館共收集了440萬本書,每月的下載量超過1500萬。截至2008年11月,檔案館共有100萬個網絡文本,總大小高達0.5PB,涵蓋了原始照相圖像、裁剪和歪斜的圖像、PDF文件和原始OCR數據。
[1]
archive視頻資料
除了上述內容之外,互聯網檔案庫還收集了大量的數字媒體,這些數字媒體均匹配美國公共領域或CC授權協議。這些媒體文件均會根據媒體類型(moving images、audio、text、etc.)被組織成集合,並根據各項標準被分入子集合。例如大都會藝術博物館提供的相關資料就會被分入一個子集,目前該集合相關資料的數量已經超過了140,000個。每個主集合都含有一個“社區”子集合(以前被稱為“開源”)用於存儲公眾的貢獻。
[1]
archive相關事件
- 參考資料
-
- 1. Kahle, Brewster (August 7, 2012). "Over 1,000,000 Torrents of Downloadable Books, Music, and Movies". Internet Archive Blogs.
- 2. 美法官裁定互聯網檔案館數字圖書借閲侵權 .界面新聞.2023-03-25[引用日期2023-03-25]
- 3. 美法官裁定互聯網檔案館數字圖書借閲侵權 .百家號.2023-03-25