複製鏈接
請複製以下鏈接發送給好友

URI

(標識、定位任何資源的字符串)

鎖定
在電腦術語中,統一資源標識符(Uniform Resource Identifier,URI)是一個用於標識某一互聯網資源名稱的字符串。 該種標識允許用户對任何(包括本地和互聯網)的資源通過特定的協議進行交互操作。URI由包括確定語法和相關協議的方案所定義。
Web上可用的每種資源 -HTML文檔、圖像、視頻片段、程序等 - 由一個通用資源標識符(Uniform Resource Identifier, 簡稱URI)進行定位。
中文名
統一資源標識符
外文名
UniformResourceIdentifier
英文縮寫
URI
應    用
萬維網
性    質
電腦術語
釋    義
是一個用於標識某一互聯網資源名稱的字符串

URI歷史

URI發展

URI與URL有着共同的歷史。在1990年,Tim Berners-Lee的關於超文本的提案間接地引入了使用URL作為一個表示超鏈接目標資源的短字符串的概念。當時,人們稱之為“超文本名”或“文檔名”。
在之後的三年半中,由於萬維網的HTML(超文本標記語言)核心技術、HTTP與瀏覽器都得到了發展,區別提供資源訪問和資源標記的兩種字符串的必要性開始顯現。雖然其時尚未被正式定義,但“統一資源定位符”這一術語開始被用於代表前者,而後者則由“統一資源名稱”所表示。
在關於定義URL和URN的爭論中,人們注意到兩者事實上基於同一個基礎的“資源標識”的概念。在1994年6月,IETF發佈了Berners-Lee的RFC 1630,(非正式地)指出了URL和URN的存在,並進一步定義了“通用資源標識符”——語義和語法由具體協議規定的類URL字符串的規範文法。此外,該RFC文檔亦嘗試定義了其時正被使用着的URL協議的文法,同時指出(但並未標準化)了相對URL和片段標識符的存在。

URI標準改良

1994年12月,RFC 1738 正式定義了絕對和相對URL,改進了URL文法,定義瞭如何解析URL為絕對形式,並更加完善地列舉了其時正處於使用中的URL協議。而URN定義和文法直到1997年5月RFC 2141公佈後才正式統一。
1998年8月,隨着RFC 2396的發表,URI文法形成了獨立的標準,同時RFC 1630和1738中關於URI和URL的許多部分也得到了修訂和增補。新RFC修改了“URI”中“U”的含義:它開始代表統一(Uniform)而不再是通用(Universal)。RFC 1738中總結了既存URL協議的部分被移至另外一篇獨立文檔中。IANA 保留着這些協議的註冊信息,而RFC 2717首次描述了註冊它們的流程。
在1999年12月,RFC 2732對RFC 2396進行了小幅更新,開始允許URI包括IPv6地址。一段時間以後,在兩個標準中暴露出的一些問題促使了一系列的修訂草案的發展,這些草案被統稱為rfc2396bis。這一由RFC 2396的共同作者Roy Fielding引導協調的集體努力,由2005年1月RFC 3986的發佈推至了頂峯。該RFC文檔成為了現今(2009年)於互聯網上被推薦使用的URI文法版本,並使得RFC 2396成為了歷史。然而,它卻並未替代現有的URL協議細節;RFC 1738繼續管轄着大多數協議,除了某些已被它取而代之的場合——例如被RFC 2616改良的”HTTP”協議等。與此同時,IETF發佈了RFC 3986,亦即完整的STD 66標準,標識着URI通用文法正式成官方因特網協議
在2002年8月,RFC 3305指出,雖然術語“URL”仍被廣泛地用於日常用語之中,但其本身已幾乎被廢棄。其功用,僅是作為對於某些URI因包含某種指示着網絡可達性的協議而作為地址存在的提醒而已。基於URI的眾多標準,例如資源描述框架等,已經清楚地表明,資源標識本無需指出通過互聯網獲得資源副本的方法,亦無須指出資源是否基於網絡。
在2006年2月,RFC 4395用了15頁詳細闡述了《關於新的URI方案的指導方針和登記程序》 [1] 
在2006年11月1日,W3C技術架構小組公佈了《連接替代副本使查找和發佈可行化》,一個對於發佈給定資源的多個版本的權威URI和其最佳實踐的指導。例如,內容可能因用於訪問資源的設備的支持性和設定不同,而語言或大小上有所調整已適應這種差異。

URIURI、URL和URN

統一資源定位符(Uniform Resource Locator,URL),統一資源名稱(Uniform Resource Name,URN)是URI的子集。
Web上地址的基本形式是URI,它有兩種形式:
一種是URL,這是目前URI的最普遍形式。
另一種就是URN,這是URL的一種更新形式,URN不依賴於位置,並且有可能減少失效連接的個數。但是其流行還需假以時日,因為它需要更精密軟件的支持。

URIURI與URL

URL是Uniform Resource Locator的縮寫,譯為"統一資源定位符"。URL是一種URI,它標識一個互聯網資源,並指定對其進行操作或獲取該資源的方法。可能通過對主要訪問手段的描述,也可能通過網絡“位置”進行標識。例如,http://www.wikipedia.org/這個URL,標識一個特定資源(首頁)並表示該資源的某種形式(例如以編碼字符表示的,首頁的HTML代碼)是可以通過HTTP協議從www.wikipedia.org這個網絡主機獲得的。主要用在各種WWW客户程序和服務器程序上,特別是著名的Mosaic。採用URL可以用一種統一的格式來描述各種信息資源,包括文件、服務器的地址和目錄等。
最大的缺點是當信息資源的存放地點發生變化時,必須對URL作相應的改變。因此人們正在研究新的信息資源表示方法,例如:URI(Universal Resource Identifier)即"通用資源標識" [2]  、URN(Uniform Resource Name)即"統一資源名"和URC(Uniform Resource Citation)即"統一資源引用符"等。
URI還在進一步的研究當中。研究的方向就是彌補URL的缺點。

URIURI與URN

URI可被視為定位符(URL),名稱(URN)或兩者兼備。統一資源名(URN)如同一個人的名稱,而統一資源定位符(URL)代表一個人的住址。換言之,URN定義某事物的身份,而URL提供查找該事物的方法。URN僅用於命名,而不指定地址。
用於標識唯一書目的ISBN系統是一個典型的URN使用範例。例如,ISBN 0486275574(urn:isbn:0-486-27557-4)無二義性地標識出莎士比亞的戲劇《羅密歐與朱麗葉》的某一特定版本。為獲得該資源並閲讀該書,人們需要它的位置,也就是一個URL地址。在類Unix操作系統中,一個典型的URL地址可能是一個文件目錄,例如file:///home/username/RomeoAndJuliet.pdf。該URL標識出存儲於本地硬盤中的電子書文件。因此,URL和URN有着互補的作用。
URN是基於某名字空間通過名稱指定資源的URI。人們可以通過URN來指出某個資源,而無需指出其位置和獲得方式。資源無需是基於互聯網的。例如,URNurn:ISBN0-395-36341-1 指定標識系統(即國際標準書號ISBN)和某資源在該系統中的唯一表示的URI。它可以允許人們在不指出其位置和獲得方式的情況下談論這本書。 [3] 

URIURI格式

表示指定的 URI,要使用涵蓋全部必要信息的絕對 URI、絕對 URL 以及相對 URL。相對 URL,是指從瀏覽器中基本 URI 處指定的 URL,形如 /image/logo.gif。
URI格式由URI協議名(例如httpftpmailto、file),一個冒號,和協議對應的內容所構成。特定的協議定義了協議內容的語法和語義,而所有的協議都必須遵循一定的URI文法通用規則,亦即為某些專門目的保留部分特殊字符。URI文法同時也就各種原因對協議內容加以其他的限制,例如,保證各種分層協議之間的協同性。百分號編碼也為URI提供附加信息。
URL的格式由下列三部分組成:,第一部分是協議(或稱為服務方式);第二部分是存有該資源的主機IP地址(有時也包括端口號);第三部分是主機資源的具體地址。
具體URI的格式如下:
[協議名]://[用户名]:[密碼]@[服務器地址]:[服務器端口號]/[路徑]?[查詢字符串]#[片段ID] [4] 

URI登錄信息(用户名:密碼)

指定用户名和密碼作為從服務器端獲取資源時必要的登錄信息(身份認證)。此項是可選項。

URI服務器地址

使用絕對 URI 必須指定待訪問的服務器地址。地址可以是類似 hackr.jp 這種 DNS 可解析的名稱,或是 192.168.1.1 這類 IPv4 地址 名,還可以是 [0:0:0:0:0:0:0:1] 這樣用方括號括起來的 IPv6 地址名。

URI服務器端口號

指定服務器連接的網絡端口號。此項也是可選項,若用户省略則自動使用默認端口號。

URI帶層次的文件路徑

指定服務器上的文件路徑來定位特指的資源。這與 UNIX 系統的文件目錄結構相似。

URI查詢字符串

針對已指定的文件路徑內的資源,可以使用查詢字符串傳入任意參數。此項可選。

URI片段標識符

使用片段標識符通常可標記出已獲取資源中的子資源(文檔內的某個位置)。但在 RFC 中並沒有明確規定其使用方法。該項也為可選項。

URI與XML命名空間的關係

XML擁有一個叫命名空間的,一個可包含元素集和屬性名稱的抽象域的概念。命名空間的名稱(一個必須遵守通用URI文法的字符串)用於標識一個XML命名空間。但是,命名空間的名稱一般不被認為是一個URI,因為URI規範定義了字符串的“URI性”是根據其目的而不是其詞法組成決定的。一個命名空間名稱同時也並不一定暗示任何URI協議的語義;例如,一個以”http:”開頭的命名空間名稱很可能與HTTP協議沒有任何關係。XML專家們就這一問題在XML開發電子郵件列表上進行了深入的辯論;一部分人認為命名空間名稱可以是URI,由於包含一個具體命名空間的名稱集可以被看作是一個被標識的資源,也由於“XML中的命名空間”規範的一個版本指出過命名空間名稱“是”一個URI引用。但是,集體共識似乎指出一個命名空間名稱只是一個湊巧看起來像URI的字符串,僅此而已。
早先,命名空間名稱是可以匹配任何非空URI引用的語法的,但後來的一個對於“XML命名空間建議”的訂正廢棄了相對URI引用的使用。一個獨立的、針對XML 1.1的命名空間的規範允許使用IRI引用作為命名空間名稱的基準,而不僅是URI引用。
為了消除XML新人中產生的對於URI(尤其是HTTP URL)的使用的困惑,一個被稱為RDDL(資源目錄描述語言)的描述語言被建立了,雖然RDDL的規範並沒有正式地位,也並沒有獲得任何相關組織(例如W3C)的檢查和支持。一個RDDL文檔可以提供關於一個特定命名空間和使用它的XML文檔的,機器與人類都能讀懂的信息。XML文檔的作者鼓勵使用RDDL文檔,這樣一旦文檔中的命名空間名稱被索引,(系統)就會取得一個RDDL文檔。這樣,許多開發者對於讓命名空間名稱指向網絡可達資源的需求就能得到滿足。
參考資料