-
SMILES
(用ASCII字符串明確描述分子結構的規範)
鎖定
SMILES(Simplified molecular input line entry system),簡化分子線性輸入規範,是一種用ASCII字符串明確描述分子結構的規範。SMILES由Arthur Weininger和David Weininger於20世紀80年代晚期開發,並由其他人,尤其是日光化學信息系統有限公司(Daylight Chemical Information Systems Inc.),修改和擴展。
- 中文名
- 簡化分子線性輸入規範
- 外文名
- Simplified molecular input line entry system
- 簡 寫
- SMILES
- 領 域
- 計算機和化學
SMILES典範SMILES
記法:
有機物中的C、N、O、P、S、Br、Cl、I等原子可以省略方括號,其他元素必須包括在方括號之內。
2.氫原子常被省略。
對於省略了方括號的原子,用氫原子補足價數。
例如,水的SMILES就是O,乙醇是CCO。
3.雙鍵用“=”表示;三鍵用“#”表示。
4.如果結構中有環,則要打開。斷開處的兩個原子用同一個數字標記,表示原子間有鍵相連。
環己烷(C6H12)表示為C1CCCCC1。需要注意,標誌應該是數字(在此例中為1)而不是“C1”這個組合。擴展的表示是(C1)-(C)-(C)-(C)-(C)-(C)-1而不是(C1)-(C)-(C)-(C)-(C)-(C)-(C1)。
5.芳環中的C、O、S、N原子分別用小寫字母c,o,s,n表示。
7. 在芳香結構中的N原子上連有一個H原子,用[nH]表示
8. 用@和@@表示手性
SMILES異構SMILES
雙鍵兩側的結構分別用符號/和\表示,例如,F/C=C/F表示反二氟乙烯,它的兩個氟原子位於雙鍵的兩側。
而F/C=C\F表示順二氟乙烯,它的兩個氟原子位於雙鍵的同一側。
SMILES發展
SMARTS是SMILES基礎之上的改進版。SMARTS中增加的一點是,它允許使用通配符表示原子和化學鍵。因此,它在化合物數據庫中廣泛用於結構的計算機化搜索。這種搜索的機理是先通過輸入的SMILES式重構化學式,再搜索子圖的同形;而不是直接通過SMILES式的對比完成的。
SMILES其他記法及比較
其他著名的線性記法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近國際純粹與應用化學聯合會推薦國際化合物標識(InChI)作為標準的分子式表達式。
然而普遍認為,SMILES與InChI相比更具有可讀性;而且很多軟件都支持SMILES,其中不少軟件都具有圖論等方面的理論基礎。