InChI

Internacionalni hemijski identifikator (InChI) je tekstualni identifikator hemijskih supstanci. On je dizajniran da bude standard kodiranja molekulske informacije koji je jednostavan za čitanje, i istovremeno prikladan za pretragu informacija u bazama podataka. Razvile su ga je organizacije IUPAC (engl. International Union of Pure and Applied Chemistry) i NIST (engl. National Institute of Standards and Technology) u toku 2000-2005. Format i algoritmi su nezaštićeni, i implementirani su u računarskim programima koji su slobodno dostupni pod LGPL licencom otvorenog koda. Termin InChI je oznaka definisana od strane IUPAC organizacije.[1]

Pregled

Ovi identifikatori opisuju hemijske supstance u vidu informacionih slojeva — atomi i hemijske veze, tautomerska informacija, izotopska informacija, stereo-hemija, jonizacija. Svi slojevi nisu uvek neophodni, na primer, tautomerski sloj se može izostaviti kad ta je vrsta informacije nevažna.

InChI identifikatori se razlikuje od CAS brojeva u tri pogleda:

  • oni su nezaštićeni,
  • oni se mogu formirati na bazi hemijske strukture,
  • najveći deo InChI identifikatora se može čitati (uz malo prakse).

InChI identifikatori se mogu smatrati generalnom I veoma formalnom verzijom IUPAC imena. Oni mogu sadržati veći informacioni sadržaj nego jednostavnija SMILES notacija. Poput kanoničkih SMILES oni su jedinstveni nizovi znakova, i prikladni su za upotrebu u bazama podataka. 3D koordinate atoma nisu deo InChI formata.

InChI algoritam pretvara strukturnu informaciju u jedinstveni InChI identifikator u tri stepena: normalizacija (odstranjivanje nepotrebnih podataka), kanonizacija (stvaranje jedinstvene numeričke etikete atoma), i formiranje niza znakova.

InChIKey je kaširani InChI identifikator sa fiksnom dužinom od 25 znakova. InChIKey specifikacija je objavljena u Septembru 2007. godine da bi se omogućila Veb pretraživanja hemijskih jedinjenja, pošto je to bilo problematično koristeći InChI.[2]

Primeri

CH3CH2OH
etanol
InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3

L-askorbinska kiselina
InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1

Povezano

  • Molekulski jezik upita
  • SMILES
  • Molekulski editor

Reference

  1. McNaught, Alan (2006). „The IUPAC International Chemical Identifier:InChl”. Chemistry International (IUPAC) 28 (6). 
  2. „The IUPAC International Chemical Identifier (InChI)”. IUPAC. 5 September 2007. Arhivirano iz originala na datum 2007-10-30. 

Vanjske veze

Dokumentacija i prezentacije

  • IUPAC InChI lokacija
  • Neslužbena InChI FAQ Arhivirano 2012-03-06 na Wayback Machine-u
  • InChI tehnička uputstvaPDF (335 KB)
  • Opis algoritma kanonizacije
  • Googling for InChIs W3C prezentacija
  • The Semantic Chemical Web: GoogleInChI and other Mashups Arhivirano 2012-03-27 na Wayback Machine-u, Google Tech Talk by Peter Murray-Rust, 13 Sept 2006
  • IUPAC InChI Arhivirano 2011-11-25 na Wayback Machine-u, Google Tech Talk by Steve Heller and Steve Stein, 2 November 2006

Softver i usluge

  • NCI/CADD Chemical Identifier Resolver, Generiše i pretvara InChI/InChIKeys i mnoge druge hemijske identifikatore
  • Generate InChI Arhivirano 2005-11-01 na Wayback Machine-u, Interaktivna služba na Univerzitetu Kembridža
  • Search Google for molecules Arhivirano 2006-01-17 na Wayback Machine-u, Generiše InChI iz interaktivno nacrtanih molekula, i pretražuje Google. Javascript osposobljen Veb pretraživač je potreban
  • ChemSketch Arhivirano 2006-10-18 na Wayback Machine-u, Besplatan program za crtanje hemijskih struktura sa ulazom i izlazom u InCHI formatu
  • PubChem
  • ChemSpider Services
  • MarvinSketch Arhivirano 2007-04-04 na Wayback Machine-u ChemAxon
  • BKchem