International Chemical Identifier – Wikipedia
Der IUPAC International Chemical Identifier (InChI, ausgesprochen "Intschie"), (englisch: Internationale chemische Bezeichnung der IUPAC) ist ein chemischer Strukturcode, der es ermöglicht, ein Molekül in eine standardisierte Zeichenkette zu übersetzen. Mit dieser können dann Datenbanken oder das Internet leichter durchsucht werden.
Der Code wurde im Zeitraum von 2000 bis 2004 von der IUPAC und dem NIST entwickelt und stellt das digitale Pendant der IUPAC-Nomenklatur für jede bestimmte chemische Verbindung dar. Neben der Hauptebene wird die chemische Struktur durch fünf Ebenen von Information definiert – Konnektivität, Tautomerie, Isotopie, Stereochemie und Formalladung.
Der InChI-Algorithmus wandelt eingegebene Strukturinformation in einem dreistufigen Prozess in die Identifikationszeichenfolge – Normalisierung (Entfernung redundanter Information), Kanonisierung (Erstellung eines eindeutigen Satzes von Atomkennungen), Serialisierung (Anordnung der Information in eindeutiger Reihenfolge) um. Die Software und das Format sind zwar markenrechtlich geschützt, jedoch als freie Software unter der LGPL veröffentlicht.
Beispiele
[Bearbeiten | Quelltext bearbeiten]CH4 Methan | InChI=1S/CH4/h1H4 |
CH3CH2OH Ethanol | InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3 |
L-Ascorbinsäure | InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1 |
Ebenen
[Bearbeiten | Quelltext bearbeiten]Es gibt sechs InChI-Ebenen:
- Hauptebene
- Ladungsebene
- Stereochemieebene
- Isotopebene
- fixierte-H-Ebene
- „Reconnected Layer“
Sub-Ebenen
[Bearbeiten | Quelltext bearbeiten]Jede Ebene kann sich in Sub-Ebenen (untergeordnete Ebenen) spalten. Beispielsweise kann sich die Hauptebene in drei Sub-Ebenen spalten:
- Chemische Formel (kein Präfix)
- Atomverbindung (Präfix: „c“)
- Wasserstoffatome (Präfix: „h“)
Notation
[Bearbeiten | Quelltext bearbeiten]Ebene und Sub-Ebenen sind jeweils durch ein „ / “ voneinander abgegrenzt. Alle Ebenen und Sub-Ebenen mit Ausnahme der Chemische-Formel-Subebene der Hauptebene beginnen mit einem Kleinbuchstaben, der den Informationstyp der Ebenen angibt.
Siehe auch
[Bearbeiten | Quelltext bearbeiten]- Wiswesser Line Notation (WLN)
- Chemische Formel
- Konstitutionsformel
- Simplified Molecular Input Line Entry Specification
Literatur
[Bearbeiten | Quelltext bearbeiten]- Ulrich Rößler: Strukturformeln als Text speichern. In: Nachr. Chem. 60, Nr. 2, 2012, S. 140, doi:10.1002/nadc.201290083.