Suchmaschine für genauere und schnellere Erkennung von Metaboliten | 2020

Inhaltsverzeichnis:

Anonim

Forscher der Aalto-Universität und der Universität Jena in Deutschland haben eine Suchmaschine namens CSI: FingerID entwickelt, die Metaboliten aus Tandem-Massenspektrometriemessungen mit einer Genauigkeit identifiziert, die um mehr als 150 Prozent höher ist als die ihrer Konkurrenten, was die Arbeit der Forscher zum Leben erwecken könnte und medizinische Wissenschaften einfacher. Die Studie wurde kürzlich im. Veröffentlicht PNAS Tagebuch.

Metaboliten sind kleine Moleküle wie Zucker, Fettsäuren und Aminosäuren, die unter anderem als Energiequellen in den Zellen und als Baumaterial für Zellwände dienen. Für Forscher sind sie sozusagen Spuren der Funktionsweise und des Zustands von Zellen.

„Es gibt viele Metaboliten, von Hunderttausenden bis zu Millionen, und alle sehen sich ein bisschen ähnlich. In unserer Studie haben wir ein Modell konstruiert, das auf maschinellem Lernen beruht. Die von ihm vorhergesagten molekularen Strukturen können auf ähnliche Weise wie Suchergebnisse aus der Google-Suchmaschine verwendet werden “, erklärt Professor Juho Rousu von der Aalto University.

Fingerabdrücke von Molekülen

Das in der Studie verwendete Tandem-Massenspektrometer ist ein Instrument, das Moleküle in Fragmente aufspaltet, um ihre Massen und relativen Häufigkeiten oder ihr Massenspektrum zu messen. Bei der von Forschern aus Aalto und Jena entwickelten Methode wird zunächst aus jedem Spektrum, das in den Trainingsdaten enthalten ist, ein Fragmentierungsbaum berechnet, der für jedes Fragment seinen Elternteil beschreibt, ein größeres Fragment, von dem es stammt. Anschließend trainieren die Forscher das maschinelle Lernmodell unter Verwendung einer großen Anzahl von Fragmentierungsbäumen und molekularen Eigenschaften oder Fingerabdrücken, die jedem Baum entsprechen. Wenn das Spektrum eines neuen Moleküls dann für das Modell angegeben wird, sagt es seine wahrscheinlichen Fingerabdrücke voraus, auf deren Grundlage ein Satz von am besten passenden Molekülen aus der Moleküldatenbank abgerufen wird.

Abhängig von der Art der Moleküle geben derzeit bis zu 95 Prozent der Suchanfragen das richtige Suchergebnis unter den Top-10-Übereinstimmungen zurück. Die Genauigkeit der Identifizierung verbessert sich, wenn das Datenvolumen erhöht wird. Derzeit wurden beim Aufbau des Modells etwa 6.000 Massenspektren verwendet.Im Idealfall schlägt die maschinell lernende Suchmaschine immer das richtige Molekül als erste Übereinstimmung vor, was jedoch eine erhebliche Steigerung des Datenvolumens und eine Weiterentwicklung der Methoden erforderlich macht.

Die Studie könnte insbesondere Forschern in den Lebens- und Medizinwissenschaften zugute kommen. Potenzielle zukünftige Anwendungsbereiche sind Anti-Doping-Maßnahmen, Drogenkontrolle durch den Zoll und Ermittlungen am Tatort.

Die Studie wurde in Zusammenarbeit mit einer Forschungsgruppe unter der Leitung von Professor Sebastian Böcker von der Universität Jena durchgeführt und ist ein gutes Beispiel für die Forschung der Aalto University, die Informationstechnologie mit digitaler Gesundheit verbindet.