    Support-vector-machine-based ranking significantly improves the effectiveness of similarity searching using 2D fingerprints and multiple reference compounds
    ( 2008)
    Geppert, H.
    ; ; ;
    Bajorath, J.
    Similarity searching using molecular fingerprints is computationally efficient and a surprisingly effective virtual screening tool. In this study, we have compared ranking methods for similarity searching using multiple active reference molecules. Different 2D fingerprints were used as search tools and also as descriptors for a support vector machine (SVM) algorithm. In systematic database search calculations, a SVM-based ranking scheme consistently outperformed nearest neighbor and centroid approaches, regardless of the fingerprints that were tested, even if only very small training sets were used for SVM learning. The superiority of SVM-based ranking over conventional fingerprint methods is ascribed to the fact that SVM makes use of information about database molecules, in addition to known active compounds, during the learning phase.
    Vorrichtung und Verfahren zum Bestimmen einer pharmazeutischen Aktivitaet eines Molekuels
    (A1) Eine Vorrichtung zum Bestimmen einer pharmazeutischen Aktivitaet eines Molekuels (M) weist eine Einrichtung (110) zum Bestimmen von in dem Molekuel auftretenden Atomstrukturen, eine Einrichtung (120) zum Zuweisen eines Merkmalsindex (MI), eine Einrichtung (130) zum Ermitteln eines Merkmalsvektors (MV) und eine Einrichtung (140) zum Bestimmen einer Zugehoerigkeit auf. Die Einrichtung (120) weist den Merkmalsindex (MI) zu einer der auftretenden Atomstrukturen in dem Molekuel (M) abhaengig von der jeweiligen Atomstruktur und einer Nachbarschaft der jeweiligen Atomstruktur in dem Molekuel (M) zu. Die Einrichtung (130) ermittelt den Merkmalsvektor (MV) fuer das Molekuel (M) abhaengig von dem zugewiesenen Merkmalsindex (MI), wobei der Merkmalsvektor (MV) auf einen Punkt in einem Merkmalsraum (MR) zeigt, und wobei der Merkmalsraum (MR) eine erste Domain (A), die pharmazeutisch aktiven Molekuelen entspricht, und eine zweite Domain (B), die pharmazeutisch inaktiven Molekuelen entspricht, aufweist. Die Einrichtung (140) bestimmt die Zugehoerigkeit des Punktes zu der ersten Domain (A) oder der zweiten Domain (B).