La lecture à portée de main
Découvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDécouvre YouScribe en t'inscrivant gratuitement
Je m'inscrisDescription
Informations
Publié par | friedrich-alexander-universitat_erlangen-nurnberg |
Publié le | 01 janvier 2006 |
Nombre de lectures | 19 |
Langue | Deutsch |
Poids de l'ouvrage | 5 Mo |
Extrait
Prediction of Properties of Organic Compounds ?
Empirical Methods and
Management of Property Data
Den Naturwissenschaftlichen Fakult ten
der Friedrich-Alexander-Universit t Erlangen-N rnberg
zur
Erlangung des Doktorgrades
vorgelegt von
Thomas Klein der
aus Marburg/LahnAls Dissertation genehmigt von den
Naturwissenschaftlichen Fakult ten der Universit t Erlangen-N rnberg
Tag der m ndlichen Pr fung: 12.12.2005
Vorsitzender der Promotionskommission: Prof. Dr. D.-P. H der
Erstberichterstatter: Prof. Dr. J. Gasteiger
Zweitberichterstatter: Prof. Dr. T. ClarkMeinem Doktorvater
Herrn Prof. Dr. Johann Gasteiger
danke ich f r die vielf ltige Unterst tzung und die wertvollen Anregungenen, ohne die diese
Arbeit nicht m glich gewesen w re.
Mein besonderer Dank gilt weiterhin:
Dr. Lothar Ter oth f r die vielf ltigen Diskussionen zu allen Bereichen der in dieser
Arbeit behandelten Themen und die stete Hilfsbereitschaft,
Dr. Achim Herwig, J rg Marusczyk und den anderen Entwicklern von MOSES f r
die gute Zusammenarbeit und die manchmal kontroversen aber immer produktiven
Diskussionen,
den Administratoren der verschiedenen Betriebssystem-Plattformen und des Netzwer-
kes f r die Bereitstellung und Aufrechterhaltung einer stabilen Arbeitsumgebung,
Dr. Nico van Eikema Hommes und Prof. Dr. Tim Clark f r die hilfreichen Diskussio-
nen zu Fragen der Berechnung quanten-chemischer Atomladungen,
Christoph Schlenker f r die hilfreichen Diskussionen und Anregungen zu allen Be-
reichen der Software-Entwicklung,
Angela D bler, Ulrike Scholz und Karin Holzke f r die Unterst tzung bei allen admi-
nistrativen Aufgaben,
allen nicht genannten Kollegen des Arbeitskreises f r die freundliche Aufnahme, viele
fruchtbare Diskussionen und die positive und produktive Arbeitsatmosph re.
Mein weiterer Dank gilt dem Bundesministerium f r Bildung und Forschung f r die nan-
zielle Unterst tzung im Rahmen der Forschungsprojekte Suche und Optimierung von Leit-
strukturen (SOL) und Bioinformatics for the Functional Analysis of Mammalian Genomes
(BFAM) .
Insbesondere danke ich meiner Frau, Diana Klein der, die mir immer Unterst tzung und
Verst ndnis beim Erstellen dieser Arbeit entgegengebracht hat..F r Diana, Karla und meine Eltern.Contents
1 Introduction 1
2 Fundamentals and Methods 5
2.1 Empirical Approaches to the Prediction of Properties . . . . . . . . . . . . 5
2.1.1 Linear Free Energy Relationships (LFER) . . . . . . . . . . . . . 5
2.1.2 Quantitative Structure Property Relationships (QSPR) . . . . . . . 7
2.2 Structure Descriptors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 Multivariate Data Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3.1 Multivariate Data . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3.2 Feature Selection and Transformation . . . . . . . . . . . . . . . . 13
2.4 Learning Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4.1 Unsupervised Learning . . . . . . . . . . . . . . . . . . . . . . . . 15
2.4.2 Supervised Learning . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.5 Model Building . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.6 Parametrization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.7 Charge Calculation by Partial Equalization of Electronegativity . . . . . . . 23
2.7.1 The Concept of Electronegativity and its Equalization . . . . . . . 24
2.7.2 Partial Equalization of Orbital Electronegativity (PEOE) . . . . . . 27
2.7.3 Partial of-Electronegativity (PEPE) . . . . . . . . . 32
2.8 Software Development . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.8.1 Programming Paradigms . . . . . . . . . . . . . . . . . . . . . . . 35
2.8.2 Design Techniques . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.8.3 Techniques for Implementation and Maintenance . . . . . . . . . . 44
3 MOSES 45
iii CONTENTS
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 From Script-based to Integrated Work ows . . . . . . . . . . . . . . . . . 47
3.3 Overcoming Limitations of Existing In-house Libraries . . . . . . . . . . . 50
3.4 Representation of Chemical Structures . . . . . . . . . . . . . . . . . . . . 51
3.4.1 Connection Tables . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.4.2 RAMSES ? A Structure Representation Based on/ Separation . 54
3.4.3 Extension to Hypervalent Atom Types . . . . . . . . . . . . . . . . 57
3.4.4 Perception of Aromaticity based on RAMSES . . . . . . . . . . . . 60
3.5 Architecture and Implementation . . . . . . . . . . . . . . . . . . . . . . . 64
3.6 Management of Properties . . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.6.1 Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
3.6.2 Design and Implementation . . . . . . . . . . . . . . . . . . . . . 71
3.7 Current Status of the Calculator Sublibrary . . . . . . . . . . . . . . . . . . 81
3.8 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.8.1 MOSES::WORKFLOWMANAGER . . . . . . . . . . . . . . . . . . 82
3.8.2 Polarizabilities Through a Zero Order Additivity Scheme . . . . . . 84
4 Quanti cation of Atomic Partial Charges 89
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.2 Development of a Combined PEOE/HMO Calculation . . . . . . . . . . . 91
4.2.1 Substitution of PEPE by a Modi ed H ckel MO Treatment . . . . . 91
4.2.1.1 H ckel MO Theory . . . . . . . . . . . . . . . . . . . . 92
4.2.1.2 Modi ed HMO: Accounting for the Inductive Effect . . . 98
4.2.1.3 Hyperconjugation . . . . . . . . . . . . . . . . . . . . . 101
4.2.2 Datasets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.2.3 The Problem of Parametrization . . . . . . . . . . . . . . . . . . . 106
4.2.4 Observable Properties . . . . . . . . . . . . . . . . . . . . . . . . 107
4.2.5 Charges from Quantum Mechanical Calculations . . . . . . . . . . 111
4.2.5.1 Methods . . . . . . . . . . . . . . . . . . . . . . . . . . 112
4.2.5.2 Requirements for a Reference Charge Calculation Scheme 115
4.2.6 Analysis and Comparison of QM Charges . . . . . . . . . . . . . . 116
4.2.6.1 Rates of Failures for QM Charge Calculation Methods . . 116
4.2.6.2 Direct Comparison of Charges from QM Calculations . . 117CONTENTS iii
4.2.6.3 Dipole Moments from QM Charges . . . . . . . . . . . . 119
4.2.6.4 Distribution of Charges for Various Atom Types . . . . . 121
4.2.6.5 Relationship to Electronegativity . . . . . . . . . . . . . 129
4.2.6.6 Shortcomings of the Merz-Kollman Scheme . . . . . . . 132
4.2.6.7 Conclusions of the Analysis . . . . . . . . . . . . . . . . 133
4.2.7 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.3 Work ow and Procedure for the Parametrization . . . . . . . . . . . . . . . 136
4.4 Calibration with Molecular Dipole Moments . . . . . . . . . . . . . . . . . 138
4.4.1 PEOE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
4.4.2 Modi ed HMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
4.5 Calibration with DFT/NPA Charges . . . . . . . . . . . . . . . . . . . . . 148
4.5.1 General Considerations . . . . . . . . . . . . . . . . . . . . . . . . 148
4.5.2 Modi ed PEOE . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
4.5.2.1 Revised Electronegativity Parameters . . . . . . . . . . . 150
4.5.2.2 Negative Hyperconjugation . . . . . . . . . . . . . . . . 153
4.5.3 Modi ed HMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159
4.5.4 Results of the Parametrization . . . . . . . . . . . . . . . . . . . . 166
4.6 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
4.6.1 C-1s ESCA Shifts . . . . . . . . . . . . . . . . . . . . . . . . . . 177
4.6.2 -Charges . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
4.7 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181
5 Summary 183
6 Zusammenfassung 185
A Supplementary Material 189
A.1 To Section 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189
B Datasets 195
B.1 To Section 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
B.2 To Section 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
Bibliography 217.