Hesaplamalı kimyada, yüksek kaliteli ve çeşitli verilere erişim, doğru moleküler modellemeyi geliştirmek için kritik önemdedir. QM9star, ünlü QM9 veri setini genişleterek katyonlar, anyonlar ve radikaller için 2 milyondan fazla kuantum-optimize edilmiş yapı içeren yeni bir veri setidir. Bu kaynak, orbital enerjileri, titreşim frekansları, atomik yükler ve spin yoğunlukları gibi kimyasal reaktiviteyi anlamak ve tahmin etmek için gereken temel özellikler hakkında veri sunar.
QM9star, moleküler özellik tahmini, moleküler temsil öğrenimi ve reaksiyon modelleme gibi detaylı atomik veri gerektiren makine öğrenimi uygulamaları için sağlam bir temel sağlar.
Bu çalışmada, moleküler dönüşümlerde önemli ara ürünler olan iyonlar ve radikallerin kimyasal özelliklerini incelemek ve reaksiyon reaktivitesi ile seçiciliğini anlamak amacıyla oluşturulan bir kuantum kimyasal veri seti, QM9star, tanıtılmaktadır. QM9star veri seti, QM9 veri setindeki moleküllerin terminal hidrojenlerinin çıkarılması ve ardından B3LYP-D3(BJ)/6-311 + G(d,p) seviyesinde yoğunluk fonksiyonel teorisi kullanılarak optimize edilmesiyle elde edilen yaklaşık 1,9 milyon katyon, anyon ve radikal ile 120 bin nötr molekülü içermektedir. Her bir kayıt, molekül ve atom seviyesinde bilgiler sunar: Küresel özellikler arasında orbital enerjileri ve titreşim frekansları gibi veriler yer alırken, yerel özellikler her atomik konumda yükler ve spin yoğunluklarını kapsar. QM9star, ara ürünler için kapsamlı bir kuantum kimyasal bilgi kaynağı sağlamakla kalmaz, aynı zamanda atomik özellik dağılımı ilkesine dair içgörüler sunar. Bu verilerin, kimyasal ara ürünlere ilişkin makine öğrenimi çalışmalarına ve moleküler temsil öğrenimine katkı sağlayacağı öngörülmektedir.
Kaynak:
Tang, MJ., Zhu, TC., Zhang, SQ. et al. QM9star, two Million DFT-computed Equilibrium Structures for Ions and Radicals with Atomic Information. Sci Data 11, 1158 (2024). https://doi.org/10.1038/s41597-024-03933-6





