bitcoin
bitcoin

$98768.00 USD 

-0.42%

ethereum
ethereum

$3335.03 USD 

-0.71%

tether
tether

$1.00 USD 

0.01%

solana
solana

$255.43 USD 

-2.75%

bnb
bnb

$642.40 USD 

0.87%

xrp
xrp

$1.57 USD 

14.91%

dogecoin
dogecoin

$0.425051 USD 

7.53%

usd-coin
usd-coin

$0.999913 USD 

0.04%

cardano
cardano

$1.09 USD 

24.78%

tron
tron

$0.206501 USD 

2.93%

avalanche
avalanche

$43.53 USD 

18.43%

shiba-inu
shiba-inu

$0.000027 USD 

8.84%

toncoin
toncoin

$5.52 USD 

-0.63%

stellar
stellar

$0.438203 USD 

57.26%

bitcoin-cash
bitcoin-cash

$543.34 USD 

10.10%

暗号通貨のニュース記事

EditRetro: 逆合成予測を分子列編集タスクとして再定義する

2024/07/31 03:06

分子の合成反応経路の設計は有機合成の基本的な側面であり、生物医学、製薬、材料産業などのさまざまな分野に重要な意味を持ちます。逆合成分析は、合成ルートを開発するために最も広く使用されているアプローチです。

EditRetro: 逆合成予測を分子列編集タスクとして再定義する

Organic synthesis plays a pivotal role in various fields, including biomedical, pharmaceutical, and materials industries. Retrosynthetic analysis serves as the primary approach for designing synthetic routes, aiming to decompose molecules into simpler precursors using established reactions. This methodology, initially formalized by Corey, led to the development of computer-aided synthesis planning (CASP). In recent years, artificial intelligence (AI)-driven retrosynthesis has facilitated the exploration of more complex molecules and significantly reduced the time and energy required to design synthetic experiments. Single-step retrosynthesis prediction is a crucial component of retrosynthetic planning, and several deep learning-based methods have been proposed with promising results. These methods can be broadly categorized into three groups: template-based, template-free, and semi-template-based methods.

有機合成は、生物医学、製薬、材料産業などのさまざまな分野で重要な役割を果たしています。逆合成分析は合成経路を設計するための主要なアプローチとして機能し、確立された反応を使用して分子をより単純な前駆体に分解することを目的としています。この方法論は、最初に Corey によって形式化され、コンピュータ支援合成計画 (CASP) の開発につながりました。近年、人工知能 (AI) を活用した逆合成により、より複雑な分子の探索が容易になり、合成実験の設計に必要な時間とエネルギーが大幅に削減されました。シングルステップ逆合成予測は逆合成計画の重要な要素であり、深層学習ベースの手法がいくつか提案されており、有望な結果が得られています。これらの方法は、テンプレート ベースの方法、テンプレートを使用しない方法、および半テンプレート ベースの方法の 3 つのグループに大別できます。

Template-based methods regard retrosynthesis prediction as a template retrieval problem and compare the target molecule with precomputed templates. These templates capture the essential features of the reaction center in specific types of chemical reactions. They can be generated manually or automatically and serve as a guide for the model to identify the most suitable chemical transformation for a given molecule. Various works have proposed different approaches to prioritize candidate templates. RetroSim employed the molecular fingerprint similarity between the given product and the molecules present in the corpus to rank the candidate templates. NeuralSym was the pioneering work to utilize deep neural networks for template selection by learning a multi-class classifier. GLN built a conditional graph logic network to learn the conditional joint probability of templates and reactants. LocalRetro conducted an evaluation of the suitability of local atom/bond templates at all predicted reaction centers for a target molecule and incorporated the non-local effects in chemical reactions through global reactivity attention. It has demonstrated state-of-the-art performance within the template-based methods. Although providing interpretability and molecule validity, template-based models suffer from limited generalization and scalability issues, which can hinder their practical utility.

テンプレートベースの方法では、逆合成予測をテンプレート検索問題として扱い、標的分子を事前に計算されたテンプレートと比較します。これらのテンプレートは、特定の種類の化学反応における反応中心の重要な特徴を捕捉します。これらは手動または自動で生成でき、特定の分子に最適な化学変換を特定するモデルのガイドとして機能します。さまざまな研究で、候補テンプレートに優先順位を付けるためのさまざまなアプローチが提案されています。 RetroSim は、特定の製品とコーパス内に存在する分子の間の分子フィンガープリントの類似性を利用して、候補テンプレートをランク付けしました。 NeuralSym は、マルチクラス分類器を学習することでテンプレート選択にディープ ニューラル ネットワークを利用する先駆的な研究です。 GLN は、テンプレートと反応物の条件付き結合確率を学習するために、条件付きグラフ ロジック ネットワークを構築しました。 LocalRetro は、標的分子の予測されるすべての反応中心におけるローカル原子/結合テンプレートの適合性の評価を実施し、グローバルな反応性への注意を通じて化学反応における非局所的効果を組み込みました。テンプレートベースのメソッド内で最先端のパフォーマンスを実証しました。テンプレートベースのモデルは解釈可能性と分子の妥当性を提供しますが、一般化とスケーラビリティが限られているという問題があり、実用性が妨げられる可能性があります。

Template-free methods utilize deep generative models to generate reactant molecules without relying on predefined templates. Most of existing methods reformulate the task as a sequence-to-sequence problem, employing the sequence representation of molecules, specifically the simplified molecular-input line-entry system (SMILES). Liu et al. first utilized a long short-term memory (LSTM)-based sequence-to-sequence (Seq2Seq) model to convert the SMILES representation of a product to the SMILES of the reactants. Karpov et al. further proposed a Transformer-based Seq2Seq method for retrosynthesis. SCROP integrated a grammar corrector into the Transformer architecture, aiming to resolve the prevalent problem of grammatical invalidity in seq2seq methods. R-SMILES established a closely aligned one-to-one mapping between the SMILES representations of the products and the reactants to enhance the efficiency of synthesis prediction in Transformer-based methods. PMSR devised three tailored pre-training tasks for retrosynthesis, encompassing auto-regression, molecule recovery, and contrastive reaction classification, thereby enhancing the performance of retrosynthesis and achieving state-of-the-art accuracy within template-free methods. Some studies characterize the task as a graph-to-sequence problem, employing the molecular graph as input. Graph2SMILES integrated a sequential graph encoder with a Transformer decoder to preserve the permutation invariance of SMILES. Retroformer introduced a local attention head in the Transformer encoder to augment its reasoning capability for reactions. Recent studies, including MEGAN, MARS, and Graph2Edits, have explored the utilization of end-to-end molecular graph editing models to represent a chemical reaction as a series of graph edits, drawing inspiration from the arrow pushing formalism. However, these approaches usually require time-consuming predictions for sequential graph edit operations. Fang et al. developed a substructure-level decoding method by automatically extracting commonly preserved portions of product molecules. However, the extraction of substructures is fully data-driven, and its coverage depends on the reaction dataset. Furthermore, incorrect substructures can lead to erroneous predictions. While template-free methods are fully data-driven, they raise concerns regarding the interpretability, chemical validity, and diversity of the generated molecules.

テンプレートフリーの方法では、深い生成モデルを利用して、事前定義されたテンプレートに依存せずに反応物分子を生成します。既存の方法のほとんどは、分子の配列表現、具体的には単純化された分子入力ライン入力システム (SMILES) を使用して、タスクを配列間問題として再定式化します。劉ら。最初に、長短期記憶 (LSTM) ベースの配列間 (Seq2Seq) モデルを利用して、生成物の SMILES 表現を反応物の SMILES に変換しました。カルポフら。さらに、逆合成のための Transformer ベースの Seq2Seq メソッドを提案しました。 SCROP は、seq2seq メソッドで文法が無効であるという一般的な問題を解決することを目的として、文法修正プログラムを Transformer アーキテクチャに統合しました。 R-SMILES は、生成物と反応物の SMILES 表現間の緊密に調整された 1 対 1 マッピングを確立し、Transformer ベースのメソッドにおける合成予測の効率を高めました。 PMSR は、自己回帰、分子回収、対照反応分類を含む、逆合成用に調整された 3 つの事前トレーニング タスクを考案しました。これにより、逆合成のパフォーマンスが向上し、テンプレートフリーのメソッド内で最先端の精度が達成されます。一部の研究では、このタスクを、分子グラフを入力として使用するグラフからシーケンスへの問題として特徴付けています。 Graph2SMILES は、SMILES の順列不変性を維持するために、逐次グラフ エンコーダーと Transformer デコーダーを統合しました。 Retroformer は、Transformer エンコーダにローカル アテンション ヘッドを導入して、反応に対する推論機能を強化しました。 MEGAN、MARS、Graph2Edits などの最近の研究では、フォーマリズムを推進する矢印からインスピレーションを得て、化学反応を一連のグラフ編集として表現するためのエンドツーエンドの分子グラフ編集モデルの利用が検討されています。ただし、これらのアプローチでは通常、連続したグラフ編集操作に時間のかかる予測が必要になります。ファングら。は、生成物分子の共通に保存されている部分を自動的に抽出することにより、下部構造レベルの解読方法を開発しました。ただし、部分構造の抽出は完全にデータ駆動型であり、その範囲は反応データセットによって異なります。さらに、誤った下部構造は誤った予測につながる可能性があります。テンプレートフリーの方法は完全にデータ駆動型ですが、生成される分子の解釈可能性、化学的妥当性、および多様性に関する懸念が生じます。

Semi-template-based methods leverage the benefits of the two aforementioned methods. These methods follow a two-stage procedure: first, fragmenting the target molecule into synthons by identifying reactive sites, and subsequently converting the synthons into reactants using techniques such as leaving groups selection, graph generation, or SMILES generation. RetroXpert first identified the reaction center of the target molecule to obtain synthons by employing an edge-enhanced graph attention network, followed by the generation of the corresponding reactants based on the synthons. RetroPrime introduced the mix-and-match and label-and-align strategies within a Transformer-based two-stage workflow to mitigate the challenges of insufficient diversity and chemical implausibility. G2Gs initially partitioned the target molecular graph into several synthons by identifying potential reaction centers, followed by the translation of the synthons into the complete reactant graphs using a variational graph translation framework. GraphRetro first transformed the target into synthons by

セミテンプレートベースの方法は、前述の 2 つの方法の利点を活用します。これらのメソッドは 2 段階の手順に従います。まず、反応部位を特定することで標的分子をシントンに断片化し、続いて脱離基選択、グラフ生成、SMILES 生成などの技術を使用してシントンを反応物に変換します。 RetroXpert はまず、エッジ強化グラフ アテンション ネットワークを使用してシントンを取得するためにターゲット分子の反応中心を特定し、続いてシントンに基づいて対応する反応物質を生成しました。 RetroPrime は、不十分な多様性と化学的不合理性の課題を軽減するために、Transformer ベースの 2 段階のワークフロー内にミックス アンド マッチおよびラベル アンド 整列戦略を導入しました。 G2G は最初に、潜在的な反応中心を特定することによってターゲット分子グラフをいくつかのシントンに分割し、続いて変分グラフ変換フレームワークを使用してシントンを完全な反応物グラフに変換しました。 GraphRetro はまず、ターゲットを次のようにしてシントンに変換しました。

ニュースソース:www.nature.com

免責事項:info@kdj.com

提供される情報は取引に関するアドバイスではありません。 kdj.com は、この記事で提供される情報に基づいて行われた投資に対して一切の責任を負いません。暗号通貨は変動性が高いため、十分な調査を行った上で慎重に投資することを強くお勧めします。

このウェブサイトで使用されているコンテンツが著作権を侵害していると思われる場合は、直ちに当社 (info@kdj.com) までご連絡ください。速やかに削除させていただきます。

2024年11月23日 に掲載されたその他の記事