Enfoques computacionales que simplifican el descubrimiento de fármacos

Noticias

HogarHogar / Noticias / Enfoques computacionales que simplifican el descubrimiento de fármacos

Oct 01, 2023

Enfoques computacionales que simplifican el descubrimiento de fármacos

Naturaleza volumen 616, páginas

Nature volumen 616, páginas 673–685 (2023)Citar este artículo

28k Accesos

1 Citas

371 Altmetric

Detalles de métricas

El descubrimiento de fármacos asistido por computadora ha existido durante décadas, aunque en los últimos años se ha visto un cambio tectónico hacia la adopción de tecnologías computacionales tanto en la academia como en la industria farmacéutica. Este cambio se define en gran medida por la avalancha de datos sobre las propiedades de los ligandos y la unión a objetivos terapéuticos y sus estructuras 3D, abundantes capacidades informáticas y el advenimiento de bibliotecas virtuales bajo demanda de pequeñas moléculas similares a fármacos en miles de millones. Aprovechar al máximo estos recursos requiere métodos computacionales rápidos para la detección eficaz de ligandos. Esto incluye la detección virtual basada en estructuras de espacios químicos de gigaescala, facilitada aún más por enfoques de detección iterativos rápidos. Altamente sinérgicos son los desarrollos en las predicciones de aprendizaje profundo de las propiedades del ligando y las actividades objetivo en lugar de la estructura del receptor. Aquí revisamos los avances recientes en las tecnologías de descubrimiento de ligandos, su potencial para remodelar todo el proceso de descubrimiento y desarrollo de fármacos, así como los desafíos que enfrentan. También discutimos cómo la identificación rápida de ligandos altamente diversos, potentes, selectivos de objetivos y similares a fármacos para objetivos de proteínas puede democratizar el proceso de descubrimiento de fármacos, presentando nuevas oportunidades para el desarrollo rentable de tratamientos de moléculas pequeñas más seguros y efectivos.

A pesar del asombroso progreso en las ciencias básicas de la vida y la biotecnología, el descubrimiento y desarrollo de fármacos (DDD) sigue siendo lento y costoso, con un promedio de aproximadamente 15 años y aproximadamente US$2 mil millones para fabricar un fármaco de molécula pequeña1. Aunque se acepta que los estudios clínicos son la parte más costosa del desarrollo de cada fármaco, la mayoría de las oportunidades de ahorro de tiempo y costos residen en las primeras etapas de descubrimiento y preclínicas. Los propios esfuerzos preclínicos representan más del 43 % de los gastos en la industria farmacéutica, además de la importante financiación pública1, impulsada por la alta tasa de deserción en cada paso, desde la selección de objetivos hasta la identificación de aciertos y la optimización de clientes potenciales hasta la selección de candidatos clínicos. Además, la alta tasa de fallas en los ensayos clínicos (actualmente 90 %)2 se explica en gran medida por problemas arraigados en el descubrimiento temprano, como la validación inadecuada del objetivo o las propiedades subóptimas del ligando. Encontrar formas rápidas y accesibles de descubrir grupos más diversos de sondas químicas de mayor calidad, aciertos y pistas con perfiles óptimos de absorción, distribución, metabolismo, excreción y toxicología (ADMET) y farmacocinética (PK) en las primeras etapas de DDD mejoraría los resultados en estudios preclínicos y clínicos y facilitar medicamentos más eficaces, accesibles y seguros.

El concepto de descubrimiento de fármacos asistido por computadora3 fue desarrollado en la década de 1970 y popularizado por la revista Fortune en 1981, y desde entonces ha pasado por varios ciclos de exageración y desilusión4. Ha habido historias de éxito en el camino5 y, en general, los enfoques asistidos por computadora se han convertido en una parte integral, aunque modesta, del proceso de descubrimiento de fármacos6,7. Sin embargo, en los últimos años, varios avances científicos y tecnológicos dieron como resultado un cambio tectónico hacia la adopción de enfoques computacionales como una fuerza impulsora clave para el descubrimiento de fármacos tanto en la academia como en la industria. Las empresas farmacéuticas y biotecnológicas están ampliando sus esfuerzos de descubrimiento de fármacos computacionales o contratando a sus primeros químicos computacionales. Numerosas empresas de descubrimiento de fármacos nuevas y establecidas han recaudado miles de millones en los últimos años con modelos comerciales que dependen en gran medida de una combinación de modelado molecular avanzado basado en la física con aprendizaje profundo (DL) e inteligencia artificial (IA)8. Aunque todavía es demasiado pronto para esperar medicamentos aprobados a partir de los esfuerzos de descubrimiento impulsados ​​por computadora más recientes, están produciendo un número creciente de candidatos clínicos, con algunas campañas que afirman específicamente que los plazos entre el objetivo y el plomo son tan bajos como 1 o 2 meses9,10, o tiempo objetivo-a-clínica inferior a 1 año11. ¿Son estos los signos de un cambio importante en el papel que tienen los enfoques computacionales en el descubrimiento de fármacos o simplemente otra ronda del ciclo de exageración?

Veamos los factores clave que definen los cambios recientes (Fig. 1). Primero, la revolución estructural, desde la automatización en cristalografía12 hasta la microcristalografía13,14 y, más recientemente, la tecnología de microscopía crioelectrónica15,16, ha hecho posible revelar estructuras 3D para la mayoría de los objetivos clínicamente relevantes, a menudo en un estado o complejo molecular relevante para su función biológica. Especialmente impresionante ha sido el cambio estructural reciente de los receptores acoplados a proteínas G (GPCR)17 y otras proteínas de membrana que median la acción de más del 50 % de los fármacos18, proporcionando plantillas 3D para la detección de ligandos y la optimización de prospectos. El segundo factor es una rápida y marcada expansión del espacio químico similar a las drogas, fácilmente accesible para el descubrimiento de hits y leads. Hace solo unos años, este espacio estaba limitado a varios millones de compuestos disponibles en las estanterías de proveedores y bibliotecas de detección internas en la industria farmacéutica. Ahora, la detección se puede realizar con bibliotecas virtuales ultragrandes y espacios químicos de compuestos similares a fármacos, que se pueden fabricar fácilmente bajo demanda, creciendo rápidamente más allá de miles de millones de compuestos19, e incluso espacios generativos más grandes con capacidad de síntesis predicha teóricamente (Cuadro 1) . El tercer factor involucra enfoques computacionales emergentes que se esfuerzan por aprovechar al máximo la abundancia de estructuras 3D y datos de ligandos, respaldados por la amplia disponibilidad de recursos informáticos de unidades de procesamiento de gráficos (GPU) y en la nube para admitir estos métodos a escala. Esto incluye la detección virtual basada en la estructura de bibliotecas ultragrandes20,21,22, utilizando enfoques de detección acelerados23,24,25 y modulares26, así como el crecimiento reciente de los métodos de aprendizaje automático (ML) y DL basados ​​en datos para predecir ADMET y PK propiedades y actividades27.

a, más de 200 000 estructuras de proteínas en el PDB, además de colecciones privadas, tienen más del 90 % de las familias de proteínas cubiertas con rayos X de alta resolución y, más recientemente, con estructuras de criomicroscopía electrónica, a menudo en distintos estados funcionales, con lagunas restantes también Llenado por homología o modelos AlphaFold2. b, El espacio químico disponible para el cribado y la síntesis rápida ha crecido de alrededor de 107 compuestos disponibles en 2015 a más de 3 × 1010 compuestos bajo demanda en 2022, y puede ampliarse rápidamente más allá de 1015 compuestos diversos y novedosos. c, Los métodos computacionales para VLS incluyen avances en acoplamiento rápido y flexible, algoritmos modulares basados ​​en fragmentos, modelos DL y enfoques híbridos. d, Las herramientas computacionales son compatibles con el rápido crecimiento de la computación en la nube asequible, la aceleración de GPU y los chips especializados.

Aunque los impactos de la reciente revolución estructural17 y el hardware informático en el descubrimiento de fármacos28 se revisan exhaustivamente en otro lugar, aquí nos centramos en la expansión continua de espacios químicos similares a fármacos accesibles, así como en los desarrollos actuales en métodos computacionales para el descubrimiento y la optimización de ligandos. Detallamos cómo las herramientas computacionales emergentes aplicadas en el gigaespacio pueden facilitar el descubrimiento rentable de cientos o incluso miles de ligandos altamente diversos, potentes, selectivos de objetivos y similares a fármacos para un objetivo deseado, y los ubicamos en el contexto de enfoques experimentales ( Tabla 1). Si bien el impacto total de las nuevas tecnologías computacionales apenas comienza a afectar el desarrollo clínico, sugerimos que su combinación sinérgica con pruebas experimentales y validación en el ecosistema de descubrimiento de fármacos puede mejorar notablemente su eficiencia en la producción de mejores terapias.

Las compañías farmacéuticas acumulan colecciones de compuestos para la detección interna, mientras que las colecciones en stock de los proveedores (consulte la figura, parte a) permiten una entrega rápida (menos de 1 semana), contienen andamios químicos únicos y avanzados, se pueden buscar fácilmente y son HTS compatible. Sin embargo, el alto costo de manejo de bibliotecas físicas, su lento crecimiento lineal, tamaño limitado y novedad limitan sus aplicaciones.

Más recientemente, las bases de datos químicas virtuales bajo demanda (totalmente enumeradas) y los espacios (no enumerados) permiten una síntesis paralela rápida a partir de los componentes básicos disponibles, utilizando protocolos validados u optimizados, con un éxito sintético de más del 80 % y entrega en 2 a 3 semanas ( ver la figura, parte b). Los espacios químicos virtuales aseguran una gran novedad química y permiten un rápido crecimiento polinomial con la adición de nuevos sintones y andamios de reacción, incluidas reacciones de más de 4 componentes. Los ejemplos incluyen Enamine REAL, Galaxy de WuXi, CHEMriya de Otava y bases de datos y espacios privados en compañías farmacéuticas.

Los espacios generativos, a diferencia de los espacios bajo demanda, comprenden moléculas teóricamente posibles y colectivamente podrían comprender todo el espacio químico (ver la figura, parte c). Dichos espacios están limitados solo por la plausibilidad teórica, estimada en 1023–1060 de compuestos similares a las drogas. Aunque permite una cobertura espacial completa, la ruta de reacción y la tasa de éxito de los compuestos generados son desconocidas y, por lo tanto, requieren una predicción computacional de su sintetizabilidad práctica. Los ejemplos de espacios generativos y sus subconjuntos incluyen GDB-13, GDB-17, GDB-18 y GDBChEMBL.

El tamaño limitado y la diversidad de las bibliotecas de detección han sido durante mucho tiempo un cuello de botella para la detección de nuevos ligandos potentes y para todo el proceso de descubrimiento de fármacos. Una campaña promedio de detección de alto rendimiento (HTS) 'asequible'29 utiliza bibliotecas de detección de alrededor de 50 000 a 500 000 compuestos y se espera que arroje solo unos pocos resultados verdaderos después de la validación secundaria. Esos éxitos, si los hay, suelen ser bastante débiles, no selectivos, tienen propiedades ADMET y PK subóptimas y un modo de unión desconocido, por lo que su descubrimiento implica años de minuciosos esfuerzos de optimización de prueba y error para producir una molécula líder con una potencia satisfactoria y todo. los demás requisitos para el desarrollo preclínico. La escala de HTS a unos pocos millones de compuestos solo se puede permitir en las grandes farmacéuticas, y todavía no hace mucha diferencia en términos de calidad de los éxitos resultantes. Del mismo modo, las bibliotecas virtuales que utilizan el cribado in silico se limitaban tradicionalmente a una colección de compuestos disponibles en stock de los proveedores, que normalmente comprendían menos de 10 millones de compuestos únicos, por lo que la ventaja de escala sobre HTS era marginal.

Aunque perseguir la cobertura completa del enorme espacio químico similar a las drogas (estimado en más de 1063 compuestos)30 es un esfuerzo inútil, expandir la detección de bibliotecas bajo demanda en varios órdenes de magnitud a miles de millones y más de productos similares a las drogas previamente inexplorados. Se espera que los compuestos, ya sean físicos o virtuales, cambien el modelo de descubrimiento de fármacos de varias maneras. En primer lugar, puede aumentar proporcionalmente el número de aciertos potenciales en el cribado inicial31 (fig. 2). Esta abundancia de ligandos en la biblioteca también aumenta las posibilidades de identificación de ligandos más potentes o selectivos, así como ligandos con mejores propiedades fisicoquímicas. Esto se ha demostrado en campañas de detección virtual ultragrandes para varios objetivos, que revelan ligandos muy potentes con afinidades a menudo en el rango nanomolar medio a subnanomolar20,21,22,23,26. En segundo lugar, la accesibilidad de los análogos de éxito en los mismos espacios bajo demanda agiliza la generación de una relación estructura-actividad significativa (SAR) por catálogo y más pasos de optimización, lo que reduce la cantidad de síntesis personalizada elaborada. Por último, aunque la escala de la biblioteca es importante, las bibliotecas de gigaescala construidas adecuadamente pueden expandir la diversidad química (incluso con algunas reacciones químicas32), la novedad química y la patentabilidad de los éxitos, ya que casi todos los compuestos bajo demanda nunca se han sintetizado antes.

Las curvas rojas en escala logarítmica ilustran la distribución de aciertos de cribado con puntuaciones de unión mejores que X para bibliotecas de 10 000 millones, 100 millones y 1 millón de compuestos, según las estimaciones de campañas de cribado anteriores de VLS y V-SYNTHES. Las curvas azules ilustran la dependencia aproximada de la tasa de aciertos experimental con respecto a la puntuación de acoplamiento predicha para umbrales de 10 µM, 1 µM y 100 nM20. Este análisis (semicuantitativo, ya que varía de un objetivo a otro) sugiere que la selección de más de 100 millones de compuestos elimina las limitaciones de las bibliotecas más pequeñas, extendiendo la cola de la distribución de aciertos hacia mejores puntajes de unión con altas tasas de aciertos y permitiendo identificación de aciertos proporcionalmente más experimentales con mayor afinidad. Tenga en cuenta también dos factores importantes que justifican un mayor crecimiento de las bibliotecas de detección a 10 mil millones y más: (1) los aciertos candidatos para la síntesis y las pruebas experimentales generalmente se seleccionan como resultado del procesamiento posterior dependiente del objetivo de varios miles de compuestos de alta puntuación, que selecciona por novedad, diversidad, similitud con el fármaco y, a menudo, interacciones con residuos de receptores específicos. Por lo tanto, cuantos más compuestos de buena puntuación se identifiquen, mejor se puede hacer la selección general. (2) La saturación de las curvas de tasa de aciertos en las mejores puntuaciones no es una regla universal, sino el resultado de la precisión limitada de las funciones de puntuación rápida utilizadas en la selección. El uso de enfoques de acoplamiento o puntuación más precisos (acoplamiento flexible, mecánica cuántica y perturbación de energía libre) en el paso de posprocesamiento puede ampliar una correlación significativa de la puntuación de unión con la afinidad más a la izquierda (curvas discontinuas grises), lo que podría generar incluso más aciertos de alta afinidad para espacios químicos de gigaescala.

Recientemente se han desarrollado varios enfoques para ampliar los límites de tamaño de la biblioteca en HTS, incluida la química combinatoria y la agrupación a gran escala de los compuestos para ensayos paralelos. Por ejemplo, las técnicas de espectrometría de masas de selección por afinidad se pueden aplicar para identificar aglutinantes directamente en grupos de miles de compuestos33 sin necesidad de etiquetado. También se han desarrollado bibliotecas codificadas por ADN (DEL) y enfoques rentables para generarlas y examinarlas34, lo que hace posible trabajar con aproximadamente 1010 compuestos en un solo tubo de ensayo35. Estos métodos tienen sus propias limitaciones; como los DEL se crean marcando ligandos con secuencias de ADN únicas a través de un enlazador, la conjugación de ADN limita las posibilidades químicas para el ensamblaje combinatorio de la biblioteca. La detección de DEL también puede generar una gran cantidad de falsos negativos al bloquear restos importantes para la unión y, lo que es más importante, falsos positivos por unión no específica de etiquetas de ADN, por lo que se necesita una costosa resíntesis fuera del ADN de los compuestos exitosos para su validación. Para evitar esta resíntesis, se ha sugerido usar modos ML entrenados en los resultados DEL para cada objetivo para predecir ligandos similares a fármacos a partir de espacios químicos bajo demanda, como se describe en la ref. 36.

La detección in silico de bibliotecas virtuales mediante enfoques computacionales rápidos se ha promocionado durante mucho tiempo como una forma rentable de superar las limitaciones de las bibliotecas físicas. Sin embargo, solo recientemente se han desarrollado enfoques de química sintética y quimioinformática para romper estos límites y construir bibliotecas virtuales bajo demanda que exploran un espacio químico mucho más grande, como se revisa en las referencias. 37,38. En 2017, la base de datos de fácil acceso (REAL) de Enamine19,39 se convirtió en la primera biblioteca bajo demanda disponible comercialmente basada en el principio de reacción robusta40, mientras que los Institutos Nacionales de Salud de EE. UU. desarrollaron un inventario virtual accesible sintéticamente (SAVI)41, que también utiliza Bloques de construcción de enamina. La base de datos REAL utiliza protocolos de síntesis paralelos cuidadosamente seleccionados y optimizados y una colección curada de bloques de construcción disponibles, lo que permite garantizar la síntesis rápida (menos de 4 semanas), confiable (tasa de éxito del 80 %) y asequible de un conjunto de compuestos21. Impulsada por nuevas reacciones y diversos componentes básicos, la base de datos REAL completamente enumerada ha crecido de aproximadamente 170 millones de compuestos en 2017 a más de 5500 millones de compuestos en 2022 y comprende la mayor parte de la popular base de datos de detección virtual ZINC2042. La utilidad práctica de la base de datos REAL se ha demostrado recientemente en varias campañas importantes de cribado prospectivo20,21,23,24, algunas de las cuales llevan a cabo más pasos de optimización de aciertos en el mismo espacio químico, produciendo ligandos nanomolares e incluso subnanomolares selectivos sin necesidad de personalizarlos. síntesis20,21. Bibliotecas virtuales ultragrandes similares (es decir, GalaXi (http://www.wuxiapptec.com) y CHEMriya (http://chemriya.com)) están disponibles comercialmente, aunque sus tasas de éxito sintético aún no se han publicado.

La naturaleza modular de las bibliotecas virtuales a pedido admite un mayor crecimiento mediante la adición de reacciones y bloques de construcción. Sin embargo, la creación, el mantenimiento y la búsqueda de bibliotecas químicas completamente enumeradas que comprenden más de unos pocos miles de millones de compuestos se vuelven lentos y poco prácticos. Tales bibliotecas virtuales de gigaescala, por lo tanto, generalmente se mantienen como espacios químicos no enumerados, definidos por un conjunto específico de bloques de construcción y reacciones (o transformaciones), como se revisa exhaustivamente en la ref. 38. Dentro de la industria farmacéutica, uno de los primeros ejemplos publicados incluye PGVL de Pfizer37,43, cuya versión más reciente utiliza un conjunto de 1244 reacciones y reactivos internos para dar cuenta de 1014 compuestos. Otras compañías biofarmacéuticas tienen sus propios espacios químicos virtuales38,44, aunque sus detalles a menudo no son de dominio público. Entre los espacios químicos disponibles comercialmente, GalaXi Space de WuXi (aproximadamente 8 000 millones de compuestos), CHEMriya de Otava (11 800 millones de compuestos) y Enamine REAL Space (36 000 millones de compuestos)45 se encuentran entre los más grandes y establecidos. Además de sus enormes tamaños, estos espacios virtuales son muy novedosos y diversos, y tienen una superposición mínima (menos del 10%) entre sí46. Actualmente, el espacio comercial más grande, Enamine REAL Space, es una extensión de la base de datos REAL que mantiene las mismas garantías sintéticas de velocidad, tasa y costo, cubriendo más de 170 reacciones y más de 137,000 bloques de construcción (Cuadro 1). La mayoría de estas reacciones son de dos o tres componentes, pero se están explorando más reacciones de cuatro o incluso cinco componentes, lo que permite una combinatoria de orden superior. Este espacio se puede expandir fácilmente a 1015 compuestos según las reacciones disponibles y los conjuntos de bloques de construcción extendidos, por ejemplo, 680 millones de bloques de construcción fabricados bajo demanda (MADE)47, aunque la síntesis de tales compuestos implica más pasos y es más costosa. Para representar y navegar espacios químicos combinatorios sin su enumeración completa, se han desarrollado herramientas quimioinformáticas especializadas, desde búsquedas de similitudes químicas basadas en fragmentos48 hasta métodos de búsqueda de similitudes moleculares en 3D más elaborados basados ​​en campos de propiedades atómicas como el motor de descubrimiento rápido de isósteres (RIDE)38.

Un enfoque alternativo propuesto para construir espacios químicos genera compuestos hipotéticamente sintetizables siguiendo reglas simples de viabilidad sintética y estabilidad química. Así, las bases de datos generadas (GDB) predicen compuestos que pueden estar formados por un número específico de átomos; por ejemplo, GDB-17 contenía 166.400 millones de moléculas de hasta 17 átomos de C, N, O, S y halógenos49, mientras que GDB-18 compuesto por 18 átomos alcanzaría un estimado de 1013 compuestos38. Otros enfoques generativos basados ​​en definiciones más estrechas de espacios químicos ahora se utilizan en el diseño de ligandos de novo con química generativa basada en DL (por ejemplo, ref. 50), como se analiza a continuación.

Aunque la tasa de éxito sintético para algunos de los espacios químicos comerciales bajo demanda (por ejemplo, Enamine REAL Space) se ha validado exhaustivamente20,21,22,23,24,26,42, las accesibilidades sintéticas y las tasas de éxito de otros espacios químicos siguen siendo inédito38. Estas son métricas importantes para la sostenibilidad práctica de la síntesis bajo demanda porque las tasas de éxito reducidas o el tiempo y el costo irrazonables disminuirían su ventaja sobre la síntesis personalizada.

Se espera que los espacios químicos de gigaescala y terraescala, siempre que mantengan una alta semejanza y diversidad de drogas, alberguen millones de éxitos potenciales y miles de series potenciales de plomo para cualquier objetivo. Además, su síntesis robusta altamente manejable simplifica cualquier esfuerzo de química médica posterior hacia candidatos a fármacos finales.

Sin embargo, lidiar con tales bibliotecas virtuales requiere nuevos enfoques computacionales que cumplan con requisitos especiales tanto de velocidad como de precisión. Tienen que ser lo suficientemente rápidos para manejar bibliotecas de gigaescala. Si el acoplamiento de un compuesto lleva 10 s por núcleo de CPU, llevaría más de 3000 años examinar compuestos 1010 en un solo núcleo de CPU, o costaría aproximadamente 1 millón de dólares en una nube informática con las tarifas de CPU más económicas. Al mismo tiempo, la detección a gigaescala debe ser extremadamente precisa, protegiendo contra aciertos falsos positivos que engañan efectivamente a la función de puntuación al explotar sus agujeros y aproximaciones31. Incluso una tasa de uno en un millón de falsos positivos en una biblioteca de compuestos 1010 comprendería 10 000 aciertos falsos, lo que puede inundar cualquier selección de candidatos a aciertos. La tasa y la naturaleza del artefacto pueden depender del objetivo y los algoritmos de detección y deben abordarse cuidadosamente en la detección y el posprocesamiento. Aunque no existe una solución simple para tales artefactos, algunos remedios prácticos y razonablemente rentables incluyen: (1) selección basada en el consenso de dos funciones de puntuación diferentes, (2) selección de aciertos muy diversos (muchos artefactos se agrupan en compuestos similares ), (3) cubrir las apuestas de varios rangos de puntajes31 y (4) seleccionar manualmente la lista final de compuestos para cualquier interacción inusual. En última instancia, es muy deseable arreglar tantos 'agujeros en las funciones de puntuación' como sea posible y volver a optimizarlos para una alta selectividad en el rango de puntuaciones donde se encuentran los principales éxitos reales del gigaespacio. La falta de algunos aciertos en la selección (falsos negativos) sería bien tolerada debido a la gran cantidad de aciertos potenciales en el espacio 1010 (por ejemplo, perder el 50% de un millón de aciertos potenciales está perfectamente bien), por lo que algunas compensaciones en la sensibilidad de la puntuación es aceptable.

Los principales tipos de enfoques computacionales para detectar ligandos potenciales en un objetivo de proteína se resumen en la Tabla 2. A continuación, analizamos algunas tecnologías emergentes y cómo pueden encajar mejor en la tubería general de DDD para aprovechar al máximo los crecientes espacios químicos bajo demanda.

La detección in silico mediante el acoplamiento de moléculas de la biblioteca virtual en una estructura receptora y la predicción de su "puntaje de unión" es un enfoque bien establecido para acertar y liderar el descubrimiento y tuvo un papel clave en las recientes historias de éxito en el descubrimiento de fármacos11,17,51. El procedimiento de acoplamiento en sí puede utilizar la mecánica molecular, a menudo en la representación de coordenadas internas, para obtener un muestreo conformacional rápido de ligandos completamente flexibles52,53, utilizando enfoques empíricos de coincidencia de formas en 3D54,55, o combinándolos en un embudo de acoplamiento híbrido56,57. Se dedica especial atención a las funciones de puntuación de ligandos, que están diseñadas para eliminar de manera confiable los no aglutinantes para minimizar las predicciones de falsos positivos, lo cual es especialmente relevante con el crecimiento del tamaño de la biblioteca. Las evaluaciones a ciegas del rendimiento de los algoritmos basados ​​en estructuras se han realizado de forma rutinaria como un esfuerzo de la comunidad D3R Grand Challenge58,59, lo que muestra mejoras continuas en las predicciones de energía de enlace y pose de ligando para los mejores algoritmos.

A lo largo de los años, se han publicado los resultados de muchas campañas exitosas de detección prospectiva basadas en la estructura que cubren todas las clases principales de objetivos, más recientemente los GPCR, como se revisa en las refs. 17,51,60, mientras que muchos más se han utilizado en la industria. Los conjuntos de ligandos candidatos enfocados, predichos por dicha selección, a menudo muestran tasas de aciertos útiles (10-40%) en pruebas experimentales60, lo que produce nuevos aciertos para muchos objetivos con potencias en el rango de 0.1-10-μM (para aquellos que están publicados, en el menos). Sin embargo, los pasos adicionales en la optimización de los resultados iniciales obtenidos a partir de bibliotecas de cribado estándar de menos de 10 millones de compuestos suelen requerir una costosa síntesis personalizada de análogos, que solo se ha logrado en unos pocos casos publicados20,61.

La identificación de aciertos directamente en espacios químicos mucho más grandes, como REAL Space, no solo puede generar más y mejores aciertos31, sino que también respalda su optimización, ya que cualquier acierto resultante tiene miles de análogos y derivados en el mismo espacio bajo demanda. Esta ventaja fue especialmente útil para objetivos tan desafiantes como la proteasa principal del SARS-CoV-2 (Mpro), para la cual cientos de intentos estándar de detección de ligandos virtuales (VLS) resultaron en vano62 (consulte la discusión sobre los desafíos de Mpro en 'Hybrid in vitro– enfoques in silico' a continuación). Aunque las tasas de aciertos iniciales fueron bajas incluso en las pantallas ultragrandes, VirtualFlow24 de la base de datos REAL con 1.400 millones de compuestos aún identificó aciertos en el rango de 10 a 100 µM, que se optimizaron a través de la síntesis bajo demanda63 para generar pistas de calidad con el mejor compuesto Z222979552 (la mitad de la concentración inhibitoria máxima (IC50) = 1,0 μM). Otra pantalla ultragrande de 235 millones de compuestos, basada en una estructura Mpro más nueva con un inhibidor no covalente (Protein Data Bank (PDB) ID: 6W63), también produjo aciertos viables, cuya rápida optimización resultó en el descubrimiento de nanomolar Mpro inhibidores en solo 4 meses mediante una combinación de química personalizada simple y bajo demanda64. El mejor compuesto en este trabajo tenía buenas propiedades ADMET in vitro, con una afinidad de 38 nM y una potencia antiviral basada en células de 77 nM, que son comparables al uso clínico de PF-07321332 (nirmatrelvir)65.

Con el aumento del tamaño de las bibliotecas, el tiempo computacional y el costo del acoplamiento se convierten en el principal cuello de botella en la detección, incluso con computación en la nube masivamente paralela60. Recientemente se han sugerido enfoques iterativos para abordar bibliotecas de este tamaño; por ejemplo, VirtualFlow utilizó el filtrado paso a paso de toda la biblioteca con algoritmos de acoplamiento de precisión creciente para examinar aproximadamente 1400 millones de compuestos Enamine REAL23,24. Aunque mejora varias veces la velocidad, el método aún requiere una biblioteca completamente enumerada y su costo computacional crece linealmente con la cantidad de compuestos, lo que limita su aplicabilidad en espacios químicos en rápida expansión.

La idea de diseñar moléculas a partir de un conjunto limitado de fragmentos para llenar de manera óptima el bolsillo de unión del receptor ha sido considerada desde los primeros años del descubrimiento de fármacos, implementada, por ejemplo, en el algoritmo LUDI66. Sin embargo, la síntesis personalizada de los compuestos diseñados siguió siendo el principal cuello de botella de tales enfoques. La tecnología de detección de enumeración jerárquica de sintones virtuales (V-SYNTHES)26 desarrollada recientemente aplica un diseño basado en fragmentos a espacios químicos bajo demanda, evitando así los desafíos de la síntesis personalizada (Fig. 3). Comenzando con el catálogo de reacciones y bloques de construcción (synthons) de REAL Space, V-SYNTHES primero prepara una biblioteca mínima de fragmentos químicos representativos al enumerar completamente los sintones en uno de los puntos de unión, cubriendo la otra posición (o posiciones) con un metilo o grupo fenilo. El cribado basado en el acoplamiento permite la selección de los fragmentos de mayor puntuación (por ejemplo, el 0,1 % superior) que se prevé que se unan bien al bolsillo de destino. Esto se repite para una segunda posición (y luego las posiciones tercera y cuarta, si están disponibles), y las bibliotecas enfocadas resultantes se analizan en cada iteración contra el bolsillo de destino. En el paso final, los aproximadamente 50 000 compuestos completos principales de REAL Space se acoplan con parámetros o métodos de acoplamiento más elaborados y precisos, y los candidatos de mayor rango se filtran por novedad, diversidad y variedad de propiedades similares a las drogas deseadas. En el posprocesamiento, se seleccionan los mejores 50–500 compuestos para la síntesis y las pruebas. Nuestra evaluación sugiere que combinar synthons con los andamios y cubrirlos con grupos mínimos ficticios en el algoritmo V-SYNTHES es un requisito crítico para las predicciones óptimas de fragmentos porque los grupos reactivos de bloques de construcción y andamios a menudo crean interacciones fuertes, aunque falsas, que no están presentes. en la molécula completa. Otra parte importante del algoritmo es la evaluación de la pose de unión de fragmentos en el objetivo, que prioriza los golpes con topes mínimos que apuntan a una región del bolsillo donde el fragmento tiene espacio para crecer.

Una descripción general del algoritmo V-SYNTHES que permite la detección eficaz de más de 31 mil millones de compuestos en REAL Space o incluso en espacios químicos más grandes, mientras realiza la enumeración y el acoplamiento de solo pequeñas fracciones de moléculas. El algoritmo, ilustrado aquí usando una reacción de dos componentes basada en un andamio de sulfonamida con sintones R1 y R2, se puede aplicar a cientos de reacciones optimizadas de dos componentes, tres componentes o más componentes repitiendo iterativamente los pasos 3 y 4 hasta que esté completamente Se obtienen moléculas enumeradas que se ajustan de manera óptima al bolsillo objetivo. DOLOR, compuestos de interferencia de ensayo pan.

Inicialmente aplicado para descubrir nuevos quimiotipos para los antagonistas del receptor cannabinoide CB2, V-SYNTHES ha mostrado una tasa de aciertos del 23 % para los ligandos submicromolares, lo que superó cinco veces la tasa de aciertos del VLS estándar, mientras que consume unas 100 veces menos recursos informáticos26. Se encontró una tasa de aciertos similar para el cribado de cinasa ROCK1 en el mismo estudio, con un acierto en el rango nanomolar bajo26. V-SYNTHES se está aplicando a otros objetivos terapéuticamente relevantes con estructuras de bolsillo bien definidas.

BioSolveIT ha implementado un enfoque similar, acoplamiento espacial químico, hasta ahora para reacciones de dos componentes67. Este método es aún más rápido, ya que acopla fragmentos de bloques de construcción individuales y luego los enumera con andamios y otros sintetizadores. Sin embargo, existen compensaciones por la velocidad adicional: el acoplamiento de fragmentos más pequeños sin andamios es menos confiable y sus grupos reactivos a menudo tienen propiedades diferentes del producto de reacción. Esto puede introducir fuertes interacciones con el receptor que son irrelevantes para el compuesto final y pueden confundir la selección de fragmentos. Esto es especialmente cierto para las reacciones de cicloadicción y los andamios de tres componentes, que necesitan una mayor validación en el acoplamiento espacial químico.

Además de respaldar la abundancia, la diversidad química y la calidad potencial de los aciertos, los enfoques modulares basados ​​en la estructura son especialmente efectivos para identificar aciertos con una novedad química sólida, ya que (1) no se basan en la información de los ligandos existentes y (2) identifican ligandos que nunca han sido sintetizados antes. Este es un factor importante para asegurar la patentabilidad de la materia química para los compuestos de éxito y las series de plomo que surgen del cribado a gigaescala. Además, miles de análogos fácilmente sintetizables aseguran un extenso SAR por catálogo para los mejores éxitos, lo que, por ejemplo, permitió una mejora de la potencia y la selectividad de aproximadamente 100 veces para los éxitos de CB2 V-SYNTHES26. La disponibilidad de las extensiones de espacio químico a pedido de múltiples capas (por ejemplo, compatibles con los componentes básicos de MADE47) también puede agilizar en gran medida los siguientes pasos en la optimización de clientes potenciales a través de 'MedChem virtual', lo que reduce la síntesis personalizada extensa.

En la era del reconocimiento facial basado en IA, ChatGPT y AlphaFold68, existe un enorme interés en las aplicaciones de enfoques de DL basados ​​en datos en el descubrimiento de fármacos, desde la identificación de objetivos hasta la optimización de prospectos y la medicina traslacional (como se revisa en las refs. 69, 70, 71). ).

Los enfoques basados ​​en datos tienen una larga historia en el descubrimiento de fármacos, en los que los algoritmos de ML, como la máquina de vectores de soporte, el bosque aleatorio y las redes neuronales, se han utilizado ampliamente para predecir las propiedades de los ligandos y las actividades en los objetivos, aunque con resultados mixtos. Los modelos cuantitativos precisos de relación estructura-propiedad (QSPR) pueden predecir propiedades fisicoquímicas (por ejemplo, solubilidad y lipofilia) y farmacocinéticas (por ejemplo, biodisponibilidad y penetración de la barrera hematoencefálica), en las que se encuentran disponibles grandes y amplios conjuntos de datos experimentales para el entrenamiento del modelo y seguir creciendo72,73,74. ML también se implementa en muchos algoritmos SAR cuantitativos (QSAR)75, en los que el conjunto de entrenamiento y los modelos resultantes se centran en un objetivo determinado y un andamio químico, lo que ayuda a guiar la optimización de la potencia y la afinidad del plomo. También se han sugerido métodos basados ​​en amplios conjuntos de datos de unión de ligando-objetivo, agrupación de similitudes químicas y enfoques basados ​​en redes para la reutilización de fármacos76,77.

El advenimiento de DL lleva los modelos basados ​​en datos al siguiente nivel, lo que permite el análisis de conjuntos de datos mucho más grandes y diversos mientras se derivan relaciones no lineales más complicadas, con una vasta literatura que describe metodologías y aplicaciones específicas de DL para el descubrimiento de fármacos27,70. Por su naturaleza de "aprender de ejemplos", la IA requiere conjuntos de datos de ligandos completos para entrenar los modelos predictivos. Para QSPR, se han acumulado grandes bases de datos públicas y privadas, con varias propiedades como solubilidad, lipofilicidad o proxies in vitro para la biodisponibilidad oral y la permeabilidad cerebral medidas experimentalmente para muchos miles de compuestos diversos, lo que permite la predicción de estas propiedades en una amplia gama de nuevos compuestos.

Sin embargo, la calidad de los modelos QSAR difiere para las diferentes clases de objetivos según la disponibilidad de datos, con la mayoría de los avances logrados para la superfamilia de quinasas y los GPCR aminérgicos. Un punto de referencia imparcial de los mejores modelos ML QSAR fue proporcionado por un reciente IDG-DREAM Drug-Kinase Binding Prediction Challenge con la participación de más de 200 expertos78. Los mejores modelos predictivos en esta evaluación ciega incluyeron el aprendizaje del kernel, el aumento de gradiente y los algoritmos basados ​​en DL. El modelo de mejor desempeño (del equipo QED) usó una regresión kernel, similitud de secuencia de proteínas y valores de afinidad de más de 60 000 pares compuesto-quinasa entre 13 608 compuestos y 527 quinasas de las bases de datos ChEMBL79 y Drug Target Commons80 como datos de entrenamiento. El mejor modelo de DL usó hasta 900 000 puntos de datos experimentales de unión de ligandos para el entrenamiento, pero aún estaba a la zaga del modelo kernel mucho más simple en rendimiento. Los mejores modelos lograron un coeficiente de clasificación de Spearman de 0,53 con un error cuadrático medio de 0,95 para los valores de pKd previstos frente a los experimentales en el conjunto de prueba. Se descubrió que dicha precisión estaba a la par con la precisión y la recuperación de los ensayos experimentales de un solo punto para la inhibición de la quinasa, y puede ser útil en las evaluaciones de los éxitos iniciales para las quinasas menos exploradas y guiar la optimización de la guía. Tenga en cuenta, sin embargo, que la familia de quinasas es única, ya que es la clase más grande de más de 500 objetivos, todos con bolsillos de unión ortostéricos similares y que comparten una alta selectividad cruzada. La distante segunda familia con reactividad cruzada sistemática comprende alrededor de 50 GPCR aminérgicos, mientras que otras familias de GPCR y otras familias de proteínas con reacción cruzada son mucho más pequeñas. Queda por probar el rendimiento y la generalización de los métodos ML y DL para estos y otros objetivos.

El desarrollo de modelos ampliamente generalizables o incluso universales es la aspiración clave del descubrimiento de fármacos impulsado por la IA. Una de las direcciones aquí es extraer modelos generales de afinidades de unión (funciones de puntaje de unión) de datos sobre actividades de ligando conocidas y estructuras 3D de proteína-ligando correspondientes, por ejemplo, recopiladas en la base de datos PDBbind81 u obtenidas del acoplamiento. Dichos modelos exploran varios enfoques para representar las arquitecturas de datos y redes, incluidos los modelos convolucionales de gráficos espaciales82,83, las redes neuronales convolucionales profundas en 3D84,85 o sus combinaciones86. Sin embargo, un estudio reciente encontró que, independientemente de la arquitectura de la red neuronal, una descripción explícita de las interacciones intermoleculares no covalentes en los complejos PDBbind no proporciona ninguna ventaja estadística en comparación con aproximaciones más simples de solo ligando o solo receptor que omiten las interacciones87. Por lo tanto, los buenos resultados de los modelos de DL basados ​​en PDBbind se basan en la memorización de ligandos y receptores similares, en lugar de capturar información general sobre su unión. Una posible explicación de este fenómeno es que la base de datos PDBbind no tiene una presentación adecuada de "espacio negativo", es decir, ligandos con patrones de interacción subóptimos para hacer cumplir el entrenamiento.

Este percance ejemplifica la necesidad de una mejor comprensión del comportamiento de los modelos DL y su dependencia de los datos de entrenamiento, lo cual es ampliamente reconocido en la comunidad de IA. Se ha demostrado que los modelos DL, especialmente los basados ​​en conjuntos de datos limitados que carecen de datos negativos, son propensos al sobreentrenamiento y al rendimiento espurio, lo que a veces conduce a clases enteras de modelos considerados 'inútiles'88 o gravemente sesgados por factores subjetivos que definen el conjunto de datos de entrenamiento89. Se están desarrollando herramientas estadísticas para definir el rango de aplicabilidad y validar cuidadosamente el desempeño de los modelos. Uno de los conceptos propuestos es el marco de previsibilidad, computabilidad y estabilidad para la 'ciencia de datos verídica'90. Los líderes de la comunidad de IA han identificado específicamente la selección adecuada de datos de calidad como el requisito principal para cerrar la 'brecha de producción', o la incapacidad de los modelos ML para tener éxito cuando se implementan en el mundo real, lo que requiere un análisis de datos. enfoque centrado en la IA91,92. También ha habido intentos de desarrollar herramientas para hacer que la IA sea 'explicable', es decir, capaz de formular algunas tendencias generales en los datos, específicamente en las aplicaciones de descubrimiento de fármacos93.

A pesar de estos desafíos y limitaciones, la IA ya está comenzando a tener un efecto sustancial en el descubrimiento de fármacos, con los primeros candidatos a fármacos basados ​​en IA que se incorporan a los estudios preclínicos y clínicos. Para las quinasas, los compuestos impulsados ​​por AI se informaron como inhibidores in vivo potentes y efectivos del receptor tirosina quinasa DDR1, que está involucrado en la fibrosis9. Se han anunciado ensayos clínicos de fase I para ISM001-055 (también conocido como INS018_055) para el tratamiento de la fibrosis pulmonar idiopática10, aunque no se ha revelado la identidad del compuesto y su objetivo. Para los GPCR, los compuestos impulsados ​​por IA dirigidos a los receptores 5-HT1A, 5-HT1A–5-HT2A dual y A2A han ingresado recientemente en ensayos clínicos, lo que brinda más apoyo para el concepto de descubrimiento de fármacos impulsado por IA. Estas primeras historias de éxito provienen de familias de quinasas y GPCR con una farmacología ya bien estudiada, y los compuestos muestran una gran similitud química con los andamios de alta afinidad conocidos94. Es importante que la próxima generación de candidatos a fármacos para la DL mejore en cuanto a novedad y rango de aplicabilidad.

Como se discutió anteriormente, los enfoques basados ​​en la física y basados ​​en datos tienen claras ventajas y limitaciones en la predicción de la potencia del ligando. Las predicciones de acoplamiento basadas en estructuras se pueden generalizar naturalmente a cualquier objetivo con estructuras 3D y pueden ser más precisas, especialmente en la eliminación de falsos positivos como el principal desafío de la detección. Por el contrario, los métodos basados ​​en datos pueden funcionar en lugar de estructuras y pueden ser más rápidos, especialmente con la aceleración de GPU, aunque tienen dificultades para generalizar más allá de las clases de objetivos ricas en datos. Por lo tanto, existen numerosos esfuerzos en curso para combinar enfoques basados ​​en la física y basados ​​en datos de algunas formas sinérgicas en general95, y específicamente en el descubrimiento de fármacos96.

En los enfoques de detección virtual, un uso sinérgico del acoplamiento basado en la física con funciones de puntuación basadas en datos puede ser muy beneficioso. Además, si las funciones de puntuación basadas en la física y en los datos son relativamente independientes y ambas generan enriquecimiento en las bibliotecas enfocadas seleccionadas, su combinación puede reducir las tasas de falsos positivos y mejorar la calidad de los resultados. Esta sinergia se refleja en los últimos resultados del 3DR Grand Challenge 4 para las predicciones del ligando IC5059, en los que los principales métodos que utilizaron una combinación de puntuación basada en la física y ML superaron a los que no utilizaron ML. En el futuro, la evaluación comparativa exhaustiva de los enfoques híbridos, de aprendizaje automático y basados ​​en la física será un enfoque clave de una nueva Evaluación crítica de experimentos computacionales de búsqueda de aciertos (CACHE), que evaluará cinco escenarios específicos relevantes para el descubrimiento y la optimización prácticos de aciertos y clientes potenciales97.

En un nivel más profundo, los resultados del acoplamiento preciso basado en la física (además de los datos experimentales, por ejemplo, de PDBbind81) se pueden usar para entrenar gráficos generalizados o modelos 3D DL que predicen la afinidad ligando-receptor. Esto ayudaría a expandir notablemente el conjunto de datos de entrenamiento y equilibrar los ejemplos positivos y negativos (unión subóptima), lo cual es importante para evitar los problemas de sobreentrenamiento descritos en la ref. 87. Estas funciones de puntuación 3D basadas en DL para predecir la afinidad de unión molecular de un complejo ligando-proteína acoplado se están desarrollando y comparando, más recientemente RTCNN98, aunque su utilidad práctica aún no se ha demostrado.

Para ampliar el rango de aplicabilidad de acoplamiento basado en la estructura a aquellos objetivos que carecen de estructuras de alta resolución, también es tentador usar modelos 3D AlphaFold2 (refs. 99,100) o RosettaFold101 derivados de IA, que ya muestran utilidad en muchas aplicaciones, incluidas las proteínas. acoplamiento de proteínas y proteínas-péptidos102. Los modelos de homología tradicionales basados ​​en una estrecha similitud de proteínas, especialmente cuando se refinan con ligandos conocidos103, se han utilizado en el acoplamiento de moléculas pequeñas y la detección virtual104, por lo que se espera que AlphaFold2 amplíe aún más el alcance del modelado estructural y su precisión. En un informe reciente, los modelos AlphaFold2, aumentados por otros enfoques de IA, ayudaron a identificar un inhibidor de molécula pequeña de la cinasa 20 dependiente de ciclina (CDK20), aunque con una afinidad modesta de 8,9 μM (ref. 105). Sin embargo, una evaluación comparativa más general del rendimiento de los modelos AlphaFold2 en la detección virtual arroja resultados mixtos. En un punto de referencia centrado en objetivos con estructuras cristalinas existentes, la mayoría de los modelos AlphaFold2 tuvieron que limpiarse de bucles que bloqueaban el bolsillo de unión y/o aumentarse con iones conocidos u otros cofactores para lograr un enriquecimiento razonable de hits106. Para los casos más prácticos de objetivos que carecen de estructuras experimentales, especialmente para clases de objetivos con homologías estructurales menos obvias en el bolsillo de unión de ligandos, el rendimiento de los modelos AlphaFold2 en acoplamiento de moléculas pequeñas mostró resultados decepcionantes en evaluaciones recientes para GPCR y objetivos antibacterianos107,108 . El enfoque AphaFill109 recientemente desarrollado para 'trasplantar' cofactores y ligandos de moléculas pequeñas de estructuras PDB a modelos AlphaFold2 homólogos puede ayudar potencialmente a validar y optimizar estos modelos, aunque se está realizando una evaluación adicional de su utilidad para el acoplamiento y la detección virtual.

Para acelerar la detección virtual de bibliotecas químicas ultragrandes, varios grupos han sugerido enfoques iterativos híbridos, en los que los resultados del acoplamiento basado en la estructura de un subconjunto de biblioteca dispersa se usan para entrenar modelos ML, que luego se usan para filtrar toda la biblioteca para reducir aún más su tamaño. Estos métodos, incluidos MolPal25, Active Learning110 y DeepDocking111, informan una reducción de hasta 14-100 en el costo computacional para bibliotecas de 1400 millones de compuestos, aunque no está claro cómo escalarían a espacios químicos de rápido crecimiento.

Deberíamos enfatizar aquí que las funciones de puntuación en los algoritmos de acoplamiento rápido y los modelos ML están diseñadas y entrenadas principalmente para separar de manera efectiva los aglutinantes objetivo potenciales de los no aglutinantes, aunque no son muy precisos en las predicciones de afinidades o potencias de unión. Para predicciones de potencia más precisas, la biblioteca enfocada más pequeña de aglutinantes candidatos seleccionados por la IA inicial o la detección basada en acoplamiento se puede analizar y clasificar más a fondo utilizando herramientas basadas en la física más elaboradas, incluidos métodos de perturbación de energía libre para energía libre relativa112 y absoluta113,114,115 de unión de ligandos. Aunque estos métodos son mucho más lentos, la utilización de cálculos acelerados por GPU28 tiene el potencial para su aplicación más amplia en el posprocesamiento en campañas de selección virtual para enriquecer aún más las tasas de éxito de los candidatos de alta afinidad (Fig. 2), así como en la optimización de clientes potenciales. etapas

El advenimiento de métodos rápidos y prácticos para la detección de espacios químicos a gigaescala para el descubrimiento de fármacos estimula un mayor crecimiento de estos espacios bajo demanda, lo que respalda una mejor diversidad y la calidad general de los aciertos y pistas identificados. Desarrollada específicamente para la detección de V-SYNTHES, la extensión xREAL de Enamine REAL Space ahora comprende 173 000 millones de compuestos116, y se puede expandir aún más a 1015 compuestos y más al aprovechar un conjunto de bloques de construcción aún más grande (por ejemplo, a 680 millones de MADE building bloques47), al incluir andamios de cuatro o cinco componentes, y al usar nuevas químicas similares a clics a medida que se descubren. Las pruebas en el mundo real de REAL Space mejorado con MADE y otros espacios químicos comerciales y patentados permitirán una evaluación más amplia de su capacidad de síntesis y utilidad general38,117,118. Paralelamente, se pueden construir bibliotecas ultragrandes especializadas para andamios importantes subrepresentados en espacios bajo demanda de uso general, por ejemplo, la detección de una biblioteca virtual de 75 millones de tetrahidropiridinas fácilmente sintetizables produjo recientemente potentes agonistas para el receptor 5-HT2A119.

El crecimiento adicional del tamaño y la diversidad del espacio químico bajo demanda también está respaldado por el desarrollo reciente de nuevas reacciones robustas para el ensamblaje de bloques de construcción con un clic. Además de la química de clic de cicloadición de azida-alquino 'clásica'120, reconocida por el Premio Nobel de química de 2022121, y las reacciones de tipo clic optimizadas que incluyen SuFEx122, los desarrollos más recientes como el acoplamiento cruzado doblemente descarboxilador electrocatalizado con Ni123 son prometedores. Otras reacciones de formación de carbono-carbono utilizan boronatos de ácido metiliminodiacético para los acoplamientos Csp2-Csp2124 y, más recientemente, boronatos de ácido tetrametil N-metiliminodiacético125 para la formación de enlaces Csp3-C estereoespecíficos. Cada una de estas reacciones aplicadas iterativamente puede generar nuevos espacios químicos bajo demanda de miles de millones de compuestos diversos que operan con un número limitado de componentes básicos. De manera similar al ensamblaje automático de aminoácidos que se usa de manera rutinaria en la síntesis de péptidos, se podrían llevar a cabo procesos completamente automatizados con robots capaces de producir una biblioteca de compuestos similares a fármacos bajo demanda utilizando combinaciones de unos pocos miles de bloques de construcción diversos126,127,128. Tales máquinas ya están funcionando, aunque la producción a gran escala de miles de bloques de construcción especializados sigue siendo el cuello de botella.

El desarrollo de espacios químicos generativos más robustos también puede ser respaldado por nuevos enfoques computacionales en química sintética, por ejemplo, predicciones de nuevas secuencias de reacción iterativas129 o rutas sintéticas y viabilidad a partir del análisis retrosintético basado en DL130. En los modelos generativos, las predicciones de capacidad de síntesis se pueden combinar con predicciones de potencia y otras propiedades hacia niveles más altos de diseño químico automatizado131. Por lo tanto, las redes adversarias generativas combinadas con el aprendizaje por refuerzo (GAN-RL) se utilizaron recientemente para predecir la viabilidad sintética, la novedad y la actividad biológica de los compuestos, lo que permite el ciclo iterativo de optimización, síntesis y prueba in silico de los ligandos in vitro50,132. Cuando se aplican dentro de un conjunto de reacciones bien establecidas y clases de objetivos explorados farmacológicamente, estos enfoques ya producen éxitos y pistas útiles, lo que conduce a candidatos clínicos50,132. Sin embargo, queda por ver el potencial más amplio de los conceptos de diseño químico automatizado y la síntesis robótica en el descubrimiento de fármacos.

Aunque la evaluación comparativa ciega y las recientes historias de éxito de detección prospectiva para el creciente número de objetivos respaldan la utilidad de las herramientas computacionales modernas, hay clases completas de objetivos desafiantes, en los que no se espera que los enfoques de detección in silico existentes funcionen muy bien por sí mismos. Algunos de los casos más difíciles son objetivos con bolsas crípticas o poco profundas que tienen que abrirse o someterse a un ajuste inducido sustancial para enganchar el ligando, como se encuentra a menudo cuando se apunta a sitios alostéricos, por ejemplo, en quinasas o GPCR, o interacciones proteína-proteína en vías de señalización. .

Aunque los enfoques de bioinformática y dinámica molecular pueden ayudar a detectar y analizar bolsas alostéricas y crípticas133, las herramientas computacionales por sí solas a menudo son insuficientes para apoyar el descubrimiento de ligandos para sitios tan desafiantes. Los bolsillos crípticos y poco profundos, sin embargo, se han manejado con bastante éxito mediante enfoques de descubrimiento de fármacos basados ​​en fragmentos, que comienzan con la detección experimental de la unión de pequeños fragmentos. Los resultados iniciales se detectan mediante métodos muy sensibles, como BIACORE, RMN, rayos X134,135 y, potencialmente, microscopía crioelectrónica136, para detectar de forma fiable la unión débil, normalmente en el rango de 10 a 100 μM. La detección inicial del objetivo también se puede realizar con fragmentos decorados por una ojiva química que permite la unión covalente impulsada por la proximidad de un ligando de baja afinidad137. En cualquier caso, la elaboración de aciertos de fragmentos iniciales en ligandos completos de alta afinidad es el cuello de botella clave del descubrimiento de fármacos basado en fragmentos, lo que requiere un gran esfuerzo que implica el "crecimiento" del fragmento o la unión de dos o más fragmentos. Este suele ser un proceso iterativo que implica el diseño y la síntesis de ligandos personalizados que puede llevar muchos años134,138. Al mismo tiempo, la detección virtual basada en la estructura puede ayudar a elaborar computacionalmente los fragmentos para que coincidan con la conformación identificada experimentalmente del bolsillo de unión objetivo. Este enfoque es más rentable y se puede aplicar cuando se identifican aciertos de fragmentos a partir de los bloques de construcción del espacio bajo demanda o sus análogos cercanos para facilitar la elaboración en el mismo espacio bajo demanda139.

Los ejemplos recientes de enfoques de diseño computacional basados ​​en fragmentos híbridos dirigidos a los inhibidores del SARS-CoV-2 resaltan los desafíos que presentan dichos objetivos y permiten comparaciones directas con VLS ultragrandes. Uno de los estudios estaba dirigido a la enzima de macrodominio conservada SARS-CoV-2 NSP3 (Mac1), que es un objetivo crítico para la patogénesis y la letalidad del virus. Sobre la base de la detección cristalográfica de los fragmentos de baja afinidad (180 μM) que se unen débilmente a Mac1 (ref. 139), la fusión de los fragmentos identificó un golpe de 1 μM, optimizado rápidamente mediante síntesis de catálogo a un lead140 de 0,4 μM. En el mismo estudio, una exploración a ultraescala de 400 millones de bases de datos REAL identificó más de 100 nuevos quimiotipos diversos de ligandos similares a fármacos, con una optimización de SAR por catálogo de seguimiento que arrojó una ventaja de 1,7 μM140. Para la proteasa principal Mpro del SARS-CoV-2, la iniciativa COVID Moonshot publicó los resultados del cribado cristalográfico de 1.500 fragmentos pequeños con 71 aciertos unidos en diferentes subbolsillos del sitio activo poco profundo, aunque ninguno de ellos mostró inhibición in vitro de la proteasa incluso a 100 µM (ref. 141). Numerosos grupos de crowdsourcing del diseño computacional de seguimiento y la detección de fragmentos fusionados y en crecimiento ayudaron a descubrir varias series de SAR, incluido un inhibidor de Mpro no covalente con un IC50 enzimático de 21 μM. La optimización adicional mediante enfoques computacionales basados ​​en estructuras e impulsados ​​por IA, que utilizaron más de 10 millones de bloques de construcción MADE Enamine, condujo al descubrimiento de candidatos preclínicos con IC50 basado en células en el rango de aproximadamente 100 nM, acercándose a la potencia de nirmatrelvir65 . La enorme escala, urgencia y complejidad de este esfuerzo de Moonshot con más de 2400 compuestos sintetizados bajo demanda y medidos en más de 10 000 ensayos no tienen precedentes y esto destaca los desafíos del diseño de novo de inhibidores no covalentes de Mpro.

Más allá de la iniciativa Moonshot, una avalancha de esfuerzos de detección virtual arrojó resultados en su mayoría decepcionantes62, por ejemplo, el fármaco antipalúdico ebselen, que se propuso en una de las primeras pruebas virtuales142, fracasó en los ensayos clínicos. Sin embargo, la mayoría de estos estudios seleccionaron conjuntos de ligandos pequeños centrados en la reutilización de fármacos existentes, carecían de apoyo experimental y utilizaron la primera estructura de Mpro resuelta en un complejo de ligandos covalentes (PDB ID: 6LU7) que no era óptimo para acoplar moléculas no covalentes142.

En comparación, varios estudios que analizaron bibliotecas ultragrandes pudieron identificar inhibidores de Mpro no covalentes de novo en el rango de 10 a 100 μM24,62,63,143, mientras que probaron experimentalmente solo unos pocos cientos de compuestos sintetizados bajo demanda. Uno de estos estudios profundizó en estos débiles aciertos de VLS al probar sus análogos a pedido de Enamine, revelando un líder con IC50 = 1 μM en ensayos basados ​​en células y validando su unión no covalente cristalográficamente63. Otro estudio basado en una estructura cocristalina no covalente posterior y más adecuada de Mpro (PDB ID: 6W63) utilizó una estrategia de acoplamiento y optimización ultragrande para descubrir compuestos de plomo de 38 nM aún más potentes64. Tenga en cuenta que, aunque los resultados de las evaluaciones ultragrandes iniciales para Mpro fueron modestos, estuvieron a la par con los esfuerzos mucho más elaborados y costosos del enfoque híbrido Moonshot, con una optimización bajo demanda simple que condujo a candidatos preclínicos de calidad similar. Estos ejemplos sugieren que, incluso para los bolsillos poco profundos desafiantes, la detección virtual basada en la estructura a menudo puede proporcionar una alternativa viable cuando se realiza a gigaescala y está respaldada por estructuras precisas, pruebas suficientes y esfuerzo de optimización.

Con todos los desafíos y advertencias, la capacidad emergente de las herramientas in silico para aprovechar de manera efectiva la enorme abundancia y diversidad de espacios químicos bajo demanda similares a las drogas en las etapas clave del objetivo al impacto para conducir a la clínica hacen Es tentador pedir la transformación del ecosistema DDD de asistido por computadora a impulsado por computadora144 (Fig. 4). En la etapa temprana de identificación de aciertos, los enfoques de detección virtual a ultraescala, tanto basados ​​en la estructura como en la IA, se están convirtiendo en la corriente principal para proporcionar puntos de entrada rápidos y rentables en las campañas de descubrimiento de fármacos. En la etapa hit-to-lead, las herramientas de predicción de potencia más elaboradas, como la perturbación de energía libre y QSAR basado en IA, a menudo guían la optimización racional de la potencia del ligando. Más allá de la potencia y la selectividad en el objetivo, varias herramientas computacionales basadas en datos se utilizan de forma rutinaria en la optimización multiparamétrica de la serie de cables que incluye las propiedades ADMET y PK. Cabe destacar que es probable que los espacios químicos de más de 1010 compuestos diversos contengan millones de resultados iniciales para cada objetivo20 (Cuadro 1), miles de pistas potentes y selectivas y, con algo de química médica limitada en el mismo espacio químico altamente manejable, candidatos a fármacos listo para estudios preclínicos. Para aprovechar este potencial, las herramientas computacionales deben volverse más sólidas y estar mejor integradas en la tubería de descubrimiento general para garantizar su impacto en la traducción de los éxitos iniciales en el desarrollo preclínico y clínico.

Comparación esquemática del HTS estándar más canalización de descubrimiento impulsada por síntesis personalizada frente a la canalización impulsada por computación. Este último se basa en espacios químicos virtuales generativos o bajo demanda de fácil acceso, así como en herramientas computacionales basadas en estructuras y basadas en IA que agilizan cada paso del proceso de descubrimiento de fármacos.

No se debe olvidar aquí que cualquier modelo computacional, por muy útil o preciso que sea, nunca puede asegurar que todas las predicciones sean correctas. En la práctica, las mejores campañas de detección virtual resultan en un 10-40 % de aciertos de candidatos confirmados en la validación experimental, mientras que las mejores predicciones de afinidad utilizadas en la optimización rara vez tienen una precisión superior a 1 kcal mol-1 de error cuadrático medio. Se aplican limitaciones similares a los modelos computacionales actuales que predicen las propiedades ADMET y PK. Por lo tanto, las predicciones computacionales siempre necesitan validación experimental en ensayos robustos in vitro e in vivo en cada paso de la tubería. Al mismo tiempo, las pruebas experimentales de predicciones también proporcionan datos que pueden retroalimentar para mejorar la calidad de los modelos al expandir sus conjuntos de datos de entrenamiento, especialmente para las predicciones de propiedades de ligandos. Por lo tanto, los modelos QSPR basados ​​en DL se beneficiarán enormemente de una mayor acumulación de datos en ensayos de permeabilidad celular como CACO-2 y MDCK, así como nuevas tecnologías avanzadas como órganos en un chip u organoides funcionales para proporcionar mejores estimaciones. de las propiedades de ADMET y PK sin engorrosos experimentos in vivo. La capacidad de entrenar modelos ADMET y PK con datos de ensayos in vitro que representen las especies más relevantes para el desarrollo de fármacos (por lo general, ratones, ratas y humanos) también ayudaría a abordar la variabilidad de las especies como un desafío importante para el éxito de los estudios de traducción. Todo esto crea un círculo virtuoso para mejorar los modelos computacionales hasta el punto en que pueden impulsar la selección compuesta para la mayoría de los puntos finales de DDD. Cuando se combina con pruebas in vitro más precisas, esto puede reducir y eventualmente eliminar los requisitos de las pruebas con animales (como lo indicó recientemente la FDA)145.

Construir proyectos híbridos in silico-in vitro con fácil acceso al enorme espacio químico bajo demanda en todas las etapas del proceso de gen a líder puede ayudar a generar abundantes reservas de diversos compuestos de plomo con potencia, selectividad y propiedades ADMET y PK óptimas. , lo que da como resultado un menor compromiso en la optimización multiparámetro para candidatos clínicos. La ejecución de este tipo de canalizaciones computacionalmente ricas en datos requiere herramientas generales de gestión de datos para el descubrimiento de fármacos, muchas de las cuales se implementan en centros farmacéuticos y académicos de DDD146,147. La construcción de canalizaciones impulsadas por computación también ayudará a revelar vínculos débiles o faltantes, en los que se pueden necesitar nuevos enfoques y datos adicionales para generar modelos mejorados, lo que ayudará a llenar los vacíos computacionales restantes en la canalización DDD. Siempre que esta integración sistemática continúe, el descubrimiento de ligandos impulsado por computadora tiene un gran potencial para reducir las barreras de entrada para generar moléculas para numerosas líneas de investigación, ya sean sondas in vivo para objetivos nuevos y poco estudiados148, polifarmacología y señalización pluridimensional, o fármacos candidatos para enfermedades raras y medicina personalizada.

Austin, D. & Hayford, T. Investigación y desarrollo en la industria farmacéutica. CBO https://www.cbo.gov/publication/57126 (2021).

Sun, D., Gao, W., Hu, H. & Zhou, S. ¿Por qué falla el 90 % del desarrollo de fármacos clínicos y cómo mejorarlo? Acta Pharm. Pecado. B 12, 3049–3062 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Bajorath, J. Descubrimiento de fármacos asistido por computadora. F1000Res. 4, Facultad F1000 Rev-1630 (2015).

Artículo Google Académico

Van Drie, JH Diseño de fármacos asistido por computadora: los próximos 20 años. J. Cómputo. Mol asistido. Des. 21, 591–601 (2007).

Artículo ADS CAS PubMed Google Scholar

Talele, TT, Khedkar, SA y Rigby, AC Aplicaciones exitosas del descubrimiento de fármacos asistido por computadora: mover fármacos del concepto a la clínica. actual Arriba. Medicina. química 10, 127–141 (2010).

Artículo CAS PubMed Google Académico

Macalino, SJY, Gosu, V., Hong, S. & Choi, S. Papel del diseño de fármacos asistido por computadora en el descubrimiento moderno de fármacos. Arco. Farmacal. Res. 38, 1686-1701 (2015).

Artículo CAS Google Académico

Sabe, VT et al. Tendencias actuales en el diseño de fármacos asistido por computadora y un punto destacado de los fármacos descubiertos a través de técnicas computacionales: una revisión. EUR. J.Med. química 224, 113705 (2021).

Artículo CAS PubMed Google Académico

Jayatunga, MK, Xie, W., Ruder, L., Schulze, U. y Meier, C. AI en el descubrimiento de fármacos de molécula pequeña: una ola que se avecina. Nat. Rev. Descubrimiento de Drogas. 21, 175–176 (2022).

Artículo CAS PubMed Google Académico

Zhavoronkov, A. et al. El aprendizaje profundo permite la identificación rápida de potentes inhibidores de la quinasa DDR1. Nat. Biotecnología. 37, 1038–1040 (2019). Este estudio afirma el descubrimiento de un candidato principal en solo 21 días, utilizando IA generativa, síntesis y pruebas in vitro e in vivo de los compuestos.

Artículo CAS PubMed Google Académico

Biblioteca Nacional de Medicina de EE. ClinicalTrials.gov https://clinicaltrials.gov/ct2/show/NCT05154240#contactlocation (2022).

Schrödinger. Schrödinger anuncia la aprobación de la FDA de la solicitud de un nuevo fármaco en investigación para SGR-1505, un inhibidor de MALT1. Schrödinger https://ir.schrodinger.com/node/8621/pdf (2022). Este comunicado de prensa establece que los métodos combinados basados ​​en la física y ML permitieron una pantalla computacional de 8.200 millones de compuestos y la selección de un candidato clínico después de 10 meses y solo 78 moléculas sintetizadas.

Jones, N. Cristalografía: secretos atómicos. Naturaleza 505, 602–603 (2014).

Artículo ADS CAS PubMed Google Scholar

Liu, W. et al. Cristalografía en serie de femtosegundos de receptores acoplados a proteína G. Ciencia 342, 1521–1524 (2013).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Nannenga, BL & Gonen, T. El método crio-EM de difracción de electrones de microcristales (MicroED). Nat. Métodos 16, 369–379 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Fernandez-Leiro, R. & Scheres, SH Desentrañando macromoléculas biológicas con microscopía crioelectrónica. Naturaleza 537, 339–346 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Renaud, J.-P. et al. Cryo-EM en el descubrimiento de fármacos: logros, limitaciones y perspectivas. Nat. Rev. Descubrimiento de Drogas. 17, 471–492 (2018).

Artículo CAS PubMed Google Académico

Congreve, M., de Graaf, C., Swain, NA y Tate, CG Impacto de las estructuras GPCR en el descubrimiento de fármacos. Celda 181, 81–91 (2020).

Artículo CAS PubMed Google Académico

Santos, R. et al. Un mapa completo de dianas moleculares de fármacos. Nat. Rev. Descubrimiento de Drogas. 16, 19–34 (2017).

Artículo CAS PubMed Google Académico

Grygorenko, OO et al. Generar un espacio químico multimillonario de compuestos de detección fácilmente accesibles. iScience 23, 101681 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Lyu, J. et al. Acoplamiento de biblioteca ultragrande para descubrir nuevos quimiotipos. Naturaleza 566, 224–229 (2019). Este es un estudio de acoplamiento ultra grande que también evaluó cuidadosamente las ventajas y los peligros potenciales de expandir el espacio químico.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Stein, RM et al. Descubrimiento virtual de ligandos de receptores de melatonina para modular los ritmos circadianos. Naturaleza 579, 609–614 (2020). Este estudio muestra un acoplamiento ultragrande que resultó en aciertos subnanomolares para un GPCR.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Alon, A. et al. Las estructuras del receptor sigma2 permiten el acoplamiento para el descubrimiento de ligandos bioactivos. Naturaleza 600, 759–764 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Una plataforma de descubrimiento de fármacos de código abierto permite pantallas virtuales ultragrandes. Naturaleza 580, 663–668 (2020). Este estudio muestra un filtrado de biblioteca iterativo como un primer enfoque para acelerar la detección virtual ultragrande.

Artículo ADS CAS PubMed PubMed Central Google Scholar

Gorgulla, C. et al. Un enfoque múltiple dirigido a las proteínas del SARS-CoV-2 mediante un examen virtual ultragrande. iScience 24, 102021 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Graff, DE, Shakhnovich, EI y Coley, CW Aceleración de la detección virtual de alto rendimiento a través del aprendizaje activo basado en grupos moleculares. química ciencia 12, 7866–7881 (2021). Este estudio presenta la aceleración de la detección ultragrande mediante la combinación iterativa de DL y acoplamiento.

Artículo CAS PubMed PubMed Central Google Scholar

Sadybekov, AA et al. Descubrimiento de ligandos basado en Synthon en bibliotecas virtuales de más de 11 mil millones de compuestos. Naturaleza 601, 452–459 (2022). Este estudio presenta el concepto modular para el cribado de espacios de gigaescala, V-SYNTHES, y valida su rendimiento en objetivos de GPCR y quinasa.

Artículo ADS CAS PubMed Google Scholar

Yang, X., Wang, Y., Byrne, R., Schneider, G. y Yang, S. Conceptos de inteligencia artificial para el descubrimiento de fármacos asistido por computadora. química Rev. 119, 10520–10594 (2019).

Artículo CAS PubMed Google Académico

Pandey, M. et al. El papel transformador de la computación GPU y el aprendizaje profundo en el descubrimiento de fármacos. Nat. Mach. Intel. 4, 211–221 (2022).

Artículo Google Académico

Blay, V., Tolani, B., Ho, SP y Arkin, MR Detección de alto rendimiento: enfoques bioquímicos y basados ​​en células de hoy. Descubrimiento de drogas Hoy 25, 1807–1821 (2020).

Artículo CAS PubMed Google Académico

Bohacek, RS, McMartin, C. & Guida, WC El arte y la práctica del diseño de fármacos basado en estructuras: una perspectiva de modelado molecular. Medicina. Res. Rev. 16, 3–50 (1996).

3.0.CO;2-6" data-track-action="article reference" href="https://doi.org/10.1002%2F%28SICI%291098-1128%28199601%2916%3A1%3C3%3A%3AAID-MED1%3E3.0.CO%3B2-6" aria-label="Article reference 30" data-doi="10.1002/(SICI)1098-1128(199601)16:13.0.CO;2-6">Artículo CAS PubMed Google Académico

Lyu, J., Irwin, JJ & Shoichet, BK Modelado de la expansión de bibliotecas virtuales de cribado. Nat. química Biol. https://doi.org/10.1038/s41589-022-01234-w (2023).

Artículo PubMed Google Académico

Tomberg, A. & Boström, J. ¿Puede la química fácil producir moléculas complejas, diversas y novedosas? Descubrimiento de drogas Hoy 25, 2174–2181 (2020).

Artículo CAS PubMed Google Académico

Muchiri, RN & van Breemen, RB Selección por afinidad: espectrometría de masas para el descubrimiento de compuestos farmacológicamente activos a partir de bibliotecas combinatorias y productos naturales. J. Espectro de masas. 56, e4647 (2021).

Artículo ADS CAS PubMed Google Scholar

Fitzgerald, PR & Paegel, BM Química codificada por ADN: descubrimiento de fármacos a partir de algunas buenas reacciones. química Rev. 121, 7155–7177 (2021).

Artículo CAS PubMed Google Académico

Neri, D. & Lerner, RA Bibliotecas químicas codificadas por ADN: un sistema de selección basado en dotar a los compuestos orgánicos de información amplificable. año Rev. Bioquímica. 87, 479–502 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

McCloskey, K. et al. Aprendizaje automático en bibliotecas codificadas por ADN: un nuevo paradigma para la búsqueda de aciertos. J.Med. química 63, 8857–8866 (2020).

Artículo CAS PubMed Google Académico

Walters, WP Bibliotecas químicas virtuales. J.Med. química 62, 1116–1124 (2019).

Artículo CAS PubMed Google Académico

Warr, WA, Nicklaus, MC, Nicolaou, CA y Rarey, M. Exploración de colecciones de compuestos ultragrandes para el descubrimiento de fármacos. J. Chem. información Modelo. 62, 2021–2034 (2022). Esta es una revisión exhaustiva de la historia y los desarrollos recientes de los espacios químicos generativos y bajo demanda.

Artículo CAS PubMed Google Académico

Enamina. Base de datos REAL. Enamine https://enamine.net/compound-collections/real-compounds/real-database (2020).

Hartenfeller, M. et al. Una colección de reacciones sólidas de síntesis orgánica para el diseño de moléculas in silico. J. Chem. información Modelo. 51, 3093–3098 (2011).

Artículo CAS PubMed Google Académico

Patel, H. et al. SAVI, generación in silico de miles de millones de compuestos fácilmente sintetizables mediante reglas tipo sistema experto. ciencia Datos 7, 384 (2020).

Artículo PubMed PubMed Central Google Académico

Irwin, JJ et al. ZINC20: una base de datos química gratuita a gran escala para el descubrimiento de ligandos. J. Chem. información Modelo. 60, 6065–6073 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Hu, Q. et al. Pfizer Global Virtual Library (PGVL): una herramienta de diseño químico impulsada por información de síntesis paralela validada experimentalmente. Peine ACS. ciencia 14, 579–589 (2012).

Artículo CAS PubMed Google Académico

Nicolaou, CA, Watson, IA, Hu, H. & Wang, J. The Proximal Lilly Collection: mapeo, exploración y explotación del espacio químico factible. J. Chem. información Modelo. 56, 1253–1266 (2016).

Artículo CAS PubMed Google Académico

Enamina. Espacio REAL. Enamine https://enamine.net/library-lysis/real-compounds/real-space-navigator (2022).

Bellmann, L., Penner, P., Gastreich, M. y Rarey, M. Comparación de espacios de fragmentos combinatorios y su aplicación a catálogos de compuestos ultragrandes fabricados bajo demanda. J. Chem. información Modelo. 62, 553–566 (2022).

Artículo CAS PubMed Google Académico

Enamina. Cree bloques de construcción bajo demanda (MADE). Enamine https://enamine.net/building-blocks/made-building-blocks (2022).

Hoffmann, T. & Gastreich, M. El siguiente nivel en la navegación espacial química: ir mucho más allá de las bibliotecas de compuestos enumerables. Descubrimiento de drogas Hoy 24, 1148–1156 (2019).

Artículo CAS PubMed Google Académico

Ruddigkeit, L., van Deursen, R., Blum, LC y Reymond, J.-L. Enumeración de 166 mil millones de pequeñas moléculas orgánicas en la base de datos del universo químico GDB-17. J. Chem. información Modelo. 52, 2864–2875 (2012).

Artículo CAS PubMed Google Académico

Vanhaelen, Q., Lin, Y.-C. & Zhavoronkov, A. El advenimiento de la química generativa. ACS Med. química Letón. 11, 1496-1505 (2020).

Artículo CAS PubMed PubMed Central Google Scholar

Ballante, F., Kooistra, AJ, Kampen, S., de Graaf, C. y Carlsson, J. Cribado virtual basado en la estructura para ligandos de receptores acoplados a proteína G: ¿qué puede hacer el acoplamiento molecular por usted? Farmacol. Rev. 73, 527–565 (2021).

Artículo PubMed Google Académico

Neves, MA, Totrov, M. & Abagyan, R. Acoplamiento y puntuación con ICM: resultados de evaluación comparativa y estrategias de mejora. J. Cómputo. Mol asistido. Des. 26, 675–686 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Meiler, J. & Baker, D. ROSETTALIGAND: acoplamiento de molécula pequeña de proteína con flexibilidad completa de cadena lateral. Proteínas 65, 538–548 (2006).

Artículo CAS PubMed Google Académico

Lorber, DM & Shoichet, BK Acoplamiento de ligando flexible usando conjuntos conformacionales. Ciencia de las proteínas 7, 938–950 (1998).

Artículo CAS PubMed PubMed Central Google Scholar

Trott, O. & Olson, AJ AutoDock Vina: mejora de la velocidad y precisión del acoplamiento con una nueva función de puntuación, optimización eficiente y subprocesamiento múltiple. J. Cómputo. química 31, 455–461 (2010).

CAS PubMed PubMed Central Google Académico

Halgren, TA et al. Glide: un nuevo enfoque para acoplamiento y puntuación rápidos y precisos. 2. Factores de enriquecimiento en la selección de bases de datos. J.Med. química 47, 1750–1759 (2004).

Artículo CAS PubMed Google Académico

Friesner, RA et al. Glide: un nuevo enfoque para acoplamiento y puntuación rápidos y precisos. 1. Método y evaluación de la precisión del atraque. J.Med. química 47, 1739-1749 (2004).

Artículo CAS PubMed Google Académico

Gaieb, Z. et al. Gran desafío D3R 3: predicción ciega de posiciones de proteína-ligando y clasificaciones de afinidad. J. Cómputo. Mol asistido. Des. 33, 1–18 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Parques, CD et al. Gran desafío D3R 4: predicción ciega de poses de proteína-ligando, clasificaciones de afinidad y energías libres de unión relativas. J. Cómputo. Mol asistido. Des. 34, 99–119 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Bender, BJ y col. Una guía práctica para el acoplamiento a gran escala. Nat. Protocolo 16, 4799–4832 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Manglik, A. et al. Descubrimiento basado en la estructura de analgésicos opioides con efectos secundarios reducidos. Naturaleza 537, 185–190 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Cerón-Carrasco, JP Cuando el cribado virtual arroja fármacos inactivos: el trato con los falsos amigos teóricos. ChemMedChem 17, e202200278 (2022).

PubMed PubMed Central Google Académico

Rossetti, GG et al. Inhibidores no covalentes de SARS-CoV-2 Mpro desarrollados a partir de resultados de pantalla in silico. ciencia Rep. 12, 2505 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Luttens, A. et al. El cribado virtual ultragrande identifica los principales inhibidores de la proteasa del SARS-CoV-2 con actividad de amplio espectro contra los coronavirus. Mermelada. química Soc. 144, 2905–2920 (2022). Este estudio compara el descubrimiento basado en fragmentos y basado en detección ultragrande de candidatos principales para el objetivo desafiante.

Artículo CAS PubMed PubMed Central Google Scholar

Owen, DR et al. Un candidato clínico inhibidor oral de SARS-CoV-2 Mpro para el tratamiento de COVID-19. Ciencia 374, 1586–1593 (2021).

Artículo ADS CAS PubMed Google Scholar

Böhm, H.-J. El programa informático LUDI: un nuevo método para el diseño de novo de inhibidores enzimáticos. J. Cómputo. Mol asistido. Des. 6, 61–78 (1992).

Artículo ADS PubMed Google Scholar

Beroza, P. et al. El acoplamiento espacial químico permite la detección virtual basada en estructuras a gran escala para descubrir inhibidores de la cinasa ROCK1. Nat. común 13, 6447 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Jumper, J. et al. Aplicación y mejora de AlphaFold en CASP14. Proteínas 89, 1711–1721 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Vamathevan, J. et al. Aplicaciones del aprendizaje automático en el descubrimiento y desarrollo de fármacos. Nat. Rev. Descubrimiento de Drogas. 18, 463–477 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Schneider, P. et al. Repensar el diseño de fármacos en la era de la inteligencia artificial. Nat. Rev. Descubrimiento de Drogas. 19, 353–364 (2020). Este artículo proporciona una introducción completa a los enfoques de DL en el descubrimiento de fármacos.

Artículo CAS PubMed Google Académico

Elbadawi, M., Gaisford, S. & Basit, AW Técnicas avanzadas de aprendizaje automático en el descubrimiento de fármacos. Descubrimiento de drogas Hoy 26, 769–777 (2021).

Artículo CAS PubMed Google Académico

Bender, A. & Cortés-Ciriano, I. Inteligencia artificial en el descubrimiento de fármacos: ¿qué es realista, qué son ilusiones? Parte 1: formas de generar un impacto y por qué aún no hemos llegado allí. Descubrimiento de drogas Hoy 26, 511–524 (2021).

Artículo CAS PubMed Google Académico

Davies, M. et al. Mejora de la precisión de la farmacocinética humana predicha: lecciones aprendidas de la cartera de medicamentos de AstraZeneca durante dos décadas. Tendencias Pharmacol. ciencia 41, 390–408 (2020).

Artículo CAS PubMed Google Académico

Schneckener, S. et al. Predicción de biodisponibilidad oral en ratas: transferencia de conocimientos de correlaciones in vitro a modelos de aprendizaje automático (profundos) utilizando resultados de modelos in silico y parámetros de estructura química. J. Chem. información Modelo. 59, 4893–4905 (2019).

Artículo CAS PubMed Google Académico

Cherkasov, A. et al. Modelado QSAR: ¿dónde has estado? ¿Hacia donde te diriges? J.Med. química 57, 4977–5010 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Keiser, MJ et al. Predicción de nuevas dianas moleculares para fármacos conocidos. Naturaleza 462, 175–181 (2009).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Guney, E., Menche, J., Vidal, M. & Barábasi, A.-L. Detección de eficacia de fármacos in silico basada en red. Nat. común 7, 10331 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Cichońska, A. et al. Mapeo colaborativo del espacio objetivo inexplorado de los inhibidores de quinasa. Nat. común 12, 3307 (2021).

Artículo PubMed PubMed Central Google Académico

Gaulton, A. et al. ChEMBL: una base de datos de bioactividad a gran escala para el descubrimiento de fármacos. Ácidos Nucleicos Res. 40, D1100–D1107 (2012).

Artículo CAS PubMed Google Académico

Tang, J. et al. Drug Target Commons: un esfuerzo de la comunidad para construir una base de conocimiento de consenso para las interacciones entre fármacos y objetivos. Química celular. Biol. 25, 224–229.e222 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Liu, Z. et al. Recopilación de datos vinculantes en todo el PDB: estado actual de la base de datos PDBbind. Bioinformática 31, 405–412 (2015).

Artículo CAS PubMed Google Académico

Gaudelet, T. et al. Utilización del aprendizaje automático de gráficos en el descubrimiento y desarrollo de fármacos. Breve. Bioinformar. 22, bbab159 (2021).

Artículo PubMed PubMed Central Google Académico

Son, J. & Kim, D. Desarrollo de un modelo de red neuronal convolucional gráfica para la predicción eficiente de las afinidades de unión proteína-ligando. PLoS ONE 16, e0249404 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Stepniewska-Dziubinska, MM, Zielenkiewicz, P. & Siedlecki, P. Mejora de la detección de sitios de unión proteína-ligando con segmentación 3D. ciencia Rep. 10, 5035 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Jiménez, J., Škalič, M., Martínez-Rosell, G. & De Fabritiis, G. KDEEP: predicción de la afinidad de unión absoluta proteína-ligando a través de redes neuronales convolucionales 3D. J. Chem. información Modelo. 58, 287–296 (2018).

Artículo PubMed Google Académico

Jones, D. et al. Predicción mejorada de la afinidad de unión proteína-ligando con inferencia de fusión profunda basada en la estructura. J. Chem. información Modelo. 61, 1583–1592 (2021).

Artículo CAS PubMed Google Académico

Volkov, M. et al. Sobre la frustración de predecir afinidades de unión de estructuras proteína-ligando con redes neuronales profundas. J.Med. química 65, 7946–7958 (2022).

Artículo CAS PubMed Google Académico

Roberts, M. et al. Errores comunes y recomendaciones para usar el aprendizaje automático para detectar y pronosticar COVID-19 usando radiografías de tórax y tomografías computarizadas. Nat. Mach. Intel. 3, 199–217 (2021).

Artículo Google Académico

Beker, W. et al. El aprendizaje automático a veces puede simplemente capturar las tendencias de popularidad de la literatura: un estudio de caso del acoplamiento heterocíclico Suzuki-Miyaura. Mermelada. química Soc. 144, 4819–4827 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Yu, B. & Kumbier, K. Ciencia de datos verídicos. proc. Academia Nacional. ciencia EE. UU. 117, 3920–3929 (2020). Este artículo de perspectiva sienta las bases para una IA verídica.

Artículo ADS MathSciNet CAS PubMed PubMed Central MATH Google Scholar

Ng , A. , Laird , D. & He , L. Competencia de IA centrada en datos . IA de DeepLearning https://https://https.deeplearning-ai.github.io/data-centric-comp/ (2021).

Miranda, LJ Hacia el aprendizaje automático centrado en datos: una breve revisión. LJ Miranda https://ljvmiranda921.github.io/notebook/2021/07/30/data-centric-ml/ (2021).

Jiménez-Luna, J., Grisoni, F. & Schneider, G. Descubrimiento de fármacos con inteligencia artificial explicable. Nat. Mach. Intel. 2, 573–584 (2020).

Artículo Google Académico

Wills, T. Descubrimiento de fármacos de IA: evaluación de los primeros candidatos a fármacos diseñados por IA para participar en ensayos clínicos en humanos. CAS https://www.cas.org/resources/cas-insights/drug-discovery/ai-designed-drug-candidates (2022).

Meng, C., Seo, S., Cao, D., Griesemer, S. & Liu, Y. Cuando la física se encuentra con el aprendizaje automático: una encuesta sobre el aprendizaje automático informado por la física. Preimpresión en https://doi.org/10.48550/arXiv.2203.16797 (2022).

Thomas, M., Bender, A. y de Graaf, C. Integración de enfoques basados ​​en estructuras en el diseño molecular generativo. actual Opinión Estructura. Biol. 79, 102559 (2023).

Artículo CAS PubMed Google Académico

Ackloo, S. et al. CACHE (Evaluación crítica de experimentos computacionales de búsqueda de aciertos): una iniciativa de evaluación comparativa de asociación público-privada para permitir el desarrollo de métodos computacionales para la búsqueda de aciertos. Nat. Rev. Chem. 6, 287–295 (2022). Esta es una iniciativa comunitaria importante para la evaluación integral del rendimiento de los métodos computacionales de descubrimiento de fármacos.

Artículo PubMed PubMed Central Google Académico

MolSoft. Motor rápido de descubrimiento de isósteros (RIDE). MolSoft http://molsoft.com/RIDE.html (2022).

Jumper, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Tunyasuvunakool, K. et al. Predicción altamente precisa de la estructura proteica del proteoma humano. Naturaleza 596, 590–596 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Baek, M. et al. Predicción precisa de estructuras e interacciones de proteínas utilizando una red neuronal de tres pistas. Ciencia 373, 871–876 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Akdel, M. Una evaluación comunitaria de biología estructural de las aplicaciones AlphaFold2. Nat. Estructura. mol. Biol. 29, 1056–1067 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Katritch, V., Rueda, M. & Abagyan, R. Optimización de receptores guiada por ligandos. Métodos Mol. Biol. 857, 189–205 (2012).

Artículo CAS PubMed Google Académico

Carlsson, J. et al. Descubrimiento de ligandos a partir de un modelo de homología del receptor D3 de dopamina y estructura cristalina. Nat. química Biol. 7, 769–778 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Ren, F. et al. AlphaFold acelera el descubrimiento de fármacos impulsado por la inteligencia artificial: descubrimiento eficiente de un nuevo inhibidor de molécula pequeña de la cinasa 20 dependiente de ciclina (CDK20). química ciencia 14, 1443–1452 (2023).

Zhang, Y. et al. Evaluación comparativa de estructuras AlphaFold2 refinadas y no refinadas para el descubrimiento de hits. J. Chem. información Modelo. 63, 1656–1667 (2023).

El, X.-h. et al. AlphaFold2 versus estructuras experimentales: evaluación en receptores acoplados a proteína G. Acta Pharmacol. Pecado. 44, 1–7 (2022).

Artículo PubMed Google Académico

Wong, F. et al. Evaluación comparativa de las predicciones de acoplamiento molecular habilitadas para AlphaFold para el descubrimiento de antibióticos. mol. sist. Biol. 18, e11081 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Heckelman, ML, de Vries, I., Joosten, RP y Perrakis, A. AlphaFill: enriquecimiento de modelos AlphaFold con ligandos y cofactores. Nat. Métodos 20, 205–213 (2023).

Artículo CAS PubMed Google Académico

Yang, Y. et al. Exploración eficiente del espacio químico con acoplamiento y aprendizaje profundo. J. Chem. Cálculo de la teoría. 17, 7106–7119 (2021).

Artículo CAS PubMed Google Académico

Gentile, F. et al. Proyección virtual habilitada por inteligencia artificial de bibliotecas químicas ultragrandes con acoplamiento profundo. Nat. Protocolo 17, 672–697 (2022).

Artículo CAS PubMed Google Académico

Schindler, CEM et al. Evaluación a gran escala de cálculos de energía libre vinculante en proyectos de descubrimiento de fármacos activos. J. Chem. información Modelo. 60, 5457–5474 (2020).

Artículo CAS PubMed Google Académico

Chen, W., Cui, D., Abel, R., Friesner, RA y Wang, L. Cálculo preciso de energías libres absolutas de unión proteína-ligando. Preimpresión en https://doi.org/10.26434/chemrxiv-2022-2t0dq-v2 (2022).

Khalak, Y. et al. Energías libres alquímicas absolutas de unión proteína-ligando para el diseño de fármacos. química ciencia 12, 13958–13971 (2021).

Artículo CAS PubMed PubMed Central Google Scholar

Cournia, Z. et al. Rigurosas simulaciones de energía libre en proyección virtual. J. Chem. información Modelo. 60, 4153–4169 (2020).

Artículo CAS PubMed Google Académico

xREAL Chemical Space, Chemspace, https://chem-space.com/services#v-synthes (2023).

Rarey, M., Nicklaus, MC & Warr, W. Edición especial sobre informática de reacciones y espacio químico. J. Chem. información Modelo. 62, 2009–2010 (2022).

Artículo CAS PubMed Google Académico

Zabolotna, Y. et al. Una mirada de cerca al espacio químico de los bloques de construcción disponibles comercialmente para la química médica. J. Chem. información Modelo. 62, 2171–2185 (2022).

Artículo CAS PubMed Google Académico

Kaplan, AL et al. Acoplamiento de biblioteca a medida para agonistas del receptor 5-HT2A con actividad antidepresiva. Naturaleza 610, 582–591 (2022).

Artículo ADS CAS PubMed Google Scholar

Krasiński, A., Fokin, VV & Sharpless, KB Síntesis directa de 4-magnesio-1,2,3-triazoles 1,5-disustituidos, revisión. org. Letón. 6, 1237–1240 (2004).

Artículo PubMed Google Académico

El Premio Nobel de Química. nobelprize.org, https://www.nobelprize.org/prizes/chemistry/2022/summary/ (2022)

Dong, J., Sharpless, KB, Kwisnek, L., Oakdale, JS y Fokin, VV Síntesis de polisulfatos basada en SuFEx. Angew. química En t. ed. ingl. 53, 9466–9470 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Zhang, B. et al. Ni-acoplamiento electrocatalítico Csp3-Csp3 doblemente descarboxilador. Naturaleza 606, 313–318 (2022).

Artículo ADS CAS PubMed Google Scholar

Gillis, EP & Burke, MD Acoplamiento cruzado iterativo con boronatos MIDA: hacia una plataforma general para la síntesis de moléculas pequeñas. Aldrichimica Acta 42, 17–27 (2009).

CAS PubMed PubMed Central Google Académico

Blair, DJ et al. Formación iterativa automatizada de enlaces Csp3-C. Naturaleza 604, 92–97 (2022). Este estudio proporciona un enfoque químico para la automatización de la formación de enlaces C-C en la síntesis de moléculas pequeñas.

Artículo ADS CAS PubMed Google Scholar

Li, J. et al. Síntesis de muchos tipos diferentes de pequeñas moléculas orgánicas utilizando un proceso automatizado. Ciencia 347, 1221–1226 (2015).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Trobe, M. & Burke, MD La revolución industrial molecular: síntesis automatizada de moléculas pequeñas. Angew. química En t. ed. 57, 4192–4214 (2018).

Artículo CAS Google Académico

Bubliauskas, A. et al. Digitalización de síntesis química en material de reacción impreso en 3D. Angew. química En t. ed. 61, e202116108 (2022).

Artículo CAS Google Académico

Molga, K. et al. Un algoritmo informático para descubrir secuencias iterativas de reacciones orgánicas. Nat. sintetizador 1, 49–58 (2022).

Artículo ANUNCIOS Google Académico

Segler, MHS, Preuss, M. & Waller, MP Planificación de síntesis químicas con redes neuronales profundas e IA simbólica. Naturaleza 555, 604–610 (2018).

Artículo ADS CAS PubMed Google Scholar

Goldman, B., Kearnes, S., Kramer, T., Riley, P. & Walters, WP Definición de niveles de diseño químico automatizado. J.Med. química 65, 7073–7087 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Grisoni, F. et al. Combinación de inteligencia artificial generativa y síntesis en chip para el diseño de fármacos de novo. ciencia Adv. 7, eabg3338 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Wagner, JR y col. Métodos computacionales emergentes para el descubrimiento racional de fármacos alostéricos. química Rev. 116, 6370–6390 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Davis, BJ & Hubbard, RE en Biología estructural en el descubrimiento de fármacos (ed. Renaud, J.-P.) 79–98 (2020).

de Souza Neto, LR et al. Estrategias in silico para apoyar la optimización de fragmento a plomo en el descubrimiento de fármacos. Frente. química 8, 93 (2020).

Artículo ADS PubMed PubMed Central Google Scholar

Saur, M. et al. Descubrimiento de fármacos basado en fragmentos usando cryo-EM. Descubrimiento de drogas Hoy 25, 485–490 (2020).

Artículo CAS PubMed Google Académico

Kuljanin, M. et al. Reinvención de perfiles de alto rendimiento de cisteínas reactivas para el cribado basado en células de grandes bibliotecas de electrófilos. Nat. Biotecnología. 39, 630–641 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Muegge, I., Martin, YC, Hajduk, PJ y Fesik, SW Evaluación de la puntuación de PMF en el acoplamiento de ligandos débiles a la proteína de unión FK506. J.Med. química 42, 2498–2503 (1999).

Artículo CAS PubMed Google Académico

Schuller, M. et al. Fragmento de unión al macrodominio Nsp3 del SARS-CoV-2 identificado mediante detección cristalográfica y acoplamiento computacional. ciencia Adv. 7, eabf8711 (2021).

Artículo ADS PubMed PubMed Central Google Scholar

Gahbauer, S. et al. El diseño computacional iterativo y el cribado cristalográfico identifican potentes inhibidores dirigidos al macrodominio Nsp3 del SARS-CoV-2. proc. Academia Nacional. ciencia EE. UU. 120, e2212931120 (2023). Este artículo demuestra la aplicación del diseño de detección y combinación de fragmentos híbridos y la detección de bibliotecas ultragrandes a un objetivo viral desafiante.

Artículo CAS PubMed PubMed Central Google Scholar

Achdout, H. et al. Descubrimiento de ciencia abierta de la terapéutica oral no covalente del principal inhibidor de la proteasa del SARS-CoV-2. Preimpresión en https://doi.org/10.1101/2020.10.29.339317 (2022).

Jin, Z. et al. Estructura de Mpro de SARS-CoV-2 y descubrimiento de sus inhibidores. Naturaleza 582, 289–293 (2020).

Artículo ADS CAS PubMed Google Scholar

Ton, AT, Gentile, F., Hsing, M., Ban, F. y Cherkasov, A. Identificación rápida de posibles inhibidores de la proteasa principal del SARS-CoV-2 mediante acoplamiento profundo de 1300 millones de compuestos. mol. Informar. 39, e2000028 (2020).

Artículo PubMed Google Académico

Frye, L., Bhat, S., Akinsanya, K. y Abel, R. Del descubrimiento de fármacos asistido por computadora al descubrimiento de fármacos impulsado por computadora. Descubrimiento de drogas Hoy Tecnología. 39, 111–117 (2021).

Artículo CAS PubMed Google Académico

Wadman, M. La FDA ya no necesita exigir pruebas en animales antes de los ensayos de medicamentos en humanos. Ciencia, https://doi.org/10.1126/science.adg6264 (2023).

Stiefl, N. et al. FOCUS: desarrollo de una plataforma global de comunicación y modelado para químicos médicos computacionales y aplicados. J. Chem. información Modelo. 55, 896–908 (2015).

Artículo CAS PubMed Google Académico

Schrödinger. diseño en vivo. Schrödinger https://www.schrodinger.com/sites/default/files/general_ld_rgb_080119_forweb.pdf. (consultado el 5 de abril de 2023)

Muller, S. et al. Objetivo 2035: actualización sobre la búsqueda de una sonda para cada proteína. RSC Med. química 13, 13–21 (2022).

Artículo PubMed Google Académico

Verdonk, ML, Cole, JC, Hartshorn, MJ, Murray, CW y Taylor, RD Mejora del acoplamiento de proteína-ligando con GOLD. Proteínas 52, 609–623 (2003).

Artículo CAS PubMed Google Académico

Miller, EB et al. Solución confiable y precisa para el problema de acoplamiento de ajuste inducido para la unión proteína-ligando. J. Chem. Cálculo de la teoría. 17, 2630–2639 (2021).

Artículo CAS PubMed Google Académico

Acoplamiento espacial químico. BioSolveIT https://www.biosolveit.de/application-academy/chemical-space-docking/ (2022).

Cavasotto, CN en Quantum Mechanics in Drug Discovery (ed. Heifetz, A.) 257–268 (Springer, 2020).

Dixon, SL et al. AutoQSAR: una herramienta de aprendizaje automático automatizada para el modelado de relación estructura-actividad cuantitativa de mejores prácticas. Futuro Med. química 8, 1825–1839 (2016).

Artículo ADS CAS PubMed Google Scholar

Totrov, M. Campos de propiedades atómicas: potencial farmacofórico 3D generalizado para superposición de ligandos automatizada, elucidación de farmacóforos y QSAR 3D. química Biol. Drogas Des. 71, 15–27 (2008).

Artículo CAS PubMed Google Académico

Schaller, D. et al. Modelado de farmacóforos 3D de próxima generación. Cálculo de ALAMBRES. mol. ciencia 10, e1468 (2020).

Artículo CAS Google Académico

Chakravarti, SK & Alla, SRM Modelado QSAR libre de descriptores utilizando aprendizaje profundo con redes neuronales de memoria a corto plazo. Frente. Artefacto Intel. 2, 17 (2019).

Artículo PubMed PubMed Central Google Académico

Deng, Z., Chuaqui, C. & Singh, J. Huella dactilar de interacción estructural (SIFt): un método novedoso para analizar interacciones tridimensionales de unión proteína-ligando. J.Med. química 47, 337–344 (2004).

Artículo CAS PubMed Google Académico

Descargar referencias

Agradecemos a A. Brooun, AA Sadybekov, S. Majumdar, MM Babu, Y. Moroz y V. Cherezov por sus útiles debates.

Departamento de Biología Cuantitativa y Computacional, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Anastasiia V. Sadybekov y Vsevolod Katritch

Centro de Nuevas Tecnologías en el Descubrimiento y Desarrollo de Fármacos, Instituto Bridge, Centro Michelson de Biociencias Convergentes, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Anastasiia V. Sadybekov y Vsevolod Katritch

Departamento de Química, Universidad del Sur de California, Los Ángeles, CA, EE. UU.

Vsévolod Katritch

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

Todos los autores contribuyeron a escribir el manuscrito.

Correspondencia a Vsevolod Katritch.

La Universidad del Sur de California está en proceso de solicitar una solicitud de patente (n.º 63159888) que cubre el método V-SYNTHES que incluye a VK como co-inventor.

Nature agradece a Alexander Tropsha y a los otros revisores anónimos por su contribución a la revisión por pares de este trabajo.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Springer Nature o su licenciante (p. ej., una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; el autoarchivo del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.

Reimpresiones y permisos

Sadybekov, AV, Katritch, V. Enfoques computacionales que simplifican el descubrimiento de fármacos. Naturaleza 616, 673–685 (2023). https://doi.org/10.1038/s41586-023-05905-z

Descargar cita

Recibido: 21 Abril 2022

Aceptado: 01 de marzo de 2023

Publicado: 26 abril 2023

Fecha de emisión: 27 de abril de 2023

DOI: https://doi.org/10.1038/s41586-023-05905-z

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.