Análisis estructural y principios arquitectónicos del curli amiloide bacteriano

Noticias

HogarHogar / Noticias / Análisis estructural y principios arquitectónicos del curli amiloide bacteriano

Aug 26, 2023

Análisis estructural y principios arquitectónicos del curli amiloide bacteriano

Volumen de comunicaciones de la naturaleza

Nature Communications volumen 14, Número de artículo: 2822 (2023) Citar este artículo

1301 Accesos

13 Altmetric

Detalles de métricas

Han pasado dos décadas desde la propuesta inicial de que los amiloides no solo son subproductos (tóxicos) de una cascada de agregación no deseada, sino que también pueden ser producidos por un organismo para cumplir una función biológica definida. Esa idea revolucionaria surgió al darse cuenta de que una gran fracción de la matriz extracelular que retiene las células Gram-negativas en una biopelícula persistente está compuesta de fibras proteicas (curli; tafi) con arquitectura β cruzada, cinética de polimerización dependiente de la nucleación y clásica propiedades tintóreas de amiloide. La lista de proteínas que se ha demostrado que forman las denominadas fibras amiloides funcionales in vivo se ha ampliado considerablemente a lo largo de los años, pero los conocimientos estructurales detallados no han seguido un ritmo similar, en parte debido a las barreras experimentales asociadas. Aquí combinamos el extenso modelado AlphaFold2 y la microscopía de transmisión crioelectrónica para proponer un modelo atómico de protofibrillas curli y sus modos superiores de organización. Descubrimos una diversidad estructural inesperada de bloques de construcción curli y arquitecturas de fibrillas. Nuestros resultados permiten una racionalización de la robustez fisicoquímica extrema de curli, así como observaciones anteriores de la promiscuidad de curli entre especies, y deberían facilitar más esfuerzos de ingeniería para expandir el repertorio de materiales funcionales basados ​​en curli.

Aunque alguna vez se consideró un objetivo inverosímil para la biología estructural, los desarrollos recientes en microscopía crioelectrónica (cryoEM) y el procesamiento helicoidal han facilitado la determinación de la estructura de las fibrillas de amiloide con una resolución casi atómica1. Una plétora de estructuras determinadas experimentalmente tanto de amiloides generados in vitro como aislados ex vivo ha revelado una diversidad estructural desconcertante de arquitecturas de fibra, incluido el concepto de polimorfos de fibra o cepas de secuencias por lo demás idénticas o estrechamente relacionadas2,3,4,5. A pesar de las diferencias en la arquitectura de las protofibrillas y la simetría helicoidal de las fibras, la mayoría de las estructuras amiloides comparten varias características conservadas que nos permiten expandir la definición del pliegue amiloide más allá del adagio tradicional de la beta cruzada. Hasta donde sabemos, todas las estructuras amiloides descritas actualmente consisten en un apilamiento repetitivo de arreglos de hebras β planos, serpenteantes e intrincados que están estabilizados por motivos de cremallera estérica en los que las cadenas laterales de residuos interdigitados forman extensas estructuras de Van der Waals, electrostáticas, hidrofóbicas y de hidrógeno. contactos de unión. El apilamiento axial de péptidos planos mediante el acoplamiento hebra-hebra y la formación de arcadas β impulsan la formación de protofibrillas, generalmente seguida por el enrollamiento helicoidal de múltiples protofibrillas en una superestructura helicoidal notablemente estable. Es precisamente esta simetría helicoidal la que se ha aprovechado con gran éxito en los enfoques cryoEM modernos para resolver los detalles estructurales de una amplia gama de estructuras amiloides.

La mayoría de esas estructuras pertenecen a una subfamilia de especies amiloides que se correlacionan con una serie de enfermedades (neuro)degenerativas, de depósito sistémico y de mal plegamiento. Por esa razón, esas proteínas amiloidogénicas se denominan coloquialmente amiloides patológicos (PA). Estos amiloides asociados a enfermedades tienen en común que representan un evento de agregación y plegamiento incorrecto no funcional y fuera de ruta de proteínas o fragmentos de proteínas desestabilizados para que no alcancen su estructura nativa por mutación, condiciones ambientales o procesamiento incorrecto. Hay una segunda rama de la familia amiloide, que se encuentra en todos los dominios de la vida, que consiste en proteínas que evolucionaron para cumplir funciones biológicas dedicadas (como adhesión, almacenamiento, andamiaje, etc.) al adoptar el estado amiloide, lo que les otorga a estas proteínas la amiloides funcionales a término (FA)6,7,8. Al igual que los amiloides patológicos, los FA muestran una agregación dependiente de la nucleación en fibras con características de β cruzada. Una pregunta enigmática es si las vías de AF incluyen rasgos seleccionados para mitigar o carecer de la ganancia citotóxica de las propiedades de función tan comúnmente asociadas con los depósitos patológicos de amiloide. Para las vías amiloides bacterianas como curli y Fap, está claro que las proteínas accesorias aseguran una deposición amiloide oportuna y localizada, incluidas las salvaguardas similares a las chaperonas que previenen o detienen la amiloidogénesis prematura9,10. Sin embargo, se sabe mucho menos si las estructuras de las subunidades y fibras de FA también incluyen rasgos adaptativos que reducen la citotoxicidad. Curiosamente, hay indicios de experimentos in vitro de que los ácidos grasos producidos por diversas bacterias patógenas pueden mostrar reactividad cruzada con los PA11, y los informes de una inducción potencialmente infecciosa o un agravamiento de los depósitos patológicos de amiloide por siembra cruzada directa o efectos indirectos (inflamatorios) en humanos y animales expuestos a amiloides bacterianos12,13. Como solo hay unas pocas estructuras disponibles para los FA14,15, no está claro en este momento si los FA están estructuralmente relacionados con los PA y si forman una rama separada de las arquitecturas amiloides. Tampoco está claro cuál podría ser el mecanismo molecular para esta promiscuidad amiloide FA/PA entre especies.

El pliegue amiloide se informa como uno de los estados de proteínas cuaternarias más estables. Las propiedades de autoensamblaje preprogramadas de los FA han atraído el interés general por su uso en aplicaciones de biología sintética y biotecnología precisamente debido a su extrema robustez y capacidad para desarrollarse espontáneamente con una intervención mínima o asistencia catalítica. Aunque se han informado algunos éxitos en el desarrollo de materiales funcionales avanzados derivados de FAs16,17, es lógico que el campo se beneficie de una comprensión estructural más profunda para informar un conjunto de principios de diseño racional. Dados los avances recientes en el diseño de proteínas de novo, creemos que esto podría ayudar a marcar el comienzo de una era de producción de polímeros de amiloide a medida.

Para abordar el punto ciego biológico estructural con respecto a los FA, buscamos la estructura del curli FA bacteriano modelo. Las fibras de Curli son un componente importante de la matriz extracelular de las bacterias Gram-negativas y se expresan en condiciones de formación de biopelículas en las que cumplen una función de andamiaje y cimentación en el medio extracelular para reforzar la comunidad bacteriana18,19. La subunidad principal de Escherichia coli curli es la proteína pseudorrepetida CsgA de 13,1 kDa, que se secreta como un monómero desordenado que forma fibras β cruzadas con propiedades tintóreas amiloides clásicas en una amplia variedad de condiciones20. En su contexto nativo, la formación de fibrillas CsgA asociadas a células requiere la subunidad curli menor CsgB, que a su vez está unida al complejo de poro de secreción CsgG-CsgF de la membrana externa21,22. Aunque se han propuesto modelos estructurales para un monómero de CsgA plegado basados ​​en modelos de homología23, RMN de estado sólido24 y análisis de acoplamiento coevolutivo25, no existe una estructura curli experimental disponible. Aquí presentamos un estudio bioinformático en profundidad del núcleo amiloide curli mediante el análisis de las secuencias primarias de un catálogo local de CsgA que se construyó a través de una extracción exhaustiva de la base de datos bacteriana refseq. Con base en ese análisis, proponemos diferentes clases estructurales de subunidades curli y discutimos las implicaciones esperadas para el pliegue CsgA y, por extensión, la arquitectura de fibra curli. Probamos y validamos esas predicciones basándonos en un extenso modelado AlphaFold 2 (AF2) de más de 2500 secuencias homólogas de CsgA. A continuación, seleccionamos dos candidatos CsgA para un análisis crioEM detallado, del cual derivamos restricciones de distancia y un volumen crioEM de resolución media que están en excelente acuerdo con los modelos AF2 propuestos. En base a esto, presentamos un modelo molecular para una protofibrilla CsgA y discutimos sus modos de organización de orden superior en la matriz extracelular y las fibras formadas in vitro.

Primero, configuramos una base de datos local de secuencias homólogas de CsgA extrayendo el repositorio del genoma bacteriano Refseq utilizando los perfiles HMM curli construidos por Dueholm et al.19 Para CsgA en particular, usamos un perfil HMM que es específico para la repetición amiloide, y es por lo tanto, no se espera que diferencie entre la subunidad principal de curlin CsgA y la subunidad menor de curlin y el supuesto nucleador CsgB. En lo que sigue, nos referiremos a este grupo de proteínas que contienen repeticiones curli como CsgA, teniendo en cuenta que una subpoblación corresponderá a secuencias CsgB. En el último párrafo de la sección de resultados se realiza una comparación de las secuencias CsgA y CsgB validada.

De un total de 201210 genomas bacterianos que se buscaron, 43279 (22%) genomas contenían una o más secuencias CsgA predichas que albergan una o más firmas de repetición curli (Fig. 1a). Esto se correlacionó bien con la presencia de los otros genes en el operón curli. De los 43279 genomas que contenían CsgA, detectamos CsgG, CsgF, CsgE y CsgC o CsgH en los genomas 41041, 41597, 41090 y 37945 o 1839, respectivamente. Solo una pequeña minoría (1033; 2%) de los genomas que contenían CsgA carecían de una copia del canal de secreción curli CsgG. Este bajo número de huérfanos de CsgA, combinado con la excelente correlación con la presencia de otras proteínas de biogénesis curli, demuestra que el conjunto de datos resultante de secuencias de proteína CsgA se deriva predominantemente de genes csgA/B que están incrustados en un operón curli. La gran mayoría (40559) de estos genomas contiene dos copias similares a CsgA, que probablemente correspondan a la diversificación funcional en CsgA y CsgB26. Curiosamente, se pueden encontrar genomas con más de dos homólogos de CsgA, con el número de copias de CsgA por genoma siguiendo una disminución exponencial hacia 14 copias y un máximo detectado de 30 (GCF_003076275.1_ASM307627v1) (Fig. 1a). Después de eliminar las entradas parciales, obtenemos una lista de 87205 secuencias putativas de CsgA, que se reducen a un conjunto de datos de 8079 secuencias similares a CsgA de dominio maduro único tras el truncamiento de las secuencias líder y la eliminación de duplicados. Como un proxy inicial para la cantidad de repeticiones de curlin por homólogo de CsgA, usamos la cantidad informada de aciertos para la repetición de curlin en el archivo de registro HMMER. Esto produce una distribución de homólogos de CsgA con números de repetición que abarcan el espectro de 4 a 62 (WP_189563214.1), con máximos locales en 5 o 7–8 repeticiones de curlin (el primero típico de enterobacterias como Escherichia y Salmonella) y máximos secundarios alrededor de 15 y 22 (Fig. 1b). Al representar gráficamente el número de repeticiones predichas frente a la longitud de la secuencia principal, se encuentra que la longitud promedio de una repetición de curlin es 23 ± 5 (recuadro de la Fig. 1b). La desviación estándar baja demuestra que la longitud promedio de una sola repetición de curlin se conserva fuertemente para CsgA y, en consecuencia, también lo serán las dimensiones laterales de las fibras resultantes (ver más abajo).

a Distribución del número de homólogos csga detectados por genoma; b Distribución del número de repeticiones de curlin previstas. Recuadro: número de repeticiones de curlin por longitud de proteína, con una pendiente de n = 23 ± 5 aa; c Secuencia de consenso de una repetición de curlin con el motivo de curlin propuesto indicado debajo; d Vista en el eje de un pliegue de solenoide β con residuos conservados que miran hacia adentro resaltados; e Secuencias primarias representativas (Seq ID entre paréntesis) de tres clases de secuencias de CsgA, apiladas de acuerdo con sus repeticiones curlin predichas, con los respectivos motivos de consenso indicados a continuación (coloreados en rojo y azul para el motivo a y B, respectivamente, verde cuando se desvía).

La gran variación en el número de repeticiones de CsgA impide la investigación de la conservación de la secuencia y la variabilidad en el núcleo amiloide a través de la alineación de la secuencia global. Más bien, extrajimos 53574 segmentos lineales no superpuestos de 24aa que están centrados en un motivo QX10Q (y sus permutaciones) que representa el núcleo amiloide prototípico de las repeticiones curlin CsgA. A partir de esto, derivamos una secuencia de consenso27 que exhibe una conservación notable en sitios clave y muestra que las repeticiones de curlin se pueden dividir en motivos a y b estrechamente relacionados, generalmente separados por una secuencia de 4 residuos con la firma XGXX, donde X es cualquier aminoácido (Fig. 1c). En la estructura predicha de CsgA (ver más abajo), estos elementos repetidos de curlin forman las hebras 1 y 2 y el bucle de conexión o arco β de un arco β según lo definido por Henetin et al.28 Como tal, los residuos indicados en rojo y azul a continuación la secuencia logo27 (Fig. 1c) y la representación estructural (Fig. 1d) se asignan a los residuos de cremallera estérica que miran hacia adentro, mientras que los residuos indicados en negro (Fig. 1c) se asignan a los residuos de la superficie que miran hacia afuera de la hebra-arco-hebra (es decir, β-arco) motivo que constituye una sola repetición curlin. La firma base de los motivos a y b consta de N-$-Ψ1-$-Ψ2-$-Q donde Ψn son residuos hidrófobos (A,I,V,L,F), S o T y apuntan al interior de el arco β, junto con una N bien conservada al principio y una Q al final de los motivos. Los residuos en las ubicaciones correspondientes a $ están expuestos en la superficie y son predominantemente polares o cargados (T,S,D,E,Q,N,R,Y), lo que sugiere que se puede esperar que la mayoría de las fibras curli sean hidrofílicas. Al motivo b le siguen 4 o 5 residuos, más típicamente en un motivo XGXX-(X). Esta región de bucle forma un segundo arco β, que conecta el motivo b con el motivo a en la repetición de curlin posterior (Fig. 1d).

Al analizar las subunidades curli con más detalle, identificamos tres clases de secuencias: centrosimétrica (CS), no centrosimétrica (NCS) y degenerada (D) (Fig. 1e). La clase CS contiene secuencias repetidas de curlin para las cuales los residuos que miran al núcleo en el motivo a (es decir, N, Ψ1, Ψ2 y Q en las posiciones 1, 3, 5 y 7, respectivamente) forman una repetición (casi) idéntica en el motivo b (es decir, posiciones 12, 14, 16 y 18), con A0A0E3UX01 de Pontibacter korlensis tomado como ejemplo representativo (Fig. 1e). Teniendo en cuenta la estructura terciaria esperada (Fig. 1d), esto produce una cremallera estérica que es centrosimétrica en la ubicación de los residuos que miran al núcleo. En particular, los residuos que miran hacia afuera (es decir, $) no se adhieren a la presión selectiva que retiene la centrosimetría observada en las repeticiones curlin de las secuencias CsgA de clase CS. Las secuencias de CsgA de clase NCS están compuestas de repeticiones de curlin para las cuales los residuos que miran al núcleo en los motivos a y b no son repeticiones (casi) perfectas, lo que da como resultado cremalleras estéricas que no son centrosimétricas, como es el caso de CsgA de E. coli o Salmonella enterica (Fig. 1e). En EcCsgA, N se sustituye por S en el motivo a, y las posiciones Ψ1, Ψ2 son hidrofóbicos voluminosos (I, L, M), frente a hidrofóbicos en su mayoría pequeños (A, V) en el motivo b. Se puede discernir una tercera clase de secuencias CsgA, que muestran repeticiones degeneradas, es decir, repeticiones para las cuales el motivo a y/o b está incompleto (por ejemplo, ausencia de la N flanqueante en el motivo a o Q en el motivo b), y/o donde Las repeticiones de curlin son considerablemente más largas que el promedio de 23 residuos como resultado de inserciones aguas abajo del motivo a (es decir, arco 1) o motivo b (es decir, arco 2), con A0A0S1S4K2 de Sediminicola sp. YIK13 como ejemplo representativo. Sin embargo, con menos frecuencia, las inserciones también pueden caer dentro del motivo a o b, con A0A0T5PAS6 de Roseovarius indicus como ejemplo representativo (Fig. 1e).

Finalmente, nuestro análisis de secuencias revela que las secuencias de CsgA pueden terminar en una repetición de curlin completa o media, es decir, terminar en un motivo prototípico a - arco - secuencia de motivo b o en una secuencia de motivo a solamente (Fig. 1e). Dado que los motivos a y b representan las hebras 1 y 2 de los arcos β de curlin, se puede esperar que la terminación en un arco β completo o incompleto influya en los contactos entre subunidades en las fibras resultantes (ver más abajo). Otro aviso es que las secuencias de CsgA pueden comenzar con una sola repetición de curlin degenerada donde la N (S) y la Q flanqueantes de los motivos a y b están mutadas, con frecuencia a G, con EcCsgA (Fig. 1e) como ejemplo representativo. En el caso de EcCsgA, esta repetición N-terminal degenerada se conoce como N22 y representa una secuencia dirigida que se une al canal de secreción de CsgG y que no se incorporó al núcleo amiloide de la fibra curli20,29. Es de destacar que nuestro análisis de secuencia indica que la presencia de una secuencia similar a N22 es un valor atípico más que la regla. En la siguiente sección, primero discutimos las estructuras terciarias predichas para las secuencias CsgA de clase CS, NCS y D y las implicaciones estructurales para el monómero CsgA plegado. Tenga en cuenta que aquí nos centramos en una clasificación estructural de motivos y subunidades de curlin, para un análisis filogenético remitimos a los lectores al trabajo anterior de Dueholm et al.19

Empleamos la implementación localcolabfold30,31,32 de AlphaFold2 (AF2) para predecir la estructura de 2686 secuencias únicas de CsgA. Esto constituye un subconjunto representativo de la base de datos CsgA total, que abarca la gama completa de repeticiones previstas, así como la diversidad de motivos repetidos. Obtenemos un valor pLDDT promedio de 83 ± 9 para el conjunto de datos total (ver la Fig. 1 complementaria). Para 741 modelos (27 %), el valor pLDDT es superior a 90, mientras que 237 modelos (8 %) obtienen una puntuación inferior a 70. DeepMind informa pLDDT > 90 como predicciones de alta precisión, entre 70 y 90 como buenas predicciones básicas y pLDDT <70 como baja confianza y debe ser tratado con cautela31. Todos los modelos comparten una arquitectura de solenoide β similar, en la que las repeticiones de curlin se pliegan en motivos de hebra-β-arco-hebra que se apilan verticalmente para producir una estructura de lámina β paralela doble en registro con un escalonamiento de una sola hebra (es decir, 2,4 Å) entre ambas hojas (Fig. 2, Fig. 2 complementaria). Esta topología encaja con nuestras observaciones cryoEM sobre fibrillas de curlin maduras, que analizamos en detalle a continuación. También significa que las variaciones en el número de repeticiones se correlacionan linealmente con la dimensión del eje largo de un monómero CsgA, y que el curlioma abarca un continuo de monómeros solenoidales.

Representación de dibujos animados de ejemplos representativos (con identificación de acceso Uniprot y puntaje AF2 pLDDT) para cada categoría, con una vista transversal que se muestra a continuación en representación de barra para resaltar los residuos de cremallera estérica y la alineación de las repeticiones a lo largo del eje largo. Todos los modelos comparten la misma arquitectura básica, es decir, ensamblaje helicoidal de motivos repetidos de giros de hebra, lo que da como resultado un núcleo plegado β flanqueado por dos arcadas β. un modelo AF2 de R15.5 de Pontibacter korlensis, caracterizado por un motivo de cremallera pseudocentrosimétrico y hebras N- y C-terminal en la misma lámina del solenoide β; b CsgA de E.coli con hebras terminales en lados opuestos del solenoide y un motivo no centrosimétrico, así como un extremo N desordenado (1–22); c CsgA de Sediminicola sp. YIK13 con residuos de cremallera estéricos variables que conducen a motivos centrales degenerados e inserciones arc2; d CsgA de Roseovarius indicus con inserciones de bucles y hebras de longitud variable.

Como estructura representativa de los monómeros CsgA de clase CS, discutimos el modelo AF2 de A0A0E3UX01 (pLDDT = 93.68; Fig. 2a), que tiene 15 repeticiones de curlin y una media repetición adicional en el extremo C (en lo sucesivo, R15.5 ). AF2 predice un solenoide β zurdo muy regular (el RMSD medio de la cadena principal entre repeticiones consecutivas es de 0,18 ± 0,02 Å) con una torsión insignificante (RMSD medio de la cadena principal de los 5 mejores modelos AF2: 0,48 ± 0,38 Å). Por lo tanto, el monómero consiste en un apilamiento de traducción casi puro de los arcos β formados por las repeticiones de curlin. Una vista transversal en el eje proporciona una mayor comprensión de la naturaleza estructural de la cremallera estérica, que comprende un núcleo hidrofóbico central compuesto por los residuos Ψ1 y Ψ2 en el motivo a y b, flanqueado a ambos lados por una glutamina (Gln), seguido por una asparagina (Asn), formando el núcleo pseudocentrosimétrico predicho en base a las características de la secuencia del motivo ayb. Los grupos amida de la cadena lateral de Gln 7 y 18 en el núcleo de curlin (la numeración como en el motivo de consenso de la Fig. 1c) participan en una extensa red de enlaces de hidrógeno, formando una escalera de enlaces H con el Gln equivalente en las repeticiones flanqueantes, y con los carbonilos de la cadena principal de las hebras opuestas que pertenecen a su repetición principal o adyacente en las posiciones 13 o 2, respectivamente (Fig. 3a complementaria). Estas interacciones se ven facilitadas por el escalonamiento entre las dos hojas y probablemente constituyen una contribución importante a la estabilización del empaquetamiento hoja sobre hoja, que corresponde a un promedio de 239 Å2 por repetición. Los residuos Ψ1 y Ψ2 en el motivo a y b se interdigitan en un núcleo hidrófobo, lo que probablemente proporciona una estabilización adicional del empaque de láminas en el solenoide β. Es de destacar que nuestra búsqueda de HMM identificó secuencias similares a CsgA de clase CS donde Ψ1 y Ψ2 forman un núcleo puramente hidrofílico que consta de Ser / Thr, como A0A249PTX6 de Sinorhizobium fredii (Fig. 3b complementaria). Aunque estas secuencias consisten en repeticiones regulares del núcleo canónico N-$-Ψ1-$-Ψ2-$-QXGXXN-$-Ψ1-$-Ψ2-$-QXGXX y se predice que adoptarán el solenoide curli β, no lo hicieron. forman parte de un operón Csg.

Mientras que los Glns estabilizan las interacciones entre repeticiones, así como el empaquetamiento de cadenas cruzadas, los residuos N1 y N12 forman una extensa red de enlaces H que estabiliza el arco β 2 y el arco β 1, respectivamente (Fig. 3a complementaria). Asn 1 está dentro de la distancia de interacción del enlace H del carbonilo de la cadena principal y la amida de los residuos G20, f en la repetición de curlin +2 y de N1 en la repetición +1, mientras que N12 está dentro de la distancia del enlace H de la cadena principal de X8, G9, X10 y N12 en la repetición +1. A pesar de la baja conservación de la secuencia en las posiciones 10–11 a lo largo de las 15 repeticiones, AF2 predice que la traza de la cadena principal será cuasi isomorfa en todo (RMSD promedio de la cadena principal de 0,04 ± 0,01 Å para posiciones equivalentes en los arcos β), lo que produce un β ininterrumpido -arcada que se estabiliza aún más por enlaces de H de la cadena principal en arcos β consecutivos. Si normalizamos todos los contactos polares potenciales en el núcleo del solenoide β (es decir, excluyendo los residuos localizados en la superficie) al número de repeticiones, entonces R15.5 tiene 29,6 candidatos de enlaces H por repetición.

Como estructura representativa de los monómeros CsgA de clase NCS, la predicción de AF2 para CsgA de E. coli (P28307; pLDDT23-131 = 88; Fig. 2b) es un solenoide β zurdo, de 5 repeticiones, con enlace de 25,4 H candidatos por repetición (RMSD promedio de la cadena principal de los 5 mejores modelos AF2: 0,20 ± 0,14 Å). Como se esperaba del análisis de secuencia, el empaquetamiento de las láminas β del motivo a y del motivo b (hoja 1 y 2) pierde la centrosimetría observada en la clase CS CsgA. En EcCsgA, la columna Asn en la posición 1 se reemplaza por una columna Ser, rompiendo la naturaleza centrosimétrica de la cremallera estérica. Esta columna de residuos de serina puede considerarse como un reemplazo funcional de N1 en el sentido de que también estabilizan el arco β 2, pero tienen un potencial de enlace H más bajo con respecto a la asparagina. EcCsgA también pierde centrosimetría en el núcleo hidrofóbico, que consiste en residuos voluminosos hidrofóbicos Ψ1 y Ψ2 en el motivo a (posición 3 y 5) versus pequeños hidrofóbicos en el motivo b (14 y 16) (Fig. 2b). Esto se compara con un empaquetamiento simétrico de las posiciones Ψ1 y Ψ2 de las secuencias de clase CS (Fig. 2a). Sin embargo, el empaquetamiento de hoja a hoja en EcCsgA abarca un área de superficie enterrada de 231 Å2 por repetición, solo un poco más baja que la vista en R15.5. Una pérdida adicional de simetría se manifiesta a nivel de los arcos β: el arco 1 consiste en el motivo prototípico XGXX (en EcCsgA XGXG) y tiene una curvatura estrecha, mientras que el arco 2 tiene 4–5aa de ancho y muestra una pobre conservación de la secuencia. El promedio de RMSD de la cadena principal entre repeticiones consecutivas es de 0,19 ± 0,01 Å, que es similar al valor obtenido para R15.5. El extremo N de EcCsgA contiene una repetición de curlin imperfecta que se sabe que sirve como señal de secreción y que se ha demostrado que permanece accesible a la proteasa en la fibra madura20,29. El valor promedio de pLDDT para estos primeros 22 residuos (N22) es 47, y N22 se modela de manera inconsistente entre varias predicciones de AF2, ya sea desordenadas o parcialmente acopladas al armazón de solenoide β. Finalmente, el solenoide EcCsgA termina en una repetición completa, lo que significa que la subunidad termina con una hoja 1 (motivo a) y una hoja 2 (motivo b) que sobresalen en los extremos N y C, respectivamente. En R15.5, que termina en media repetición, tanto el voladizo del terminal N como el C se encuentran en la hoja 1 (Fig. 2a).

Como ejemplo de un monómero de curlin con repeticiones degeneradas, nos enfocamos en A0A0S1S4K2 para el cual AF2 predice un solenoide β de 10 cadenas para zurdos con un promedio de 25.6 candidatos de enlaces H por repetición (pLDDT = 77.3; Fig. 2c) (promedio cadena principal RMSD de los 5 mejores modelos AF2: 0,62 ± 0,38 Å). La secuencia A0A0S1S4K2 muestra desviaciones en las columnas N y Q del motivo ay/ob, incluidas las sustituciones de residuos hidrofóbicos. Estas sustituciones N/Q interrumpen la cremallera estérica forzada por enlace H normal, y con frecuencia se encuentra que flanquean las posiciones de las protuberancias en el arco que conecta los motivos respectivos. Esto se traduce en un aumento moderado del RMSD de la cadena principal en las repeticiones vecinas (0,35 ± 0,07 Å). Nuevamente, estas alternancias en los residuos del núcleo de curlin no afectan significativamente el área de la superficie enterrada para el empaquetamiento de los motivos ayb al plegarse el solenoide β, que abarca un promedio de 230 Å2/repetición. Una desviación adicional de un pliegue curlin canónico simétrico continúa para nuestro cuarto ejemplo. El modelo AF2 para A0A0T5PAS6 comprende un solenoide para zurdos con 8 repeticiones, con inserciones en el hilo 1 de las repeticiones 1, 2, 3 y 4 (pLDDT = 75,9; Fig. 2d) (promedio RMSD de la cadena principal de los 5 mejores modelos AF2 : 0,46 ± 0,26 Å). El RMSD neto entre repeticiones para posiciones Cα equivalentes (es decir, sin tener en cuenta estas inserciones) es de 0,45 ± 0,05 Å y refleja las desviaciones locales de la geometría ideal del solenoide para adaptarse a dichas inserciones. Sin embargo, esto no se traduce en una reducción del potencial total de enlaces H, que es de 29,5 por repetición, ni en un área superficial/repetición significativamente alterada, que abarca 220 Å2.

Una inspección minuciosa de la biblioteca de modelos CsgA AF2 reveló una ambigüedad en la preferencia manual de los β-solenoides previstos. Esta ambigüedad se correlacionó con el número de secuencias en las múltiples alineaciones de secuencias. Cuando se ejecuta sin MSA o en el caso de MSA escasamente poblados (es decir, cuando se usa el mmseq2 predeterminado en colabfold), las secuencias CsgA se predijeron con frecuencia como solenoides β diestros, mientras que las mismas secuencias se ejecutan a través de AF2 con MSA bien poblados obtenidos usando jackhmmer consistentemente conducir a un solenoide β zurdo. Esto se ilustra en la Fig. 4 complementaria para R15.5. Curiosamente, ambas predicciones tienen errores de alineación previstos similares, mapas de contacto y pLDDT general (Derecha: 92,8; Izquierda: 93,7) y puntuaciones de pTM (Derecha: 0,91; Izquierda: 0,89), lo que impide una diferenciación a piori entre ambas posibilidades. El análisis MolProbity33 de los modelos relajados AMBER de rango superior para las variantes R y L produjo estadísticas estructurales similares en general, con la puntuación MolProbity esencialmente indistinguible (derecha: 0,68; izquierda: 0,65). La diferencia más notable entre ambos modelos, además de la mano, fue el giro general de las dos láminas en el solenoide β. Los modelos para diestros (R) siempre tienen un giro de ± 20°, mientras que los modelos para zurdos (L) no (Fig. 4 complementaria).

En ausencia de factores selectivos cinéticos de las respectivas vías de plegamiento, parece que los modelos L y R son estados finales teóricos plausibles. ¿Son las fibras curli mezclas racémicas en la práctica o hay un factor discriminatorio? Dada la torsión distinta de cero para el modelo R, predecimos que una protofibrilla R R15.5 sería de naturaleza helicoidal, con una elevación y torsión de 7,2 nm y 20° (es decir, 4,8 Å y 1,3° por repetición) , respectivamente, mientras que una protofibrilla L se construiría solo a partir de la simetría de traslación (consulte la siguiente sección para obtener información adicional, así como la Fig. 4 complementaria). El primero está en conflicto directo con nuestros datos cryoEM (ver más abajo) ya que una protofibrilla R helicoidal produciría promedios de clase 2D que abarcan un continuo de orientaciones de fibrillas, lo que no se observa experimentalmente, lo que indica que las protofibrillas R son muy raras o están ausentes de la conjunto de datos Similar a R15.5, AF2(mmseqs2) produce un modelo de mano derecha para EcCsgA con un giro de 11° (es decir, ~2.2° por repetición), mientras que el modelo de mano izquierda AF2(jackhmmer) muestra una traslación pura de la curvatura. repetir. Nuevamente, solo esto último está respaldado por nuestros datos cryoEM sobre fibras de curlin que se purificaron a partir de una biopelícula bacteriana (discutido en detalle a continuación). Esto también está de acuerdo con las imágenes AFM de alta resolución, que no discernieron un giro helicoidal en las fibras EcCsgA individuales34. Por lo tanto, al menos para P. korlensis y E. coli CsgA, se encontró que las fibras curli tanto in vitro como ex vivo consisten (predominantemente) en subunidades que comprenden un solenoide β zurdo. Aunque hasta ahora no se ha observado, no se puede excluir que diferentes homólogos de CsgA o diferentes condiciones ambientales favorezcan la zurdera.

Habiendo establecido las características estructurales de un monómero de curlin, dirigimos nuestra atención a las predicciones de ensamblajes homo y heteroméricos. Los monómeros Curlin terminan en dos láminas β de bordes abiertos con un escalonamiento de 2,4 Å, es decir, lo que da como resultado un voladizo de una sola hebra en cada extremo. Por lo tanto, las subunidades muestran un motivo a (hoja 1) que sobresale en el extremo N-terminal, y un motivo b (hoja 2) o motivo a (hoja 1) que sobresale en el extremo C-terminal para secuencias que terminan en una repetición completa o media de curlin, respectivamente (Fig. 3a). Si la interfaz de empaquetamiento entre dos monómeros se puede predecir con una confianza razonable, entonces se puede inferir un modelo para la arquitectura curli. Para hacer esto, primero comparamos las capacidades de AF2 para predecir y reproducir con precisión las características específicas de los ensamblajes de proteínas fibrosas, como la presencia de un eje de tornillo y la polaridad de la fibra. Para esto, realizamos predicciones AF2 de los filamentos de bactofilina de Thermus thermophilus que están compuestos de dominios β-helicoidales asociados de extremo a extremo (depositados el 2019-04-23, conjunto de entrenamiento AF2 2018-04-30). Usamos la estructura crioEM de filamento 6RIB como referencia y la comparamos con un modelo de trímero (pLDDT = 86.2; pTMscore = 0.75) que se predijo usando el multímero AF2 (Fig. 5 complementaria). En general, existe una excelente concordancia entre la estructura predicha y la experimental, con una RMSD para todos los átomos de 1,53 Å (2298 átomos). AF2 predice con precisión la naturaleza apolar de los filamentos (es decir, la sucesión de interfaces de cabeza a cabeza y de cola a cola), la lateralidad del solenoide β, la cola N- y C-terminal desordenada, así como la helicoidal. naturaleza (es decir, presencia de un eje de tornillo). Esto reforzó nuestra confianza en la metodología AF2 propuesta para el modelado de curlin y nos impulsó a analizar un trímero AF2 CsgA con más detalle.

a Representación esquemática de bloques de construcción monoméricos para secuencias CsgA que terminan en una repetición completa o media, creando un motivo C-terminal b o un motivo saliente, respectivamente. Cabeza con cola o cola: el apilamiento cola/cabeza-cabeza de monómeros CsgA dará como resultado una fibra con un apilamiento cruzado de monómeros de las arcadas β. El apilamiento de cabeza a cola da como resultado una arcada β paralela en toda la fibra, cabeza-cabeza/cola-cola alterna la dirección de las hebras β, creando una interfaz antiparalela. Un apilamiento de cabeza a cola de secuencias CsgA con cola de media repetición implica un eje de 21 tornillos para un enlace H productivo de la arcada β en las interfaces de las subunidades. b, c Los ensamblajes multiméricos de CsgA representan protofibrillas minimalistas: b El trímero EcCsgA predicho por AF2 en el que los monómeros se apilan 'de la cabeza a la cola' a través de una interfaz única R5/R1 que da como resultado una protofibrilla polar (solo simetría traslacional) con un extremo R1 y R5 . Pegue la representación de la interfaz R5/R1 con enlaces de hidrógeno entre cadenas putativos que se muestran en líneas discontinuas; Para el protómero CsgA central, el motivo ay el motivo b están coloreados en rojo y azul, resp. c Dímero R15.5 según lo predicho por AF2 en el que dos monómeros se apilan 'cabeza con cola' y hacen una rotación de 180° entre sí. La protofibrilla tiene un tipo único de interfase intermolecular (R15.5/R1), con una simetría traslacional 21 y extremos polares formados por repeticiones R1 y R15.5, respectivamente.

El modelo AF2 de un trímero EcCsgA consta de tres monómeros apilados de cabeza a cola que interactúan a través de sus repeticiones R5/R1 por medio del aumento de la hoja β, formando un pliegue de solenoide continuo (Fig. 3b, Fig. 6 complementaria). Este conjunto de protofibrillas se construye a partir de una simetría traslacional pura, sin eje de tornillo presente ni ningún giro medible. Al observar la interfaz entre dos monómeros, encontramos una transición casi perfecta de la red de enlaces de hidrógeno del solenoide β, es decir, la interfaz R5/R1 contiene 23,3 enlaces H putativos (promediados sobre el trímero) que está a la par con el número promedio de candidatos de enlace H entre las repeticiones dentro de un solo monómero CsgA. Esta continuidad se ve facilitada por los bajos valores de RMSD entre R1 y R5, así como por la conservación de los residuos de la cremallera estérica que conducen a una digitación intermolecular muy similar a los contactos intramoleculares. El motivo A-arc1-motifB-arc2 β-arcade continúa sin interrupciones. AF2 predice que N22 está desordenado y excluido de la arcada β de curli y, por lo tanto, sobresale de las fibras, en consonancia con su susceptibilidad proteolítica informada en fibras maduras de curli20.

Vale la pena señalar que, aunque AF2 no lo predijo, CsgA también podría oligomerizar mediante interacciones consecutivas de cola a cola / cabeza a cabeza (Fig. 3a, Fig. 6 complementaria). Con ese fin, pusimos manualmente dos moléculas de CsgA en contacto R5/R5 y realizamos un acoplamiento local utilizando RosettaDock para optimizar la geometría local (puntuación de la interfaz: -9,5). Hacemos referencia a este dímero de cola a cola con un dímero CsgA de cabeza a cola optimizado de manera similar en el que usamos el modelo AF2 como entrada para RosettaDock (puntuación de interfaz: -15,5). Ambos modelos tienen un número similar de enlaces H putativos en la interfaz del dímero (23 frente a 21), pero el modelo de cola a cola se empaca en forma antiparalela, lo que desencadena un desplazamiento lateral de 1 residuo entre ambas hebras en la interfaz, y pobre contactos en las cremalleras estéricas N/Q en las arcadas como resultado. La extrapolación de tal dímero a una protofibrilla produce un patrón escalonado con una frecuencia de 2 nm, que no observamos experimentalmente (ver Fig. 4c), reafirmando el modelo de cabeza a cola producido por AF2. Además, previamente encontramos que las fibras EcCsgA exhiben una cinética de extensión polar, una observación que solo es compatible con una interacción de cabeza a cola de las subunidades curli34.

una imagen cryoEM de bajo aumento (25k) de la matriz extracelular de MC4100 que resuelve dos tipos de fibras: flecha blanca, filamentos curli; flecha negra, fibras no identificadas, potencialmente eDNA o polisacárido; b Imagen CryoEM a 60k de fibras curli aisladas; c vista lateral RELION 4.0 promedio de clase 2D de protofibrillas curli; d Imagen CryoEM a 60k de fibras R15.5 recombinantes formadas in vitro en MES 6.0 15 mM; e, f Promedios de clase 2D de vista superior y lateral RELION 4.0 de R15.5; g, h Vista superior, lateral (g; mostrada como sección transversal), en ángulo y en el eje h de un volumen crioEM RELION 4.0 Class3D de una fibrilla R15.5 mostrada en el nivel 0.0137; Acoplamiento de una unidad trimérica del modelo R15.5 AF2 en el volumen cryoEM, con monómeros de color naranja y cian alternativamente. Todas las imágenes crioEM son representativas de cuadrículas de más de 10 preparaciones de muestras independientes.

Para R15.5, el mecanismo de dimerización de cabeza a cola parece similar en primera instancia, es decir, el aumento del solenoide β mediante el acoplamiento de hojas abiertas y la complementariedad de la cremallera estérica (Fig. 3c; Fig. 7 complementaria). Sin embargo, R15.5 tiene un número impar de cadenas (es decir, 31), lo que da como resultado un motivo que sobresale tanto en N como en C-terminal. Esta geometría no permite una interacción traslacional simple de cabeza a cola (Fig. 3a). Más bien, una combinación adecuada de dos motivos que sobresalen a través de una interfaz de dímero requeriría una fibra que consista en interacciones consecutivas cabeza-cabeza-cola-cola (Fig. 3a), o interacciones cabeza-cola con un tornillo doble, es decir, 180 ° rotación de subunidades consecutivas a lo largo del eje largo de la fibra (Fig. 3a). Al evaluar la dinámica de crecimiento de una sola fibra para el ensamblaje in vitro de R15.5 mediante imágenes AFM, encontramos que las fibras mostraban un polo de extensión lento (es decir, 0,8 ± 0,1 nm/s) y rápido (4,5 ± 0,1 nm/s) (Fig. 8), lo que indica que las fibras son polares y, por lo tanto, es probable que adopten una interacción de cabeza a cola. La formación de disulfuro de residuos Cys introducidos a través de la interfaz R15.5 ocurrió de acuerdo con un eje de tornillo 21 (Fig. 8a, b complementaria), y también la predicción de novo por AF2 mostró un tornillo 21 de cabeza a cola en la subunidad-subunidad interfaz (Fig. 3c y Fig. 7 complementaria). Finalmente, la comparación de modelos in silico de dímeros de cabeza a cola y de cola a cola obtenidos con RosettaDock35 mostró que una transición perfecta de la arcada β entre dos moléculas solo ocurre en el primero, facilitada por la naturaleza centrosimétrica del estérico. cremallera en este monómero de clase CS. Para esta interfaz R15.5 de eje de tornillo, se encuentran 32 enlaces H putativos (en lugar de solo 12 para las interacciones cola-cola, figura complementaria 7), lo que es notablemente consistente con el promedio de 29.6 entre repeticiones dentro de un R15.5 monómero También notamos que el segundo arco β se reduce de 4aa a 3aa en las dos últimas repeticiones. Esto, a su vez, acomoda perfectamente la continuación de la arcada β 2 del primer monómero en la arcada β 1 ​​del segundo monómero a través de la interfase.

Finalmente, dada la alta conservación de secuencia y estructura en el núcleo amiloide CsgA, investigamos contactos heteroméricos entre homólogos de CsgA de diferentes especies. Esto es relevante porque se ha demostrado que ocurre una siembra cruzada promiscua entre curli producidos en biopelículas entre especies36. Para esto, observamos un modelo AF2 de un dímero CsgA-CsgA Citrobacter-Salmonella (pLDDT: 79.8; pTMscore: 0.78; Fig. 9 complementaria). Este dímero es conceptualmente idéntico al homotrímero que se muestra en la Fig. 3a en que la repetición R5 de CsgA_Citrobacter se acopla a la repetición R1 de CsgA_Salmonella, sin eje de tornillo presente. Estos resultados muestran que la arquitectura repetida conservada facilita el acoplamiento de monómeros dispares en las fibrillas, lo que facilita la reactividad cruzada de curlin entre especies.

En su contexto natural, las fibras de curli se producen como una masa errática y entrelazada que constituye el componente principal de la matriz extracelular (MEC) en condiciones de formación de biopelículas18. Esto se ejemplifica en la imagen cryoEM de bajo aumento (1,88 Å/pix; 20k; Fig. 4a) que recopilamos de la ECM producida por E. coli MC4100 después de 72 h de crecimiento en agar YESCA a temperatura ambiente. En la figura 4a, se pueden distinguir múltiples estructuras filamentosas que emanan de una célula bacteriana y la envuelven. Los intentos de generar promedios de clase cryoEM estables a partir de segmentos de filamentos extraídos digitalmente no tuvieron éxito. Por lo tanto, procedimos a aislar las fibras de curli ex vivo siguiendo el protocolo de extracción que fue optimizado por Chapman et al. conglomerados de curli que conducen a una muestra de curli dispersa de la que se recopiló un conjunto de datos cryoEM con un aumento de 60k (0,784 Å/pix; Fig. 4b). Aunque la mayoría de los curli todavía existían como grandes haces multifilamentosos, los fragmentos de una sola fibra permitieron el promedio 2D utilizando RELION 4.038, lo que produjo un promedio de clase de vista lateral único con características de estructura secundaria presentes (Fig. 4c). Esto reveló una arquitectura beta cruzada caracterizada por una repetición de 4,8 Å, un ancho de fibrillas de 20 Å y un escalonamiento de media unidad entre las hebras β opuestas en las dos láminas del solenoide β. El espectro de potencia correspondiente muestra dos máximos amplios a 1/4,8 Å−1 y 1/10 Å−1 en un ángulo de ~ 13° y 90° con respecto al meridiano, lo que refleja, respectivamente, el espaciamiento escalonado de 4,8 Å de las hebras β y el Espaciado de ~ 10 Å de las dos hojas β (Fig. 10 complementaria). Estos números coinciden estrechamente con las arquitecturas de monómero y fibra de EcCsgA predichas por AF2. La ausencia de otros máximos en el espectro de potencia sugiere una ausencia de simetría helicoidal, aunque la baja simetría helicoidal bajo la forma de un eje de tornillo de dos pliegues no puede descartarse basándose únicamente en estos datos. Sin embargo, nuestro análisis de la estructura trimérica AF2 sugiere que la presencia de un eje de tornillo es poco probable, y también los patrones de etiquetado de nanooro obtenidos por Chen et al. están de acuerdo con una propagación de cabeza a cola puramente traslacional de las subunidades CsgA en fibras curli17.

También notamos que no hay características claras que delineen la interfaz entre dos monómeros CsgA sucesivos (cfr. un solo monómero consta de 5 motivos beta-arco-beta), ni hay máximos de baja resolución en el espectro de potencia desde el cual un Se podría estimar el período de fibra (Figura complementaria 10a). Esto significa que la alineación lateral de los segmentos de curli en el protocolo de clasificación no encontró un registro de fibrillas, una consecuencia probable de la transición casi perfecta entre monómeros sucesivos y la naturaleza casi isomorfa de las repeticiones. En consecuencia, debido a la falta de promedios de clase de alta resolución adicionales correspondientes a diferentes orientaciones de fibrillas, la reconstrucción 3D no era factible en este momento. Los intentos de obtener más clases 2D utilizando fibras EcCsgA cultivadas in vitro34 no tuvieron éxito debido a la alta tendencia a agruparse de las fibras.

A la luz de los problemas de inestabilidad coloidal de EcCsgA, decidimos buscar la estructura de un homólogo de CsgA. Para esto, seleccionamos R15.5 debido a su alto contenido de Asp y Glu (20%; pI = 2.98), lo que nos lleva a plantear la hipótesis de que las protofibrillas R15.5 serían menos propensas a enredarse debido a la electrostática repulsiva. R15.5 se expresó de forma recombinante y se purificó a partir de cuerpos de inclusión y se dejó polimerizar después del intercambio de tampón. El análisis TEM reveló fibras similares a curli que exhibieron solo una agregación mínima entre fibrillas (Fig. 4d). Dado su alto contenido de Asp y Glu, presente en las escaleras estéricas en la superficie R15.5 motivo a (hoja 1), probamos si la formación de fibrillas R15.5 podría ajustarse cambiando el pH o usando Ca2+ como contraión para evitar la repulsión de carga. . De forma un tanto inesperada, R15.5 aún formaba fibrillas en presencia de EDTA 10 mM, MES 6.0 15 mM (Fig. 11 complementaria) o bicina 50 mM pH 9.0 (Fig. 11 complementaria), condiciones en las que se forman las escaleras de Asp o Glu. sobre R15.5 se esperaba que el plegamiento y la polimerización dieran como resultado una repulsión de carga. Sin embargo, cuando complementamos MES 6.0 15 mM con CaCl2 10 mM (Fig. 11 complementaria) o cambiamos el tampón a Acetato de Na 4.0 50 mM (Fig. 11 complementaria) observamos un marcado aumento en los agregados fibrilares. Sorprendentemente, no se encontró que el pH tuviera un efecto significativo en la cinética de polimerización de R15.5 (Fig. 12 complementaria) a juzgar por el decaimiento temporal de los espectros de RMN de 1D H (R15.5 muestra una unión deficiente a ThT) que se recolectaron a lo largo del curso del proceso de fibrilación. Estos resultados demuestran que la amiloidogenicidad de R15.5 es robusta, pero que la electrostática del solvente hasta cierto punto puede ajustar las propensiones a la agregación de fibras.

En la Fig. 4d, mostramos una imagen crioEM representativa de fibrillas R15.5 cultivadas in vitro y los promedios de clase RELION 4.0 2D correspondientes, que asignamos como vistas frontal y lateral. La vista lateral de R15.5 es casi idéntica a la vista lateral de E. coli curli, lo que sugiere que las fibrillas R15.5 ex vivo curli e in vitro son estructuralmente equivalentes a nivel de pliegue y esencialmente de acuerdo con las predicciones de AF2. Los promedios de clase 2D adicionales correspondientes a diferentes vistas rotadas a lo largo del eje de la fibrilla se muestran en la Fig. 13a complementaria, que corresponden bien a los promedios de clase 2D simulados que se generaron en Cryosparc v3.3.2 usando un trímero R15.5 AF2 como modelo de entrada (Fig. 13b). Refine3D en RELION 4.0 usando reconstrucción helicoidal con valores fijos de giro y elevación correspondientes a 180° y 72 Å (simetría: C1; valor T: 25) usando un volumen Class3D de rango superior de un trabajo anterior y las partículas correspondientes como entrada, produjo un volumen de resolución de 7.6 Å (FSC 0.143; Tabla S1) que está de acuerdo con las características estructurales de los modelos predichos para CsgA, a saber, las dimensiones generales de las fibrillas, la arquitectura cruzada-β, el escalonamiento entre hebras opuestas en las repeticiones de curli, y las distancias entre repeticiones características de 4,8 Å. El acoplamiento de un modelo R15.5 AF2 (Fig. 4h) muestra una buena concordancia entre el volumen crioEM experimental y la arquitectura β-solenoidal prevista. El carácter casi isomorfo y centrosimétrico de las repeticiones de curlin da como resultado una falta de características de baja resolución para guiar las primeras etapas de la alineación de partículas 3D. Estrategias para introducir fiduciales expuestos a la superficie (p. ej., marcaje de etiquetas His utilizando partículas de nanooro Ni-NTA de 5 nm de diámetro; inserción de dominios plegados en arc-1 o arc-2 de la repetición 8; inmunotinción con anticuerpos monoclonales de ratón anti-his ) no dio como resultado una alineación de partículas 2D y/o 3D mejorada. Por lo tanto, el volumen de Refine3D informado representa un mapa que se promedia longitudinalmente sobre las repeticiones de curlin (Fig. 4g).

Nuestros resultados muestran que la protofibrilla curli consiste en un solenoide β supermolecular altamente regular con un giro helicoidal ausente o insignificante. Curiosamente, además de producir protofilamentos únicos, las fibrillas de curli también tienen una tendencia a formar estructuras de orden superior irregulares o incluso sistemáticas (Fig. 5). EcCsgA curli, por ejemplo, muestra con frecuencia una asociación lateral en haces más gruesos, con un diámetro promedio de 17 ± 9 nm (media, desviación estándar, n = 108) y valores atípicos de hasta 48 nm (Fig. 5g). R15.5 mostró un rango de asociación lateral, que va desde fibrillas individuales (ver arriba) sobre dímeros de fibrillas regulares, hasta matrices planas en las que se apilan múltiples fibrillas una al lado de la otra de manera organizada (Fig. 5a). El promedio de clase 2D de segmentos en caja de dichas láminas de fibra resuelve múltiples fibrillas R15.5 paralelas (Fig. 5b). Para las 3 fibrillas en la región central de la lámina de fibra, resolvemos claramente las características del solenoide β. Las hebras de cada fibrilla están alineadas con las hebras de la fibrilla vecina, lo que sugiere fuertemente que hacen contactos específicos entre fibrillas. Si el empaquetamiento entre fibrillas no fuera específico, se podría esperar que las fibrillas se deslizaran entre sí, lo que produciría un promedio de clase 2D en el que solo una única fibrilla tiene sus características de estructura secundaria resueltas. Tal situación se observa para los dímeros de fibra EcCsgA, donde una fibrilla se resuelve a nivel de estructura secundaria, mientras que las fibrillas asociadas muestran una proyección difusa en los promedios de clase 2D (Fig. 5h). Para R15.5, planteamos la hipótesis de que los contactos de empaquetamiento entre las fibrillas R15.5 están mediados por electrostática. Específicamente, el modelo AF2 de R15.5 predice una cuadrícula cuadrada de residuos de glutamato y aspartato en el motivo expuesto al solvente en un flanco, formando un gran parche cargado negativamente (Fig. 5c). Como resultado del eje del tornillo para una fibrilla R15.5, ese parche negativo alternará lados a lo largo del eje de la fibrilla, lo que facilitará la formación de puentes salinos entre las fibrillas vecinas mediados por cationes divalentes a ambos lados de la fibrilla (Fig. 5d). ). Si complementamos la solución tampón con un exceso estequiométrico de iones Ca2+ -CaCl2 final 30 mM agregado a R15.5 3 µM- en presencia de MES 15 mM pH 6.0 y fosfato de potasio 250 µM, entonces ya no observamos la formación de láminas, sino más bien incrustación de fibrillas R15.5 individuales (Fig. 5e). TEM resuelve una fibrilla R15.5 de 2,5 nm de diámetro en el núcleo, envuelta por una corteza gruesa que oscila entre 10 y 30 nm (Fig. 5f). Nuestra hipótesis es que esta corteza es un depósito inorgánico compuesto por una fase cristalina de fosfato de calcio que se nuclea en la rejilla D/E (Fig. 5c).

una imagen CryoEM de fibras R15.5 paralelas apiladas lateralmente organizadas en una matriz plana; b Promedio de clase 2D de segmentos en caja de la región central de matrices R15.5 donde se resuelve la estructura secundaria de las tres fibrillas centrales; c Conjunto regular de residuos de asp y glu expuestos en la superficie en el flanco de la hoja 1 del monómero R15.5; d Modelo idealizado para la organización supramolecular de fibrillas R15.5 mediada por puentes salinos entre fibrillas. El eje del tornillo facilita la alternancia de interfaces de unión entre fibrillas consecutivas; e Incrustación de fibrillas R15.5 en presencia de CaCl2 30 mM y cantidades traza (±250 µM) de KH2PO4/K2HPO4; f Ampliación del área encuadrada en e resolviendo el núcleo de fibrillas (flechas amarillas) rodeado por un depósito grueso; g Gráfico de violín del diámetro de fibras curli ex vivo purificadas a partir de la ECM de MC4100: línea continua = mediana, líneas discontinuas = cuartiles (n = 108 fibras); h Promedio de clase 2D de fibras curli en las que solo una sola fibrilla con elementos secundarios resueltos. Las imágenes CryoEM de la organización y la incrustación de curli son representativas de cuadrículas de >5 preparaciones de muestras independientes.

La mayoría de los grupos de genes curli codifican dos proteínas similares a CsgA19. En Enterobacteriacea como Escherichia y Salmonella, donde se estudia mejor el operón curli, estas secuencias similares a CsgA se diferencian en una subunidad mayor curli CsgA, que forma el principal componente de autoensamblaje de las fibras curli, y una subunidad menor CsgB, que actúa como nucleador de la amiloidogénesis de CsgA tanto in vitro como in vivo21,22,39. En la superficie celular, CsgB interactúa con el factor accesorio extracelular CsgF, una interacción que es esencial para la nucleación de fibras curli asociadas a células. En ausencia de CsgB o CsgF, las subunidades de CsgA secretadas se liberan al entorno extracelular como monómeros desplegados20. Para obtener una vista de la secuencia y las propiedades estructurales de CsgB, recuperamos todas las secuencias únicas de la base de datos RefSeq que se anotaron como CsgB o curlin menor (n = 2296), eliminamos su secuencia de señal a través de Signalp640, filtramos la redundancia del conjunto de datos a < 90 % de similitud de secuencia por pares y se eliminaron las entradas parciales. Las secuencias de dominio maduras resultantes variaron en longitud de 50 a 561 residuos (Fig. 14a complementaria). Para facilitar la alineación global y la generación de MSA, restringimos nuestro análisis a variantes de CsgB que tienen un número similar de repeticiones de curlin (es decir, 5 repeticiones, lo que traduce longitudes de secuencia entre 100 y 160 aminoácidos para permitir longitudes variables de la región N22 en el terminal N). El MSA curado resultante de n = 166 secuencias CsgB produjo el siguiente logotipo de consenso (consulte la Fig. 14c complementaria). A partir de esto, queda claro que la región central del logotipo de consenso exhibe motivos de secuencia conservados que son similares al núcleo amiloide curlina definido para CsgA, es decir, N-$-Y1-$-Y2-$-Q. Se ha propuesto que CsgB adopte un pliegue β-solenoidal que sea estructuralmente equivalente y, por lo tanto, compatible con la arquitectura de una fibrilla curli CsgA39. La predicción AlphaFold2 de E. coli CsgB revela un solenoide β zurdo muy similar a EcCsgA (Cα RMSD 0.88 Å, consulte la Fig. 14b complementaria). El motivo a en R1 y tanto el motivo a como el b de la repetición C-terminal (R5) están menos conservados y degenerados de los motivos canónicos en la posición de su primer Asn. Con frecuencia, estas posiciones contienen residuos más voluminosos, como Q, K y M en E. coli CsgB (EcCsgB), que sobresalen lateralmente del apilamiento casi homotípico de las repeticiones curlin, particularmente en R5. Esta repetición de curlin imperfecta en el borde C-terminal del monómero CsgB puede ser la base de la propensión reducida al ensamblaje de fibras de esta subunidad de pilus menor. Estudios anteriores también han señalado el papel de R5 en la interacción CsgF-CsgB.

Nuestra comprensión estructural de las fibras amiloides ha avanzado mucho en la última década. Un denominador común que ha surgido del extenso conjunto de estructuras amiloides experimentales es el pliegue serpentino, es decir, una disposición plana de hebras beta y vueltas que forman ultraestructuras superplisadas que se estabilizan mediante interacciones de cremallera estérica y apilamiento homotípico hebra-hebra. . Sorprendentemente, las fibras amiloides pueden exhibir un alto grado de polimorfismo al nivel del pliegue serpentino y/o al nivel de los contactos de las protofibrillas2,3,4. Pequeños cambios en la secuencia primaria o en las condiciones de polimerización pueden conducir a cambios drásticos en la ultraestructura final de la fibra amiloide. Esa sensibilidad de la estructura cuaternaria a las condiciones iniciales probablemente se puede atribuir al hecho de que para la mayoría de los péptidos/proteínas informados no ha habido (o tal vez incluso una negativa) presión evolutiva para plegarse en una estructura amiloide específica. Más bien, la mayoría de los amiloides caracterizados se forman como una consecuencia no deseada de un desencadenante ambiental que conduce a un proceso de amiloidogénesis que es estocástico y susceptible a perturbaciones externas.

Esto contrasta marcadamente con los amiloides funcionales que se han formado mediante procesos evolutivos, en los que las especies fuera de ruta y el polimorfismo incontrolable bien pueden ser biológicamente intolerables y, por lo tanto, bajo selección negativa. De hecho, este parece ser el caso de curli. Después de más de dos décadas de investigación sobre curli, no hay observaciones experimentales de polimorfismo de fibra, es decir, ha habido informes consistentes de diámetros de protofibrillas y no hay simetría helicoidal medible o cambios de la misma. Del mismo modo, no encontramos evidencia de promedios de clases de fibras escasamente pobladas correspondientes a protofibrillas de curli helicoidales. Para curli, la consistencia estructural es probablemente una necesidad impuesta por el mecanismo de anclaje al complejo extracelular CsgG-CsgF-CsgB. En un proceso de fibrilación dependiente de la nucleación, el complejo CsgG-CsgF-CsgB podría imponer conformadores estructurales. Encontramos que las protofibrillas de curli aislados ex vivo y formados in vitro comprenden una estructura β-solenoide idéntica, lo que sugiere fuertemente que esta estructura es una propiedad intrínseca de la secuencia CsgA. Además, la estructura predicha para la subunidad CsgB es muy similar a la de CsgA, lo que garantiza una plantilla estructuralmente coincidente para el plegamiento y ensamblaje de CsgA. Para curli, la consistencia estructural existe en forma de un pliegue de solenoide β conservado de los bloques de construcción monoméricos. A pesar de las variaciones sutiles en el andamio del solenoide β y sus decoraciones locales en forma de inserciones, las predicciones de AF2 son notablemente conservadoras a pesar de las grandes variaciones en la secuencia primaria. Encontramos un pLDDT AF2 promedio de 83, con alrededor del 8% de las secuencias con una puntuación pLDDT más baja de <70. Las puntuaciones locales pLDDT bajas pueden ser indicativas de un trastorno local41. En curli, el apretado empaquetamiento de las repeticiones de curlin en la estructura del solenoide β permite poco o ningún desorden local, pero las subunidades de curlin se encuentran en un estado intrínsecamente desordenado antes de incorporarse a la fibra de curlin, y deben permanecer desplegadas para permitir el transporte a través de el canal CsgG20,42. Es interesante especular que la puntuación más baja de pLDDT para las subunidades curli puede reflejar el carácter intrínsecamente desordenado del estado preamiloide.

Los solenoides β abiertos que carecen de dominios capping43,44 dan lugar a un mecanismo de polimerización que se basa principalmente en la compatibilidad de los motivos de la estructura secundaria, es decir, el aumento de la hoja β y la extensión de la arcada β que está mediada predominantemente por los contactos de la cadena principal, dependientes solo en menor medida en los contactos de cadenas laterales locales entre cadenas. En ese sentido, es interesante notar que el pliegue β-solenoide no es exclusivo de curli, sino que también se encuentra comúnmente en proteínas que no forman fibra. Las búsquedas de similitud estructural del banco de datos de proteínas (http://www.wwpdb.org/) y la base de datos de estructura de proteínas Alphafold (https://alphafold.ebi.ac.uk/) revelan cientos de no homólogos (identidad de secuencia por pares < 10 %) de estructuras que contienen dominios de solenoide β con puntajes Z altos para el pliegue de curlin (> 6 y más; Tabla S2, Fig. 15 complementaria) 45. Las estructuras conocidas que incluyen dominios de solenoide β incluyen, entre otras, proteínas de unión a hielo y anticongelantes, picos de cola de fago, adhesinas, proteínas repetidas ricas en Leu, glucosidasas, proteínas de la capa S (Tabla S2; Fig. 15,a complementaria). Nuestra búsqueda no identificó ninguna proteína polimerizante o de tipo amiloide. En cambio, los dominios de solenoide β forman un andamio estructural para los monómeros de proteínas, en lugar de una unidad de polimerización. En estas proteínas β-solenoide, las imperfecciones estructurales en el(los) motivo(s) terminal(es) del solenoide o las adiciones de dominios de bloqueo estérico impiden la polimerización por interacciones cabeza a cola o cola a cola/cabeza a cabeza de los monómeros. En particular, una similitud estructural con la base de datos de estructura de proteínas Alphafold humana identifica varias proteínas que muestran dominios β-solenoide de borde abierto (Tabla complementaria 2; Figura complementaria 15b), incluidas proteínas de matriz extracelular como mucinas y proteínas asociadas a queratina, o suprabasin y no caracterizadas proteína FLJ40521. Sin embargo, no está claro si estos dominios β-solenoides soportan la polimerización en estas proteínas. En curli, la preservación estructural y la complementariedad en todo el solenoide β están garantizadas por un alto grado de conservación de un número limitado de residuos clave que participan en los contactos de cremallera estéricos y la estabilización de las estructuras de la arcada β. En ese sentido, observamos que Zhou y sus colaboradores han demostrado que puede ocurrir una siembra cruzada promiscua entre curli producidos en biopelículas entre especies, un proceso que probablemente dependa de una arquitectura curli conservada36. Además, los componentes de la matriz extracelular como el curli se han propuesto como un bien público secretado, al menos en biopelículas de una sola especie46. La conservación estructural en las subunidades de curli puede permitir la formación de fibras mixtas y, por lo tanto, permitir la contribución de múltiples especies de monómeros de curli a la matriz del biofilm. Es interesante especular que los polimorfismos de solenoide que se encuentran en las familias conformacionales de curlin definidas en este trabajo, es decir, CS, NCS y D, pueden dar como resultado cierta especificidad de la siembra cruzada de curlin y posiblemente en asociaciones de biopelículas multiespecíficas. En los últimos años, también se ha prestado una atención cada vez mayor a la posible actividad de siembra cruzada de curli liberados por proteobacterias comensales y patógenas hacia los amiloides patológicos humanos, con múltiples informes que indican una actividad estimuladora o de siembra in vitro e in vivo hacia la amiloidogenidad de la α-sinucleína12,47 ,48. A este respecto, es interesante observar que nuestra similitud estructural de la base de datos de la estructura de la proteína Alphafold humana identifica varias proteínas con dominios de solenoide β de borde abierto con una alta similitud estructural con el pliegue de curlin (Tabla complementaria 2; Figura complementaria 15b), incluyendo proteínas extracelulares y mucosas como proteínas asociadas a queratina y mucinas. Esto puede justificar una mayor atención a una posible interacción de las proteínas de la matriz de la mucosa y los comensales y patógenos productores de curli en el tracto intestinal y urinario.

Las fibras de Curli crean un nicho único en la superfamilia de proteínas amiloides. Las fibras de Curli no muestran el pliegue serpentino típicamente observado para los amiloides patológicos o visto recientemente en los amiloides funcionales basados ​​en péptidos como los antimicrobianos anfibios tipo LARK14. Los amiloides patológicos resultan del apilamiento homotípico de regiones o fragmentos peptídicos después de la liberación proteolítica o el despliegue de un polipéptido que normalmente adopta un estado nativo globular. Las subunidades de Curli adoptan un estado nativo de solenoide β globular, donde la alta conservación de los residuos centrales en el motivo repetido de curlin da como resultado un apilamiento casi homotípico de las cadenas β. CsgA, por lo tanto, combina las características de las proteínas globulares con características que a menudo se asocian con los amiloides, como una estructura beta cruzada apilada y una polimerización dependiente de la nucleación. Por un lado, el estado preamiloide de las subunidades curli no está asociado con la formación de agregados amorfos o especies oligoméricas que se observan con frecuencia en los amiloides patológicos. En cambio, las semillas de curli se forman durante una fase estocástica inicial de nucleación, seguida instantáneamente por una etapa de extensión escalonada y autocatalizada de fibras β cruzadas que son extremadamente robustas34. Sin embargo, por otro lado, el análisis MSA descubre fuertes acoplamientos coevolutivos que proporcionan restricciones de distancia que predicen casi de manera determinista un estado monomérico plegado único. En ese sentido, la formación de rizos también puede verse como un proceso de polimerización clásico con la complejidad añadida de que la tasa de plegamiento probablemente sea proporcional a la tasa de agregación, y que el plegamiento se moldea una vez que ha tenido lugar la nucleación primaria. En este modelo, el voladizo de una sola hebra en los extremos de la fibra proporcionaría una superficie de plantilla que recluta y ayuda a plegar los protómeros CsgA entrantes. Al menos in vitro, las fibras EcCsgA curli se extienden desde ambos extremos de las fibras, aunque con cinéticas marcadamente diferentes34. Se necesitarán estudios futuros para determinar la base estructural de esta cinética de crecimiento polar y para determinar la orientación de las fibras curli en la superficie celular y los polos de crecimiento biológicamente activos.

Finalmente, hacemos un uso liberal de la terminología de cremallera estérica para referirnos al patrón entrelazado de residuos conservados que miran hacia adentro, pero para CsgA esa interdigitación no ocurre en el mismo plano -como es el caso clásico para PAs- debido a la tambaleándose entre las hebras opuestas. Por lo tanto, está claro que curli desdibuja las líneas entre los polímeros proteicos clásicos y las fibras amiloides, lo que lleva a una reevaluación de la definición de amiloide funcional.

Para buscar homólogos de CsgA/B, configuramos una base de datos del genoma Refseq local (ftp://ftp.ncbi.nlm.nih.gov/genomes/refseq/bacteria/). La búsqueda del genoma se realizó utilizando HMMER v3.3.2 con un valor de umbral de 1e−5, utilizando los modelos de Markov ocultos de perfil curado de Dueholm et al.19 Las secuencias líder N-terminal se eliminaron utilizando SignalP_6.0, y de este conjunto de secuencias maduras se eliminaron las entradas duplicadas. Las secuencias repetidas de Curlin se extrajeron mediante una serie de búsquedas consecutivas de expresiones regulares. Primero, buscamos motivos X6QX10Q (regex:.{6}Q.{10}Q), luego buscamos iterativamente motivos NX5QX9 (mínimo 22 residuos) que carecen de la segunda Q, pero tienen una N en la posición 1 (regex: ([az]{22,})(N.{5}QG{9,})). En un tercer paso, también incluimos motivos degenerados más largos X(AIVLSTG)X(IVLQTA)xQxGx9, para los cuales usamos la siguiente expresión regular: ([az]{22,})(..[AIVLSTG].[IVLQTA]. QG{9,}). Todas las secuencias repetidas de curlin extraídas se compilaron en un solo multi-fasta, y los logotipos de secuencia se crearon utilizando Weblogo 3 (http://weblogo.threeplusone.com/create.cgi).

Para el análisis de secuencias CsgB, recuperamos todas las secuencias únicas de la base de datos RefSeq anotadas como CsgB o curlin menor, eliminamos su secuencia de señal a través de Signalp640, filtramos la redundancia del conjunto de datos hasta <90 % de similitud de secuencia por pares y eliminamos cualquier entrada parcial. Para facilitar la alineación global y la generación de MSA, restringimos nuestro análisis a variantes de CsgB con un número similar de repeticiones de curlin (es decir, 5 repeticiones, lo que traduce longitudes de secuencia entre 100 y 160 aminoácidos para permitir longitudes variables de la región N22 en el N -término).

La predicción de la estructura de la proteína por lotes del conjunto de datos homólogo se realizó mediante la implementación localcolabfold30,31,32 (https://github.com/YoshitakaMo/localcolabfold) de AlphaFold2 utilizando un valor de tolerancia de 0,5, ejecutándose durante 6 ciclos y generando 5 modelos. Los modelos se clasificaron utilizando la puntuación pLDDT. Los modelos correspondientes a las Figs. 2a, b y 3 se produjeron usando el cuaderno AlphaFold2_advanced.ipynb Jupyter en https://github.com/sokrypton/ColabFold usando Jackhmmer49, un valor de tolerancia de 0.1, 24 reciclados y generando 5 modelos, y conservando los modelos mejor clasificados. Para predicciones multiméricas, las secuencias primarias de diferentes subunidades fueron concatenadas y separadas por una '/'.

CsgA (P28307) y R15.5 (A0A0E3UX01) se clonaron en pET22b a través del sitio NdeI sin su secuencia señal pero con una etiqueta C-terminal 6xHis-tag. La expresión se indujo en células BL21(DE3) ΔslyD mediante la adición de IPTG 1 mM después de alcanzar una DO600nm de 0,6. Las células se recogieron por centrifugación a 5000 g durante 10 min después de 1 h de inducción. Los sedimentos se lisaron durante 30 min en tampón A (Kpi 50 mM, pH 7,2, NaCl 500 mM, urea 8 M, imidazol 12,5 mM) y el lisado celular se centrifugó a 40 000 g durante 30 min a 20 °C. Después de la sonicación para reducir la viscosidad del lisado, el sobrenadante se cargó en una columna HisTrapTM FF (GE Heathcare Life Sciences) equilibrada en 5 volúmenes de columna (CV) de tampón A. Después de lavar en 10 CV de tampón A, la proteína se eluyó usando tampón B (Kpi 50 mM pH 7,2, Gnd HCl 8 M, imidazol 250 mM). Las fracciones de proteínas relevantes se agruparon y filtraron con un filtro de corte de 0,22 µm para eliminar cualquier potencial semilla de amiloide y se almacenaron a –80 °C.

Para evitar cualquier formación de amiloide no deseada en nuestras soluciones madre de proteínas, todos los pasos de purificación se realizaron en condiciones desnaturalizantes (urea 8 M) y los tiempos de manipulación a temperatura ambiente se redujeron al mínimo absoluto. Este enfoque nos permite almacenar CsgA y R15.5 en su forma preamiloide desplegada y proporciona control sobre el punto de inicio exacto de la polimerización cambiando el tampón a condiciones nativas, es decir, MES 15 mM pH 6,0. Para eliminar la urea, se utilizaron columnas de desalinización por centrifugación ZebaTM (7 K MWCO) (Thermo Scientific) o columnas de desalinización HiTrap de 5 ml (GE Healthcare).

Las imágenes de TEM de tinción negativa (nsTEM) de los filamentos R15.5 se realizaron utilizando rejillas de cobre recubiertas de formvar/carbono (Electron Microscopy Sciences) con una malla de 400 orificios. Las rejillas se descargaron con brillo (ELMO; Agar Scientific) con una corriente de plasma de 4 mA durante 45 s. Se aplicaron 3 µl de solución de filamentos R15.5 ensamblados in vitro sobre las rejillas de descarga luminiscente y se dejaron adsorber durante 1 min. La solución se secó, seguido de tres lavados con 15 µl de Milli-Q. Después de eso, las rejillas se sumergieron en gotas de 15 µl de acetato de uranilo al 2 % tres veces durante 10 s, 2 s y 1 min respectivamente, con un paso de transferencia entre cada inmersión. A continuación, el exceso de colorante se secó con papel Whatman tipo 1. Todas las cuadrículas se analizaron con un microscopio JEOL 1400 de 120 kV equipado con filamento LaB6 y cámara CCD TVIPS F416.

Para buscar la validación experimental del eje de tornillo doble en la interfaz de la subunidad, producimos mutantes de doble cisteína con una Cys localizada en la superficie en el extremo N- (R1: S10C o D21C) y C-terminal (R14: T342C), de modo que son yuxtapuestos y dentro de la distancia del enlace disulfuro (CsgA S10C/T342C), o se encuentran en lados opuestos de la interfaz (CsgA D21C/T342C) del eje del tornillo R15.5 (Fig. 8a complementaria). 100 ng de fibras producidas in vitro purificadas de WT CsgA, CsgA S10C/T342C y CsgA D21C/T342C, así como un único mutante de cisteína de CsgBCys en el extremo C-terminal (X00C, como control de marcado al 100 %), todo en potasio 50 mM fosfato pH 7,2, urea 8 M, tampón de imidazol 250 mM, se hicieron reaccionar (temperatura ambiente 1 h) en solución con maleimida IRDye680 para marcar los tioles libres. Las fibras se lavaron 2 veces en PBS antes de la aplicación (mediante filtración para retener las fibras) sobre una membrana de nitrocelulosa y se determinó la señal de fluorescencia de 680 nm (usando Licor Odyssey M). La eficiencia de marcaje se proporciona como señal de fluorescencia normalizada a la del mutante Cys único no oxidante CsgBCys.

Los conjuntos de datos crio-EM de alta resolución se recopilaron utilizando rejillas de carbono perforadas de malla de cobre Quantifoil™ R2/1 300 recubiertas con óxido de grafeno (GO). Para el recubrimiento GO, las rejillas se descargaron luminiscentes a una corriente de plasma de 5 mA durante 1 minuto en un descargador luminiscente ELMO (Agar Scientific). Se utilizó un émbolo criogénico Gatan CP3 ajustado a -176 °C y una humedad relativa del 90 % para preparar las muestras criogénicas. Se aplicó un total de 3 µL de solución de amiloide en la rejilla perforada y se incubó durante 30 s. La solución se secó por ambos lados con papel Whatman tipo 2 durante 3 s con una fuerza de transferencia de 0 y se congeló por inmersión en etano líquido preenfriado a -176 °C. Se grabaron películas micrográficas 2D crio-EM de alta resolución a 300 kV en un microscopio JEOL Cryoarm300 equipado con un filtro de energía Ω en columna (operado con un ancho de rendija de 20 eV) automatizado con SerialEM 3.0.850. Las películas se capturaron con un detector de electrones directo K3 en modo de conteo con una ampliación de 60k con un tamaño de píxel calibrado de 0,764 Å/pix y una exposición de 64,66 e/Å2 tomada en 61 fotogramas. En total, se recopilaron 3960 y 4455 películas dentro de un rango de desenfoque de 0,5 a 3,5 micrómetros para curli ex vivo y R15.5, respectivamente.

Todas las películas fraccionadas por dosis se corrigieron para el movimiento inducido por haz utilizando MOTIONCORR2 (Zheng et al., 2017) implementado en RELION 3.1 (Zivanov, Nakane y Scheres, 2020). La función de transferencia de contraste (CTF) de las imágenes con corrección de movimiento se calculó utilizando CTFFIND4 (Rohou & Grigorieff, 2015). Se empaquetaron manualmente 1000 filamentos usando e2helixboxer.py del paquete EMAN2 (Tang et al., 2007) y se usaron como un conjunto de datos de entrenamiento para SPHIRE-crYOLO. A continuación, se utilizó el modelo crYOLO para seleccionar automáticamente las coordenadas de los filamentos en todos los conjuntos de datos. Las partículas de filamento de tamaño de caja de 300 × 300 píxeles se extrajeron con una superposición del 10% en RELION. Después de la extracción, se obtuvieron 341691 y 1817890 partículas para curli ex vivo y R15.5 respectivamente. Para filtrar partículas no ideales, se ejecutaron varias rondas de clasificación 2D en RELION 4.0 con un valor T del parámetro de regularización de 10 y cada ejecución constaba de 50 iteraciones. Varias rondas de filtrado dieron como resultado conjuntos de datos de 41 806 y 243 391 partículas enriquecidas de curli ex vivo y R15.5 respectivamente. Ninguno de los promedios de clase 2D resultantes mostró signos de naturaleza helicoidal a juzgar por los picos de la transformada de Fourier de las imágenes de filamento. Para generar el volumen 3D, se ejecutaron tres rondas de clasificaciones 3D (Fig. 16 complementaria). Para la primera ejecución, se utilizó como modelo inicial un cilindro sin características de 4 nm. La clasificación 3D se realizó con la reconstrucción helicoidal habilitada (con un aumento del parámetro helicoidal = 72 Å y un giro = 180 grados), con el parámetro de regularización T y el número de clases establecidos en 25 y 3 respectivamente. Esto dio como resultado que el 73,5 % de las partículas se asignaran a la clase 1; por lo tanto, el volumen respectivo se filtró en paso bajo a 20 Å y se usó como modelo inicial para la segunda ronda de clasificación 3D con los mismos parámetros que la primera ronda. Eso condujo a tres clases 3D, que constaban de 66,6 %, 20,2 % y 13,7 % de partículas cada una, respectivamente. El volumen que representa el 66,6 % de las partículas se utilizó como modelo inicial para otra ronda de clasificación 3D con el parámetro de regularización T establecido en 50 pero sin la aplicación de ninguna simetría helicoidal. En este paso, los mapas resultantes presentaban una pila de hebras β separadas por una distancia de 4,7 Å cada una en las tres clases. De las clases 3D resultantes, la Clase 3 comprendía el grupo más grande con el 49,2 % de las partículas asignadas, sin embargo, el volumen resultante era más ruidoso y discontinuo en su cadena principal principal. Por el contrario, la clase 1 con 26,3 % de partículas tenía una conectividad de cadena principal significativamente mejor. Ninguna de las clases dio como resultado mapas con un potencial de electrones de cadena lateral bien definido. Luego, re-centramos y extrajimos 64138 partículas correspondientes a la clase 1 y usamos el volumen filtrado de paso bajo respectivo como modelo inicial para el refinamiento 3D. Aunque esto se realizó sin ningún error, el refinamiento 3D no mejoró mucho la calidad del mapa. Luego, el modelo predicho por AF2 de R15.5 se colocó manualmente en el mapa refinado y se sometió a un ajuste de cuerpo rígido en ChimeraX. Las estadísticas de mapas y modelos se encuentran en la Tabla complementaria 1.

Las imágenes de AFM de alta velocidad se realizaron en modo tapping utilizando un Nanowizard III AFM (JPK Instruments AG) equipado con un cabezal AFM de alta velocidad (versión JPK-00178-H-12-0021). Como sustrato para la toma de imágenes, utilizamos discos de moscovita de 10 mm (AFM mica disks V1 Agar Scientific) pegados con pegamento epoxi de dos componentes sobre un soporte de vidrio. Antes de cargar la muestra (R15.5 10 µM en MES 15 mM pH 6.0 y CaCl2 1 mM), la mica se cortó usando cinta adhesiva. Se utilizaron puntas de nitruro de silicio (DNP-S10) con un radio de punta nominal de 10 nm y una constante elástica de 0,06 N/m. El enfoque de la muestra se realizó en el aire para minimizar el retraso entre la inyección de CsgA y el inicio de la formación de imágenes. Para minimizar la fuerza aplicada a la muestra durante el escaneo y contrarrestar cualquier desviación en el sistema, el voltaje del punto de ajuste se ajustó continuamente al nivel más bajo para el cual se mantuvo el contacto entre la punta y la muestra.

Para sondear la cinética de agregación de R15.5, se siguió la intensidad de la señal de los espectros de RMN 1H 1D de monómeros R15.5 desplegados 100 µM a lo largo del tiempo (es decir, sondeando la concentración del monómero preamiloide), comenzando después de la desalinización fresca de 50 fosfato de potasio mM, imidazol 250 mM, urea 8 M, pH 7,5 a tampón de McIlvaine (tampón de citrato-fosfato) a diferentes pH (4,0 a 8,0). Los espectros 1D 1H se registraron cada 10 min durante la duración total de 10 h a 298 K en un espectrómetro Bruker Avance III HD 800 MHz, equipado con una criosonda TCI para mejorar la sensibilidad. La supresión de agua se logró mediante escultura de excitación de gradiente (secuencia de pulsos zgesgp). La muestra contenía 6% de D2O para la cerradura. Los datos de RMN se adquirieron, procesaron y analizaron en TopSpin 3.6 (Bruker).

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.

Las predicciones de AF2 discutidas en el texto principal de las Figs. 2 y 3 se suministran como datos complementarios a este trabajo. El modelo molecular para CsgA R15.5 se depositó en el banco de datos de proteínas con el código de acceso 8C50 [https://doi.org/10.2210/pdb8C50/pdb]. El volumen crio-EM refinado se depositó en la EMDB con el código de acceso EMD-16431. Los datos de origen se proporcionan con este documento. Los datos adicionales están disponibles de los autores correspondientes a pedido razonable. Los datos de origen se proporcionan con este documento.

van der Kant, R., Louros, N., Schymkowitz, J. & Rousseau, F. Un análisis estructural del polimorfismo amiloide en la enfermedad: ¿pistas para la vulnerabilidad selectiva? bioRxiv https://doi.org/10.1101/2021.03.01.433317 (2021).

Iadanza, MG, Jackson, MP, Hewitt, EW, Ranson, NA y Radford, SE Una nueva era para comprender las estructuras amiloides y las enfermedades. Nat. Rev Mol. Biol celular. 19, 755–773 (2018).

Artículo CAS PubMed Google Académico

Scheres, SH, Zhang, W., Falcon, B. & Goedert, M. Estructuras Cryo-EM de filamentos tau. actual Opinión Estructura. Biol. 64, 17–25 (2020).

Artículo CAS PubMed Google Académico

Lövestam, S. et al. Ensamblaje de tau recombinante en filamentos idénticos a los de la enfermedad de Alzheimer y la encefalopatía traumática crónica. bioRxiv https://doi.org/10.1101/2021.12.16.472950v1 (2021).

Cao, Q., Boyer, DR, Sawaya, MR, Ge, P. y Eisenberg, DS Estructuras crio-EM de cuatro núcleos de amiloide TDP-43 polimórficos. Nat. Estructura. mol. Biol. 26, 619–627 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Van Gerven, N., Van der Verren, SE, Reiter, DM y Remaut, H. El papel de los amiloides funcionales en la virulencia bacteriana. J. Mol. Biol. 430, 3657–3684 (2018).

Artículo PubMed PubMed Central Google Académico

Fowler, DM, Koulov, AV, Balch, WE y Kelly, JW Amiloide funcional: de bacterias a humanos. Tendencias Bioquímica. ciencia 32, 217–224 (2007).

Artículo CAS PubMed Google Académico

Romero, D. & Kolter, R. Amiloides funcionales en bacterias. En t. Microbiol. 17, 65–73 (2014).

CAS PubMed Google Académico

Dueholm, MS et al. Amiloide funcional en Pseudomonas. mol. Microbiol. 77, 1009–1020 (2010).

CAS PubMed Google Académico

Evans, ML y col. El sistema curli bacteriano posee un inhibidor potente y selectivo de la formación de amiloide. mol. Celda 57, 445–455 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Lundmark, K., Westermark, GT, Olsen, A. y Westermark, P. Las fibrillas de proteína en la naturaleza pueden aumentar la amiloidosis de la proteína A amiloide en ratones: la siembra cruzada como mecanismo de la enfermedad. proc. Academia Nacional. ciencia EE. UU. 102, 6098–6102 (2005).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Chen, SG et al. La exposición a la proteína amiloide bacteriana funcional curli mejora la agregación de alfa-sinucleína en ratas fischer 344 envejecidas y Caenorhabditis elegans. ciencia Rep. 6, 34477 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Friedland, RP & Chapman, MR El papel del amiloide microbiano en la neurodegeneración. Patog de PLoS. 13, e1006654 (2017).

Artículo PubMed PubMed Central Google Académico

Bücker, R. et al. Las estructuras Cryo-EM de dos fibrillas de amiloide cruzadas antimicrobianas β. bioRxiv https://doi.org/10.1101/2022.01.08.475498 (2022).

Hervás, R. et al. Estructura crio-EM de un amiloide funcional neuronal implicado en la persistencia de la memoria en Drosophila. Ciencia 367, 1230–1234 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Nguyen, PQ, Botyanszki, Z., Tay, PK y Joshi, NS Materiales programables basados ​​en biopelículas a partir de nanofibras curli diseñadas. Nat. común 5, 4945 (2014).

Artículo ADS CAS PubMed Google Scholar

Chen, AY et al. Síntesis y modelado de materiales multiescala sintonizables con celdas de ingeniería. Nat. Mate. 13, 515–523 (2014).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Hung, C. et al. Las biopelículas de Escherichia coli tienen una estructura de matriz extracelular organizada y compleja. mBio 4, e00645–00613 (2013).

Artículo PubMed PubMed Central Google Académico

Dueholm, MS, Albertsen, M., Otzen, D. y Nielsen, PH Los sistemas amiloides funcionales de Curli están filogenéticamente extendidos y muestran una gran diversidad en la estructura de operones y proteínas. PLoS ONE 7, e51274 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Chapman, MR et al. Papel de los operones curli de Escherichia coli en la dirección de la formación de fibra amiloide. Ciencia 295, 851–855 (2002).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Martillo, ND et al. Las unidades repetitivas C-terminales de CsgB dirigen la nucleación amiloide funcional bacteriana. J. Mol. Biol. 422, 376–389 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Nenninger, AA, Robinson, LS y Hultgren, SJ La nucleación de curli localizada y eficiente requiere la proteína de ensamblaje amiloide similar a una chaperona CsgF. proc. Academia Nacional. ciencia EE. UU. 106, 900–905 (2009).

Artículo ADS CAS PubMed PubMed Central Google Scholar

DeBenedictis, EP, Ma, D. & Keten, S. Predicciones estructurales para las subunidades CsgA y CsgB de la fibrilla amiloide curli. RSC Avanzado. 7, 48102–48112 (2017).

Artículo ADS CAS Google Académico

Shewmaker, F. et al. El amiloide curli funcional no se basa en una estructura de hoja beta paralela en el registro. J. Biol. química 284, 25065–25076 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Tian, ​​P. et al. Estructura de una subunidad de proteína amiloide funcional calculada usando variación de secuencia. Mermelada. química Soc. 137, 22–25 (2015).

Artículo CAS PubMed Google Académico

Bian, Z. & Normark, S. Función nucleadora de CsgB para el ensamblaje de orgánulos de superficie adhesiva en Escherichia coli. EMBO J. 16, 5827–5836 (1997).

Artículo CAS PubMed PubMed Central Google Scholar

Crooks, GE, Hon, G., Chandonia, JM y Brenner, SE WebLogo: un generador de secuencias de logotipos. Genoma Res. 14, 1188–1190 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Hennetin, J., Jullian, B., Steven, AC y Kajava, AV Conformaciones estándar de arcos beta en proteínas beta-solenoides. J. Mol. Biol. 358, 1094–1105 (2006).

Artículo CAS PubMed Google Académico

Yan, Z., Yin, M., Chen, J. & Li, X. Ensamblaje y reconocimiento de sustrato del sistema de biogénesis curli. Nat. común 11, 241 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Evans, R. et al. Predicción de complejos proteicos con AlphaFold-Multimer. bioRxiv https://doi.org/10.1101/2021.10.04.463034v1 (2021).

Jumper, J. et al. Predicción de estructura de proteínas de alta precisión con AlphaFold. Naturaleza 596, 583–589 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Mirdita, M., Ovchinnikov, S. & Steinegger, M. ColabFold - Hacer que el plegamiento de proteínas sea accesible para todos. bioRxiv https://doi.org/10.1101/2021.08.15.456425v1 (2021).

Williams, CJ et al. MolProbity: más y mejores datos de referencia para una mejor validación de la estructura de todos los átomos. Ciencia de las proteínas 27, 293–315 (2018).

Artículo CAS PubMed Google Académico

Sleutel, M. et al. Nucleación y crecimiento de un amiloide funcional bacteriano con una resolución de fibra única. Nat. química Biol. 13, 902–908 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Lyskov, S. & Gray, JJ El servidor RosettaDock para acoplamiento proteína-proteína local. Ácidos Nucleicos Res. 36, W233–W238 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Zhou, Y. et al. La siembra cruzada promiscua entre amiloides bacterianos promueve biopelículas entre especies. J. Biol. química 287, 35092–35103 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Zhou, Y., Smith, DR, Hufnagel, DA & Chapman, MR Manipulación experimental del amiloide funcional microbiano llamado curli. Métodos Mol. Biol. 966, 53–75 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Kimanius, D., Dong, L., Sharov, G., Nakane, T. y Scheres, SHW Nuevas herramientas para el análisis automatizado de partículas individuales crio-EM en RELION-4.0. Bioquímica J. 478, 4169–4185 (2021).

Artículo CAS PubMed Google Académico

Blanco, AP et al. Estructura y caracterización de AgfB de Salmonella enteritidis fimbrias agregadas delgadas. J. Mol. Biol. 311, 735–749 (2001).

Artículo CAS PubMed Google Académico

Teufel, F. et al. SignalP 6.0 predice los cinco tipos de péptidos señal utilizando modelos de lenguaje de proteínas. Nat. Biotecnología. 40, 1023–1025 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Guo, H.-B. et al. Los modelos AlphaFold2 indican que la secuencia de proteínas determina tanto la estructura como la dinámica. ciencia Rep. 12, 10696 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Van Gerven, N. et al. Secreción y exhibición funcional de proteínas de fusión a través de la ruta de biogénesis curli. mol. Microbiol. 91, 1022–1035 (2014).

Artículo PubMed Google Académico

Peng, Z., Peralta, MDR & Toney, MD Fibrillas de amiloide extraordinariamente estables diseñadas a partir de proteínas β-solenoides estructuralmente definidas. Bioquímica 56, 6041–6050 (2017).

Artículo CAS PubMed Google Académico

Peralta, MDR et al. Ingeniería de fibrillas de amiloide a partir de proteínas β-solenoides para aplicaciones de biomateriales. ACS Nano 9, 449–463 (2015).

Artículo CAS PubMed Google Académico

Holm, servidor L. Dali: unificación estructural de familias de proteínas. Ácidos Nucleicos Res. 50, W210–W215 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Dieltjens, L. et al. La inhibición de la cooperación bacteriana es una estrategia antibiopelícula evolutivamente robusta. Nat. común 11, 107 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Samson, TR et al. Un amiloide bacteriano intestinal promueve la agregación de alfa-sinucleína y el deterioro motor en ratones. Elife 9 https://doi.org/10.7554/eLife.53111 (2020).

Bhoite, SS, Han, Y., Ruotolo, BT & Chapman, MR Perspectivas mecanicistas sobre la agregación acelerada de alfa-sinucleína mediada por amiloides funcionales asociados al microbioma humano. J. Biol. química 298, 102088 (2022).

Artículo CAS PubMed PubMed Central Google Scholar

Eddy, SR Perfil modelos ocultos de Markov. Bioinformática 14, 755–763 (1998).

Artículo CAS PubMed Google Académico

Mastronarde, DN Tomografía de microscopio electrónico automatizado usando predicción robusta de movimientos de especímenes. J. Estructura. Biol. 152, 36–51 (2005).

Artículo PubMed Google Académico

Descargar referencias

Agradecemos a Marcus Fislage y Dirk Reiter en la instalación VIB-VUB para microscopía criogénica de bioelectrones (BECM) y por su asistencia en la recopilación de datos. Agradecemos a Jolyon Claridge por su asistencia en la extracción del genoma. Este trabajo fue financiado por VIB, EOS Excellence in Research Program by FWO a través de la subvención G0G0818N a HR y G043021N a MS

Biología Estructural Bruselas, Vrije Universiteit Brussel, Bruselas, Bélgica

Mike Sleutel, Brajabandhu Pradhan, Alexander N. Volkov y Han Remaut

Microbiología Estructural y Molecular, Centro VIB-VUB de Biología Estructural, Bruselas, Bélgica

Mike Sleutel, Brajabandhu Pradhan y Han Remaut

Centro de RMN Jean Jeaner, Bruselas, Bélgica

Alexander N Volkov

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

MS y HR diseñaron el proyecto y escribieron el manuscrito. ANV realizó 1D H RMN. MS, BP y HR contribuyeron a la congelación criogénica, las imágenes cryoEM y el procesamiento de datos.

Correspondencia a Mike Sleutel o Han Remaut.

Los autores declaran no tener intereses en competencia.

Nature Communications agradece a Hao-Bo Guo y a los otros revisores anónimos por su contribución a la revisión por pares de este trabajo. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Sleutel, M., Pradhan, B., Volkov, AN et al. Análisis estructural y principios arquitectónicos del curli amiloide bacteriano. Nat Comun 14, 2822 (2023). https://doi.org/10.1038/s41467-023-38204-2

Descargar cita

Recibido: 23 junio 2022

Aceptado: 20 de abril de 2023

Publicado: 17 mayo 2023

DOI: https://doi.org/10.1038/s41467-023-38204-2

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.