Índice de Acrónimos y Siglas comunes en Bioquímica y Biología molecular

 

La Bioquímica y Biología molecular es una ciencia que ha crecido enormemente en los últimos 100 años. Como parte del descubrimiento de nuevas moléculas, proteínas, genes y procesos celulares y metabólicos ha habido que inventar nombres con los que denominar a todo ese nuevo mundo de objetos y conceptos. Agotados los nombres más directamente significativos, muchos nombre se han asignado basándose en características técnicas indirectas o basándose meramente en patrones de similitud estructural o de secuencia.

La extensión de nombres atribuidos de esa forma ha conducido al uso frecuente y abusivo de abreviaciones y siglas, que se convierten en el nombre más frecuente de la proteína o gen, olvidándose en muchos casos su significado original. Por ejemplo, un gen muy importante en el desarrollo de los vasos se denomina "tirosina quinasa con dominios de homología a la inmunoglobulina y al factor de crecimiento epidérmico" pero nadie la denomina así sino por sus siglas tie ( Tyrosine-kinase with Immunoglobulin and Epidermal growth factor homology domains).

El resultado de todo ello es que los nombres de los genes y proteínas pueden parecer ahora muy arbitrarios y misteriosos para el que entra en el campo por primera vez. Además el neófito se ve nadando en un mar de siglas y abreviaturas usadas por los expertos para hacer las conversaciones y textos más fluidos. Esa es la razón de ser de esta recopilación. Además de nombres de genes y proteínas se han añadido también abreviaturas y símbolos de metabolitos y procesos metabólicos o celulares de interés que suelen aparecer conjuntamente en la literatura de Bioquímica y Biología Molecular y también en la de Biología celular.

Los nombres de los genes y proteínas

Normas de la nomenclatura genética

 

Índice de abreviaturas y acrónimos

Por temas:

Biomoléculas y Metabolitos importantes

DNA: estructura, organización génica, replicación y reparación

Transcripción y regulación de la expresión génica

Procesamiento de RNA y Síntesis de proteínas

Regulación del ciclo celular y apoptosis

Transducción de señales

Neurotransmisores y Hormonas

 

Ordenado alfabéticamente:

[ A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z ]

 

Existe un proyecto Web, Medstract.org, que pretende aplicar los últimos avances en la lingüística computacional y análisis textual para automatizar la extracción de información de bases de datos como Medline. Su base de datos de acrónimos y siglas, denominada AcroMed contiene más de 480.000 entradas (44 GB de texto). AcroMed ofrece el nombre completo o ampliación de las siglas en inglés. No ofrece una traducción ni una descripción sucinta de la función del gen o la proteína. Sin embargo, ofrece vínculos a referencias de Medline donde se cita o utiliza la abreviatura en cuestión, lo que puede resultar más útil si se pretende utilizar profesionalmente.

 



 

Los nombres de los genes y proteínas

Tradicionalmente, la asignación de un nombre a cualquier cosa descubierta (sea un trozo de tierra, un objeto celeste o un invento) se ha reservado a su descubridor. El tipo de nombres escogidos ha variado a lo largo del tiempo en función de modas y disponibilidades. Los nombres intentan describir la función del gen o la proteína. Otras veces describen el aspecto de los organismos mutantes (muy común en la identificación de genes en levadura y Drosophila). Otras veces un gen o proteína se descubren en el curso de búsquedas masivas por analogía estructural o de secuencia, desconociéndose su función en ese momento. Así, se les dan nombres relativos a su estructura o el método de descubrimiento. Así las α-, β- y γ-globulinas se llaman así por su orden me migración en una electroforesis. Y las proteínas 14-3-3 recibieron ese nombre por el código de la fracción cromatográfica y electroforética en las que se purificaron originalmente en 1967, mucho antes de tener idea de para qué sirven.

Con el avance de las investigaciones y el descubrimiento de ingentes cantidades de proteínas y genes, los científicos se han ido quedando sin nombres "fáciles" e "intuitivos" al primer golpe de vista. Una vez secuenciado el genoma humano, se estima que contiene entre 20-30.000 genes. Actualmente les hemos dado nombres a unos 13.000 de ellos. Estos son muchos más de las palabras distintas que usa un adulto medio en una conversación normal. El número total de nombres que necesitamos se aproxima al número total de palabras distintas que conoce un adulto culto en toda su vida (se estima unas 40.000). El problema de los nombres de genes y proteínas no es por tanto una cuestión baladí.

Los investigadores trabajando en diferentes organismos han mantenido diferentes tradiciones para asignar nombres. Así, la tradición en genética bacteriana es poner nombres basados estrictamente en la función metabólica deficitaria (por ejemplo trp para genes relacionados con el metabolismo del triptófano). En estudios humanos se utilizan nombres muy pegados a los datos físicos (por ejemplo SLC26A3, solute carrier family 26, member 3). En cambio los investigadores de la levadura y, particularmente, la mosca Drosophila tradicionalmente han buscado nombres más imaginativos para sus mutantes. Así, unas levaduras que crecen con forma de campanilla son dbf (dumb-bell formers, formadores de campanillas), y unos mutantes de Drosophila que tienen más pelos de lo normal en la parte anterior de su cabeza tiene alterado el gen groucho (por el mostacho de Groucho Marx), mientras que ariadna es un gen que participa en el direccionamiento y su orientación de los axones de las neuronas durante su progresión por el laberinto que constituye el cerebro.

Además, le extensión de nombres atribuídos meramente por patrones de similitud estructural ha conducido al uso frecuente y abusivo de abreviaciones y siglas, que se convierten en el nombre más frecuente de la proteína, olvidándose en muchos casos su significado original. Por ejemplo, un gen muy importante en el desarrollo de los vasos se denomina "tirosina quinasa con dominios de homología a la inmunoglobulina y al factor de crecimiento epidérmico" pero nadie la denomina así sino por sus siglas tie ( Tyrosine-kinase with Immunoglobulin and Epidermal growth factor homology domains). El resultado de todo ello es que los nombres de los genes y proteínas pueden parecer ahora muy arbitrarios y misteriosos para el que entra en el campo por primera vez. Esa es la razón de ser de esta recopilación. Además de nombres de genes y proteínas se han añadido también abreviaturas y símbolos de metabolitos y procesos metabólicos o celulares de interés que suelen aparecer conjuntamente en la literatura de Bioquímica y Biología Molecular y también en la de Biología celular.

[volver al inicio]


 

Normas de la nomenclatura genética

Los genes son identificados usualmente por estudios genéticos, estudiando mutantes que presentan deficiencias en una función identificable: un fenotipo (que suele dar el nombre genérico al gen). Desgraciadamente las comunidades de científicos trabajando sobre diferentes organismos han desarrollado normas que difieren bastante en sus detalles, a la hora de definir nombres y símbolos para esos genes. No obstante, hay algunas reglas básicas de interpretación Aunque tienen excepciones en algunos organismos)

NOMBRES Y SÍMBOLOS: una cosa es el nombre del gen y otra su símbolo. Los nombres pueden ser palabras largas y hasta frases de varias palabras (aunque se recomienda que sean cortos y mnemotécnicos). Los símbolos son abreviaturas cortas formadas por letras y números. Típicamente constan de tres letras, pero en algunas comunidades se aceptan símbolos de sólo 2 (por ejemplo el gen hh, hedgehog en Drosophila) o de 4 o 5 letras (plaur, urokinase plasminogen activator receptor en ratón). No se suelen aceptar signos de puntuación, caracteres no alfabéticos o de otros alfabetos (griego), ni signos en superíndice o subíndice, como parte del nombre de un gen.

Se utilizan números para indicar los diferentes genes individuales asociados a un fenotipo, o pertenecientes a la mima familia del gen origina. Los números son siempre dígitos arábigos. Así, diferentes genes que afectan al ciclo de división celular en la levadura se denominan cdc1, cdc2 etc. En C. elegans es normal poner un guión y tenemos que los genes de las cadenas ligeras de la miosina son mlc-1, mlc-2 y mlc-3.
Constituye una excepción la nomenclatura bacteriana tradicional, que utiliza letras mayúsculas anexas para indicar los diferentes genes de un fenotipo.

GENES: los nombres de genes y sus símbolos se escriben siempre en cursiva y usualmente en minúsculas (aunque la regla para genes humanos especifica todo en mayúsculas).

FENOTIPOS: se escriben como el nombre o símbolo del gen, pero en redonda (no cursiva), y con la primera letra en mayúsculas. Los fenotipos pueden incluir superíndices para indicar la presencia/ausencia de alelos concretos (que tiene también normas específicas para referenciarlos).

PROTEÍNAS: En general, las proteínas se denominan con el mismo nombre o símbolo del gen, pero escrito en redonda y en mayúsculas. Las diferentes normas difieren en si se ha de escribir todo en mayúsculas (C. elegans, ratón) o apenas la primera letra (Drosophila, levadura).
Así, por ejemplo, el producto de expresión del gen sonic hedgehog puede denominarse proteína sonic hedgehog o bien proteína shh. Pero si nos referimos directamente a la proteína podremos escribir: Shh está unida covalentemente a colesterol.

En bioquímica es muy común referirse a una proteína por su peso molecular, anteponiendo una p para indicar “proteína”. Algunas de estas denominaciones se han hecho tan comunes que no existe otra. El caso más significativo es el del supresor de tumores p53. Se ha extendido también un uso no normalizado de esta regla, y así es frecuente ver cómo se antepone el prefijo “p” para referirse a una proteína por el nombre del gen (aunque las normas piden cambiar las mayúsculas, no usar prefijos): pRb (proteína retinoblastoma).

Una descripción mucho más detallada de todas las reglas y normas relativas a los nombres de genes, fenotipos, alelos, mutaciones, secuencias de DNA y RNA y los productos de expresión de la mismas puede obtenerse de lso respectivos comités de nomenclatura puestos en marcha por las comunidades de científicos trabajando en los varios organismos modelo: Levadura (ver también esta guía), la mosca Drosophila melanogaster, el gusano Caenorhabditis elegans, roedores (rata y ratón) y en el genoma humano.

[volver al inicio]


Enrique Castro & C. Manuel Ruiz de Galarreta Hernández, © 2000