admin

Categorías

Coobis

Claude Shannon

La teoría matemática de la comunicación de Shannon aplicada al secuenciado de ADN

Actualidad Informática. Shannon y la secuenciación del ADN. Rafael Barzanallana

Nadie sabe qué tecnología de secuenciado es más rápida debido a que nunca ha habido una forma justa de comparar las tasas a las que se extrae información del ADN. Hasta ahora.

Uno de los grandes héroes desconocidos de la ciencia del siglo XX es Claude Shannon, ingeniero de los famosos Laboratorios Bell durante su auge en la mitad del siglo XX. La más perdurable contribución a la ciencia por parte de Shannon es su teoría de la información: la idea que apuntala toda la comunicación digital.

En un famoso artículo que data de finales de la década de 1940, Shannon fijó el problema fundamental de la comunicación: reproducir en un punto del espacio un mensaje que se había creado en otro punto. El mensaje se codificaba inicialmente de alguna manera, se transmitía, y luego se decodificaba.

Shannon demostró que un mensaje siempre puede reproducirse en otro punto del espacio con una precisión arbitraria siempre que el ruido esté por debajo de un nivel umbral. Pasó luego a calcular cuánta información podría enviarse de esta forma, una propiedad conocida como capacidad del canal de información.

Las ideas de Shannon se han aplicado ampliamente a todas las formas de transmisión de información con gran éxito. Una vía particularmente interesante ha sido la aplicación de la teoría de la información a la biología – la idea de que la propia vida es la transmisión de información de una generación a la siguiente.

Este tipo de pensamiento revolucionario está en proceso y aún en sus primeras etapas. Queda mucho por llegar.

Hoy revisamos un interesante corolario en el área de la transmisión de información biológica. Abolfazl Motahari y sus colegas de la Universidad de California en Berkeley, usan la aproximación de Shannon para examinar cómo de rápidamente puede extraerse la información del ADN usando el proceso del secuenciado de escopeta.

El problema aquí es determinar la secuencia de nucleótidos (A,G,C y T) en un genoma. Esto requiere tiempo debido a que los genomas tienden a ser largos – por ejemplo, el genoma humano consta de unos 3000 millones de nucleótidos o pares de bases. Secuenciar esta cantidad en serie llevaría una infinidad de tiempo.

La aproximación de escopeta implica cortar el genoma en trozos aleatorios, que constan de entre 100 y 1000 bases, y secuenciarlas en paralelo. La información se vuelve a pegar in silico mediante un algoritmo conocido como de re-ensamblado.

Por supuesto, no hay forma de saber cómo re-ensamblar la información procedente de una única ‘lectura’ del genoma. Por lo que en la aproximación de escopeta, este proceso se repite muchas veces. Dado que cada lectura divide el genoma de una forma distinta, los otros inevitablemente se solapan con segmentos de la ejecución anterior. Estas áreas de solapamiento hacen posible el re-ensamblado de todo el genoma, como un rompecabezas.

Esto tiene el aspecto del problema clásico de la teoría de la información y, efectivamente, distintas personas han pensado en ello de esta forma. Sin embargo, Motahari y compañía van un paso más allá cambiando su enunciado más o menos exactamente a un análogo de la famosa aproximación de Shannon.

Dicen que el problema del secuenciado del genoma es esencialmente la reproducción de un mensaje escrito en el ADN a un formato electrónico digital. Según esta forma de abordarlo, el mensaje original está en el ADN, se codifica para su transmisión mediante el proceso de lectura y luego se decodifica por el algoritmo de re-ensamblado para producir una versión electrónica.

Lo que demuestran es que hay una capacidad del canal que define una tasa máxima para el flujo de información durante el proceso de secuenciado. “Ofrece el número máximo de pares de bases de ADN que pueden resolverse en cada lectura, mediante cualquier algoritmo de ensamblaje, sin importar las limitaciones computacionales”, comentan.

Esto es un resultado significativo para cualquiera interesado en el secuenciado de genomas. Un tema importante es lo rápido que una tecnología concreta de secuenciado puede realizar esta tarea, y si es más rápida o lenta que otras aproximaciones.

Por el momento no es posible calcularlo debido a que muchos de los algoritmos usados para ensamblado están diseñados para tecnologías y aproximaciones específicas a la lectura. Motohari y sus colegas dicen que hay, al menos, 20 algoritmos distintos de re-ensamblado, por ejemplo. “Esto hace difícil comparar distintos algoritmos”, comentan.

Por consiguiente, nadie sabe realmente cuál es más rápido, o incluso cuál tiene el potencial de ser más rápido.

El nuevo trabajo cambia esto. Por primera vez debería ser posible calcular lo cerca que está una tecnología concreta de secuenciado del límite teórico.

Esto podría forzar una limpieza de la madera muerta en esta área y estimular un periodo de innovación rápida en la tecnología del secuenciado.


Artículo de Referencia: arxiv.org/abs/1203.6233: Information Theory of DNA Sequencing

Traducido en: Ciencia Kanija

Un vínculo no descubierto entre la percepción sensorial y la Teoría de la Información de Shannon

Las matemáticas que describen tanto la percepción sensorial como la transmisión de información, resultan tener similitudes notables.

En 1834, el fisiólogo alemán Ernst Weber llevó a cabo una serie de experimentos para determinar los límites de la percepción sensorial. Dio a un hombre con los ojos vendados una masa para que la sostuviera, y la fue incrementando gradualmente, preguntándole al sujeto cuándo había empezado a notar el cambio.

Estos experimentos demostraron que el menor incremento de peso que puede percibir un humano es proporcional al peso inicial. El psicólogo alemán Gustav Fechner más tarde interpretó el trabajo de Weber como una forma de medir la relación entre la magnitud física de un estímulo y su intensidad percibida.

El modelo matemático resultante de este proceso es conocido como la Ley de Weber-Fechner, y demuestra que la relación entre estímulo y percepción es logarítmica. (Para una derivación más simple, ver la Wikipedia). La Ley de Weber-Fechner es importante debido a que establece un nuevo campo de estudio llamado psicofísica.

La relación logarítmica entre un estímulo y su percepción aparece en varios ejemplos bien conocidos, como la escala logarítmica de decibelios para la intensidad del sonido, y una escala similar para medir el brillo de las estrellas, su magnitud.

Hoy, Haengjin Choe de la Universidad de Corea en Corea del Sur, dice que hay una interesante conexión entre la Ley de Weber-Fechner y la famosa teoría matemática de la información desarrollada por Claude Shannon en los Laboratorios Bell en la década de 1940.

El trabajo de Shannon está entre los más importantes del siglo XX. Establece los límites en la cantidad de información que puede enviarse desde una localización del universo a otra. No es una exageración decir que toda la infraestructura de comunicaciones y computación del mundo, están basadas en el trabajo de Shannon.

Choe señala que la ley desarrollada por Shannon que vincula la cantidad de información que puede transmitirse mediante un único símbolo, también es logarítmica. De hecho, toma exactamente la misma forma que la Ley de Weber-Fechner.

Lo que esto significa es que los fenómenos psicofísicos pueden tratarse matemáticamente de la misma forma que cualquier otro tipo de transmisión de información, por lo que se abre una nueva puerta a un nuevo y extenso conjunto de herramientas matemáticas que pueden proporcionar nuevas visiones sobre la naturaleza de la percepción.

Por supuesto, la idea de que la percepción sensorial es una forma de comunicación y, por tanto, obecede a las mismas reglas, no es completamente sorprendente. Lo que es asombroso, (de ser cierto) es que la conexión no se haya advertido antes.


Artículo de Referencia: arxiv.org/abs/1002.3909: Connection Between Shannon’s Information Theory And The Weber-Fechner Law

Fuente: Ciencia Kanija

_____________________

Enlaces relacionados:

–  Apuntes teoria de la informacion. Introducción a la Informática

–  Biografía de Claude Shannon

–   Límites en la compresión de la información

–  La prehistoria de la informática

–  Curso de Termodinámica Irreversible

Adivinar salud
Amarre
Carta astral
Consultas de salud
Consultas de trabajo
Consultas sobre amor
Exoterismo
hotel barato barcelona
Tarotista
Videntes

Related Posts with Thumbnails

Calendario

octubre 2021
L M X J V S D
« Nov    
 123
45678910
11121314151617
18192021222324
25262728293031

Spam

Otros enlaces

  • Enlaces

    Este blog no tiene ninguna relación con ellos, ni los recomienda.


  • Paperblog

    autobus las palmas aeropuerto cetona de frambuesa