viernes, 26 de agosto de 2016

Errores en Excel se trasladan a los papers científicos

Un número alarmante de documentos científicos que contengan errores de Excel
Por Christopher Ingraham -  Washington Post

(Jewel Samad / AFP / Getty Images)

Un número sorprendentemente alto de trabajos científicos en el campo de la genética contiene errores introducidos por Microsoft Excel, según un análisis publicado recientemente en la revista Genome Biology.

Un equipo de investigadores australianos analizaron cerca de 3.600 genética artículos publicados en varias revistas científicas - como Nature, Science y PLoS One. Como es práctica común en el campo, estos papeles todos vinieron con los archivos complementarios con las listas de genes utilizados en la investigación.

Los investigadores australianos descubrieron que aproximadamente 1 de cada 5 de estos documentos incluyen errores en sus listas de genes que se debían a Excel convertir automáticamente los nombres de genes a cosas como las fechas del calendario o números aleatorios.

Usted ve, los genes se refieren a menudo en la literatura científica por medio de símbolos - esencialmente versiones acortadas de los nombres de genes completos. El gen "Septin 2" típicamente se acorta como SEPT2. "Asociada a la membrana del anillo de dedo (C3HC4) 1, E3 ubiquitina ligasa proteína" se acorta a misericordiosamente marzo1.

Pero cuando se escribe estos nombres de genes acortados en Excel, el programa asume automáticamente que se refieren a las fechas - 2 de septiembre y el 1 de marzo, respectivamente. Si escribe SEPT2 en una celda de Excel por defecto, que mágicamente se convierte en "2-Sep." Se almacena en el programa como la fecha 09/02/2016.

Lo que es peor, no hay manera fácil de deshacer este formato automático una vez que ha ocurrido. Editar -> Deshacer simplemente borra todo el contenido de la celda. Usted puede tratar de convertir el formato de "General", el valor por defecto, en "Texto", que se podría esperar para cambiarlo de nuevo a los personajes originales que introduzca. Pero en su lugar, cambiar el formato de "texto" hace que los contenidos de las celdas aparecen como 42615 - código numérico interno de Excel en referencia a la fecha de 02/09/2016.



Aún más preocupante, los investigadores señalan que no hay manera de desactivar permanentemente el formato de fecha automático dentro de Excel. Los investigadores todavía tienen que acordarse de forma manual columnas de formato de "texto" antes de escribir cualquier cosa en nuevas hojas de Excel - cada. soltero. hora.

Pero incluso los investigadores en genética entre nosotros son sólo humanos, y a veces se olvidan de hacer esto. Por lo tanto, se termina con un 20 por ciento de estos papeles genética que contienen errores evitables introducidas por Excel.

Los investigadores australianos en cuenta que este problema fue identificado por primera vez en un artículo publicado hace más de una década. "Sin embargo, nos encontramos con que estos errores continúan a invadir los archivos suplementarios en la literatura científica", escriben.

La genética no es el único campo donde el trabajo de una vida potencialmente puede ser socavado por un error en las hojas. economistas de Harvard Carmen Reinhart y Kenneth Rogoff famoso hicieron un gazapo de Excel - omitiendo un par de filas de datos de un cálculo - que les hizo exageran drásticamente el impacto negativo del PIB cancelación de la deuda. Los investigadores en otros campos de vez en cuando tienen que emitir retracciones después de encontrar errores de Excel también.

Los investigadores australianos en cuenta que Excel no es el único programa de hoja de cálculo con el formato automático cuestiones excesivamente agresivos - los mismos errores surgen en los programas de código abierto como LibreOffice Calc y Apache OpenOffice Calc también.

Ellos notar, sin embargo, que un programa de hoja perfectamente libre no tuvo ningún problema que almacenan los nombres de genes como se ha escrito - Hojas de cálculo.

Por el momento, la única solución para el problema es que los investigadores y editores de revistas no bajar la guardia cuando se trabaja con sus archivos de datos. Aún mejor, podían abandonar Excel totalmente a favor de programas y lenguajes que se construyeron para la investigación estadística, como R y Python.