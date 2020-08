Wetenschappers herschrijven genetica zodat Excel ze niet meer leest als datum Soms is het makkelijker om genetica te herschrijven, dan excel aan te passen ISA

Bron: The Verge 0 Wetenschap Tienduizend. Zoveel genen zijn er in het menselijk genoom: minuscule wendingen van DNA en RNA die samen alle kenmerken die elk van ons uniek maken, tot uiting brengen. Elk gen krijgt een naam en een alfanumerieke code, die wetenschappers gebruiken om het onderzoek te coördineren. Maar in het afgelopen jaar werden reeds 27 van die menselijke genen hernoemd, doordat Microsoft Excel hun codes foutief bleef interpreteren als datums.

Excel wordt regelmatig door wetenschappers gebruikt om hun werk op te volgen of zelfs om klinische proeven uit te voeren. Maar de standaardinstellingen zijn ontworpen met de meer alledaagse toepassingen in gedachten, waardoor een alfanumeriek symbool van een gen, zoals MARCH1 - kort voor “Membrane Associated Ring-CH-Type Finger 1" - in een spreadsheet door Excel wordt omgezet in een datum: 1-Mar.

Frustraties

Voor wetenschappers is het ontzettend frustrerend, en soms zelfs gevaarlijk om gegevens manueel te moeten doorzoeken en te herstellen. Volgens een studie uit 2016, waarin genetische gegevens in 3.597 gepubliceerde artikelen onderzocht werden, bleek dat ongeveer een vijfde van de gegevens beïnvloed was door Excel-fouten.

“Het is erg vervelend”, zegt Dezső Módos, systeembioloog bij het Quadram Instituut in het Verenigd Koninkrijk, aan technologiewebsite The Verge. Volgens Módos, die zich bezighoudt met het analyseren van geordende genetische gegevens, komen Excel-fouten continu voor omdat die software vaak het eerst gebruikt wordt door wetenschappers bij het verwerken van numerieke gegevens. “Het is een wijdverspreid hulpmiddel, en als je maar een beetje rekenkundig analfabeet bent, zal je het gebruiken”, zegt hij.

Het probleem valt ook niet makkelijk op te lossen. Excel biedt namelijk niet de mogelijkheid om deze automatische opmaak uit te schakelen. De enige manier om dit te voorkomen is door het datatype voor individuele kolommen te wijzigen, maar zelfs dan bestaat het risico op nieuwe fouten.

Oplossing

Gelukkig heeft de wetenschappelijke instantie HUGO Gene Nomenclature Committee (HGNC) een oplossing geboden. HGNC heeft deze week namelijk nieuwe richtlijnen gepubliceerd voor het benoemen van genen, onder andere voor “symbolen die van invloed zijn op de omgang met en het ophalen van gegevens”. Zo is bijvoorbeeld het symbool MARCH1 nu MARCHF1 geworden, SEPT1 is SEPTIN1 geworden, enzovoort. Een rapport van oude symbolen en namen wordt door HGNC bijgehouden om verwarring in de toekomst te voorkomen.

“Tot nu toe zijn in het afgelopen jaar de namen van zo’n 27 genen veranderd”, vertelt Elspeth Bruford, coördinator van HGNC, aan The Verge, “maar de richtlijnen zelf zijn pas deze week formeel bekend gemaakt”.

Praktisch

Met deze aanpassingen heeft het HGNC de focus gelegd op de meer praktische zaken: hoe minimaliseren we verwarring? Volgens de Gene Nomenclature Committee doen ze dat door de symbolen uniek te maken en door een gen een korte en specifieke naam te geven. Genen kunnen namelijk geen subscript of superscript gebruiken; een gen kan alleen Latijnse letters en Arabische cijfers bevatten; en het mag geen naam of woord spellen.

