前言:想要寫出一篇引人入勝的文章?我們特意為您整理了科技期刊的常見名詞用法錯誤探析范文,希望能給你帶來靈感和參考,敬請閱讀。
引言
生物信息學(xué)是近年來發(fā)展起來的一門新興學(xué)科,科技期刊中有關(guān)生物信息學(xué)方面的文章越來越多,但科技期刊的很多編輯對生物信息學(xué)方面的知識了解有限,在尚無規(guī)范和標(biāo)準(zhǔn)可參考的情況下,只能原稿來什么樣就發(fā)什么樣,經(jīng)常會出現(xiàn)一些關(guān)聯(lián)名詞描述方面的錯誤,因此,對生物信息學(xué)中一些關(guān)聯(lián)名詞用法進行研究具有重要的意義。目前,在生物信息學(xué)編輯方面僅見蔣元霖[1]、劉華[2]、張翠英[3]、張冰[4]等關(guān)于科技期刊中基因及蛋白質(zhì)符號的規(guī)范表達,宋亞珍等[5]關(guān)于同源性、一致性、相似性概念辨析等研究,有關(guān)生物信息學(xué)中更多名詞的用法及其準(zhǔn)確表述的研究尚未見報道。而科技期刊中有關(guān)基因的克隆與表達以及蛋白質(zhì)的提取、分離、純化和功能等方面研究的文章越來越多,筆者根據(jù)對此類文章的編輯實踐以及對部分科技期刊此類文章的閱讀,發(fā)現(xiàn)一些既有關(guān)聯(lián)又有區(qū)別的名詞,如基因與蛋白質(zhì),核苷酸序列與氨基酸序列,同源性與親緣關(guān)系等的使用及其表述不少有誤甚85至存在歧義,為此,本研究對這些高使用頻率關(guān)聯(lián)名詞的用法錯誤進行了分析,旨在為同人提供參考。
一基因和蛋白質(zhì)名詞用法錯誤辨析
基因和蛋白質(zhì)是最常見的兩個名詞,雖然是兩個不同的概念,但又緊密關(guān)聯(lián)。基因是一段有遺傳效應(yīng)的脫氧核糖核苷酸序列(DNA),基因的基本結(jié)構(gòu)單位是脫氧核苷酸;DNA要通過RNA的轉(zhuǎn)錄(mRNA)和翻譯(tRNA)才能產(chǎn)生蛋白質(zhì),即基因編碼蛋白質(zhì),蛋白質(zhì)的基本結(jié)構(gòu)單位是氨基酸[6-8]。生物信息學(xué)稿件中常見的錯誤有:1.基因與蛋白質(zhì)混淆例1.本研究通過PCR技術(shù)對RcTIR1基因進行了克隆,生物信息學(xué)分析顯示其含有富含亮氨酸重復(fù)序列的結(jié)構(gòu)域,并通過多序列比對顯示該基因與小立碗蘚的生長素受體蛋白TIR1相似度達76%,初步認(rèn)為該基因為生長素受體蛋白TIR1。例1中,存在多個錯誤:(1)“其含有富含亮氨酸”中的“其”指基因,而基因是不含有氨基酸的,應(yīng)將“其”改為蛋白質(zhì);(2)“多序列比對顯示該基因”中的“該基因”是不能與蛋白質(zhì)直接比較的,應(yīng)將“該基因”改為蛋白質(zhì);(3)“相似度76%”指的是氨基酸序列之間的同源性比對,數(shù)值結(jié)果應(yīng)描述為一致性,應(yīng)將“相似度76%”改為“一致性76%”;(4)“初步認(rèn)為該基因為生長素受體蛋白TIR1”有邏輯錯誤,即“基因”是“蛋白質(zhì)”。因此,本例應(yīng)改為:“本研究通過PCR技術(shù)對RcTIR1基因進行了克隆,生物信息學(xué)分析顯示該基因編碼的蛋白質(zhì)含有富含亮氨酸重復(fù)序列的結(jié)構(gòu)域,并通過多序列比對顯示該基因編碼的蛋白質(zhì)與小立碗蘚的生長素受體蛋白TIR1一致性達76%,初步認(rèn)為該基因編碼的蛋白質(zhì)為生長素受體蛋白TIR1?!?.標(biāo)題或圖題中基因、蛋白質(zhì)的描述與研究內(nèi)容不一致例2.Fesod的生物信息學(xué)分析;Fesod生物信息學(xué)分析例3.Actin系統(tǒng)進化樹分析;Actin系統(tǒng)進化樹分析例2、例3均為常見的二級標(biāo)題或圖題,其中每個例子的第一句都是表述基因?qū)用娴膬?nèi)容,第二句都是表述蛋白質(zhì)層面的內(nèi)容,表面看上去都沒有錯誤,但在文中標(biāo)題或圖題中基因、蛋白質(zhì)的表述與研究內(nèi)容經(jīng)常不一致。如生物信息學(xué)分析中,如果是通過軟件對克隆的基因片段推導(dǎo)的蛋白質(zhì)的分子量、等電點、信號肽、跨膜區(qū)、二級結(jié)構(gòu)等進行預(yù)測,標(biāo)題或圖題應(yīng)表述為蛋白質(zhì)的生物信息學(xué)分析;如果是對克隆的基因序列及其結(jié)構(gòu)等進行的分析,標(biāo)題或圖題應(yīng)表述為基因的生物信息學(xué)分析。再如系統(tǒng)進化分析中,如果是基于基因序列(核苷酸序列)構(gòu)建的系統(tǒng)進化樹,標(biāo)題或圖題應(yīng)表述為基因系統(tǒng)進化分析;如果是基于蛋白質(zhì)序列(氨基酸序列)構(gòu)建的系統(tǒng)進化樹,標(biāo)題或圖題應(yīng)表述為蛋白質(zhì)系統(tǒng)進化分析。
筆者隨機對2015和2016年30多種科技期刊中基因符號的斜體表達情況進行調(diào)查,結(jié)果還是有10%左右的期刊未用斜體字母表示基因符號,即使用斜體字母表示基因符號的期刊,存在的問題也很多,如對一些基因與蛋白質(zhì)未能準(zhǔn)確區(qū)分,導(dǎo)致基因符號和蛋白質(zhì)符號表達存在諸多問題。生物信息學(xué)稿件中常見的錯誤有:1.引物名稱、重組質(zhì)粒中的基因符號等未用斜體例4.設(shè)計了IGFBP-2基因的1對簡并引物IGFBP-2F和IGFBP-2R例5.刺參凝集素基因AJL與原核表達載體pET-32a(+)的重組質(zhì)粒pET-32a(+)-AJL例4中,引物名稱是以基因命名的,基因“IG-FBP-2”應(yīng)為斜體,即改為“簡并引物IGFBP-2F和IGFBP-2R”;例5中,重組質(zhì)粒是指將酶切的基因片段和表達載體通過酶連接并轉(zhuǎn)化至大腸桿菌細(xì)胞(或其他細(xì)胞)中得到的重組體,因此,本例中基因“AJL”應(yīng)為斜體,即改為“重組質(zhì)粒pET-32a(+)-AJL”。2.蛋白質(zhì)符號未用正體或未大寫例6.用鄰接法構(gòu)建的基于nm23氨基酸序列的系統(tǒng)進化樹例6中,“nm23”表示的是蛋白質(zhì),而字母全為小寫,說明蛋白質(zhì)符號用法錯誤,可以找作者確定此蛋白質(zhì)的準(zhǔn)確符號,是首字母大寫還是所有字母全大寫,也可以將“nm23氨基酸序列”直接改為“nm23基因推導(dǎo)的氨基酸序列”。目前,基因和蛋白質(zhì)的命名及符號在不同物種間沒有統(tǒng)一的規(guī)則[9],根據(jù)《TIG遺傳命名指南》[10]有關(guān)細(xì)菌、原生動物、酵母、絲狀真菌、植物、無脊椎動物、脊椎動物中一些典型生物模式的命名規(guī)則與書寫原則,生物基因符號的組成歸納起來一般有以下幾種:全小寫斜體字母,全大寫斜體字母,斜體的小寫字母+大寫字母(有首字母大寫,有最后一個字母大寫),斜體字母+數(shù)字等。但蛋白質(zhì)符號的定義基本相同,一般用相同的基因符號命名蛋白質(zhì),不用斜體,但要大寫(或首字母大寫)。這表明,基因與蛋白質(zhì)符號的正斜體表達目前已有統(tǒng)一規(guī)定,只要作者使用的生物基因和蛋白質(zhì)符號命名準(zhǔn)確,再加以正斜體,即可用字母符號準(zhǔn)確表達基因和蛋白質(zhì),即使“基因”和“蛋白質(zhì)”兩詞省略,也能分清描述的是基因還是蛋白質(zhì)。
三核苷酸序列與氨基酸序列用法錯誤辨析
生物信息學(xué)稿件中,經(jīng)常出現(xiàn)因核苷酸序列與氨基酸序列混淆而發(fā)生的表述錯誤?;蛐蛄芯褪侵负塑账嵝蛄校蚍Q基因核苷酸序列;而蛋白質(zhì)序列就是指氨基酸序列,或稱蛋白質(zhì)氨基酸序列。核苷酸序列和氨基酸序列最簡單的區(qū)分方法就是,核苷酸序列中僅含A、T、C、G4個字母,而氨基酸序列中還有其他字母。作為編輯,有時雖然不知道稿件作者具體是基于什么序列進行的分析,但可從一篇文章中對此類問題的前后描述以及圖表來準(zhǔn)確區(qū)分和表述這兩種序列。生物信息學(xué)稿件中常見的錯誤有:1.基因序列與氨基酸序列混淆例7.茶尺蠖EoL2與其他昆蟲脂肪酶氨基酸序列進化樹分析例8.Pm-MMP-17與其他物種的進化分析(標(biāo)題);Pm-MMP-17蛋白質(zhì)聚類分析(圖題)例7中,“EoL2”是指脂肪酶基因,顯然基因序列(核苷酸序列)是不能與“其他昆蟲脂肪酶氨基酸序列”一起構(gòu)建系統(tǒng)進化樹的,因此,應(yīng)將“茶尺蠖EoL2”改為“茶尺蠖EoL2氨基酸序列”;例8中前后兩句是同一篇文章的一個二級標(biāo)題和一個圖題,描述的是同一個內(nèi)容,顯然前一句描述的是基于基因序列的物種進化分析,而后一句描述的是基于蛋白質(zhì)序列的物種進化分析,前后不一致,實際上,根據(jù)原文內(nèi)容后一句描述是正確的,因此,可將例8中前一句改為“Pm-MMP-17氨基酸序列與其他物種的進化分析”。2.蛋白質(zhì)與核苷酸序列、基因與氨基酸序列錯誤搭配例9.劍尾魚Cu/Zn-SOD核苷酸及氨基酸序列相似性與其他已知魚類的比對例10.豬、人、牛、綿羊和小鼠PDGFRα基因氨基酸多重序列比對結(jié)果例9中,據(jù)原文正體符號Cu/Zn-SOD代表蛋白質(zhì),蛋白質(zhì)不能直接搭配核苷酸序列,應(yīng)將蛋白質(zhì)改為基因,即改為“劍尾魚Cu/Zn-SOD核苷酸序列及其推導(dǎo)的氨基酸序列”;例10中,基因不能直接搭配氨基酸序列,應(yīng)將基因改為蛋白質(zhì),即改為“PDGFRα蛋白質(zhì)氨基酸多重序列”。
四同源性與系統(tǒng)進化分析
結(jié)果描述錯誤辨析同源性分析與系統(tǒng)進化分析都是用于判斷同源基因或同源蛋白質(zhì)而進行的不同層面的分析,同源性分析進行的是基因序列或蛋白質(zhì)序列的比對,其結(jié)果一般用一致性、相似度、同源序列等描述;而系統(tǒng)進化樹的構(gòu)建是基于同源基因序列或是同源蛋白質(zhì)序列,其結(jié)果一般用是否聚在一個分支和親緣關(guān)系遠(yuǎn)近等描述。生物信息學(xué)稿件中常見的錯誤有:1.同源性分析結(jié)果用物種的親緣關(guān)系遠(yuǎn)近描述例11.EoL2編碼的蛋白與其它昆蟲脂肪酶蛋白序列比較分析的結(jié)果表明,EoL2序列與家蠶BmL1序列相似度最高,為57%,親緣關(guān)系較近,其次為黑脈金斑蝶Danausplexippus(Linnaeus)DpL1為55%,與棉鈴蟲HaL、家蠶BmL、黑脈金斑蝶DpL2序列一致性均為44%……例11中,有多個錯誤描述:(1)本例中描述的是同源性分析結(jié)果,不能用“親緣關(guān)系較近”來描述,應(yīng)將“親緣關(guān)系較近”刪除;(2)“BmL1序列相似度最高,為57%”中顯然指相似度為57%,一般情況下,根據(jù)序列比對軟件得出的結(jié)果中只有“I-dentity”(一致性)值,沒有“Similarity”(相似度)值,因此,序列比對分析中,數(shù)值的多少要用一致性描述,序列的相似程度即相似度要用高低來描述,本例中應(yīng)將“57%”改為“序列一致性為57%”,“為55%”改為“序列一致性為55%”。2.系統(tǒng)進化分析結(jié)果用同源性描述例12.將ScMT2-1-4推導(dǎo)的氨基酸序列進行了Blastp同源搜索,選取不同植物的MT2蛋白序列與ScMT2-1-4構(gòu)建系統(tǒng)進化樹,結(jié)果表明,ScMT2-1-4基因編碼蛋白與已報道的甘蔗ScMT2-1-3基因(登錄號:KJ504375)和甘蔗ScMT2-1-2基因(登錄號:AAV50043)編碼蛋白同源性最高,其次是高粱MT2(登錄號:XP0024551970)和玉米MT2-1(登錄號:NP001150795)。例12中,描述的是系統(tǒng)進化分析結(jié)果,不能用同源性高低描述,應(yīng)將“同源性最高”改為“親緣關(guān)系最近”。
五結(jié)語
科技期刊來稿中,有很多作者對基因、蛋白質(zhì)、核苷酸、氨基酸、序列等名詞及其組合的表述比較混亂,甚至?xí)霈F(xiàn)歧義,編輯應(yīng)根據(jù)文中的實際情況,將這些名詞準(zhǔn)確加以區(qū)分,正確表述。