基於邏輯迴歸分類器的乳腺癌易感基因標誌物識別
隨着基因測序技術的發展,生物信息數據呈現爆炸式增長,如何從海量生物數據中挖掘出隱藏的生物模式和信息,成爲生物信息學領域的一個重要課題。癌症的發生通常是由於細胞增長機制的失常而引起的,表現爲細胞內某些基因突變或表達異常所致,進一步影響其他基因的表達,從而導致一些蛋白質分子的表達發生改變,因此產生了病理學上腫瘤的差異,形成了臨牀診斷中的不同的癌症類別。隨着20世紀90年代啓動的人類基因組計劃(Human Genome Project) 的順利進行,DNA微陣列技術的迅速發展給癌症的臨牀輔助診斷和治療帶來了新的希望,它在實驗中產生的基因表達數據可以使我們從基因水平對癌症病因進行分析和研究。但一次微陣列實驗會同時產生數以萬計的基因表達數據,對海量的基因表達數據進行分析和處理,從中提取有效的生物信息給人們的研究提出了新的挑戰。基因表達譜數據分析是生物信息學領域研究的最重要內容之一,作爲研究的一種重要的方法,正確的對不同病理分型的癌症進行分類,對癌症的臨牀診斷 和治療具有非常重要的意義。邏輯迴歸(LogisticRegression)理論的提出和發展,給高維的基因表達譜數據處理帶來了新的啓發,邏輯迴歸是當前機器學習算法比較常用的方法,可以用來回歸分析,也可以用來分類,主要是二分類問題。邏輯迴歸分類算法就是將線性迴歸應用在分類場景中,通過曲線擬合與sigmoid函數得到對樣本數據的分類標籤,在二分類問題中得到的分類結果爲0/1。
邏輯迴歸就是一個分類的算法,常見用在二分類當中,就是把我們的輸入值在線性迴歸中轉化爲預測值,然後映射到Sigmoid 函數中,講值作爲x軸的變量,y軸作爲一個概率,預測值對應的Y值越接近於1說明完全符合預測結果。但是擬合的越好,不代表效果就越好,有可能擬合過度。
經過反覆實驗,本文實現了對基因表達數據的分類,利用本文提出的邏輯迴歸算法最終對數據集分類都得到了很好的分類效果,分類準確率達到了 93.4%。
-
社會推廣普通話倡議書【新版多篇】
推廣普通話倡議書篇一親愛的家長們:20xx年9月8日---9月14日第19屆全國推普周,今年推普周的主題是:“大力推行和規範使用國家通用語言文字,助力全面建成小康社會。”。說普通話、用規範字是國家對每位公民的要求,是建設現代化社會的需要。爲了響應國家教育部的號召,營...
-
關於疫情工地停工通知(多篇)
關於疫情工地停工通知篇一疫情在世界範圍內蔓延迅速,威力強勁,世界着重於中國疫情預防管理的成功經驗,認爲中國採取最勇敢、最靈活、最積極的嚴格預防管理措施,有效抑制疫情,爲世界公共衛生事業做出重要貢獻。中國戰疫的速度、決心和力量是世界的榜樣,必須學習中國的...
-
財務總監崗位說明書精品多篇
財務總監崗位說明書篇一1組織領導公司的財務管理、成本管理、預算管理、會計覈算、會計監督、審計監察、存貨控制等方面工作,加強公司經濟管理,提高經濟效益。2組織執行國家有關財經法律、法規、方針、政策和制度,保障公司合法經營,維護股東權益。3參與公司投資行...
-
2024各省市中國小寒假放假及開學時間表精品多篇
寒假個人學習計劃篇一1、理規劃空餘時間,制定學習計劃放假後第一件事,應該是整理出可利用空餘時間,做出空餘時間安排,以每一天爲單位;接下來,梳理自身學習情況,找出最需要提高或最薄弱課節,合理分配複習和預習空餘時間,有針對性地制定假期學習計劃。2、確定學習目標,攻克...