陳舒,陳若寒
(福建警察學院 計算機與信息安全管理系,福建 福州 350007)
摘要:腫瘤癌變細胞FISH圖像分析系統中,需要解決粘連細胞核的分割問題。FISH屬于新興技術,產生的是特殊的熒光彩色細胞圖,現有細胞圖像分析方法并不適用。文章創新設計了基于深度凹陷檢測和構造自然凹陷力的方法,分離粘連細胞核。首先,針對參差不齊的實驗成像,在RGB模型下結合統計思想,將圖像分為三類,分別進行預處理。繼而,利用融合了Kmeans聚類算法的改進馬爾科夫隨機場(MRF)方法,將細胞核與癌變信號點進行有效提取。在此基礎上,利用幾何原理,創新設計了一套粘連細胞核分離算法。最后,給出細胞核快速計數和信號點提取方法。該系統設計基本完整,并達到預期效果。
關鍵詞:FISH圖像;細胞核提取;MRF模型;細胞核粘連;自然凹陷力
中圖分類號:R857.3;TP391文獻標識碼:ADOI: 10.19358/j.issn.1674-7720.2017.01.015
引用格式:陳舒,陳若寒. 腫瘤癌變細胞FISH圖像分析系統的研究[J].微型機與應用,2017,36(1):48-51,55.
0引言
較多研究表明,癌變細胞中都存在HER2蛋白的過表達或基因擴增現象。當前的檢測技術有很多種,其中的FISH技術雖是一項新興技術但已經被公認為業界的“黃金標準”[12]。
經過FISH技術處理后產生的腫瘤癌變細胞圖像中,包含三個主要成分:背景(黑色)、細胞核(藍色)、信號點(紅色和綠色)。通過統計、分析細胞核與信號點的個數,就可以實現對HER2蛋白擴增現象的檢測。
1預處理
FISH圖像中,具有研究價值的區域恰好與RGB顏色模型的三個通道相吻合,不需要進行復雜的映射或者換算,所以選用RGB模型來進行設計。通過批量觀察以及相應資料的查閱,FISH技術呈現的細胞核大致具有3個特點:邊緣模糊(熒光強度不同)、核外輪廓各異(探針手工著色)、核內結構復雜(孔洞),需要進行預處理使得圖像呈現最佳效果,從而簡化算法。
1.1FISH圖像分類
首先,根據成像的熒光效果,將圖像分為三類:(1)弱熒光信號圖;(2)暈染嚴重信號圖;(3)理想信號圖。分別如圖1(a)、(b)、(c)所示。在專家指導下進行手工分類作為訓練樣本,得出圖像在藍色通道上的分布規律,借助統計學原理,進行自動分類。
1.2非理想圖片的改善
需要對弱熒光圖進行增強,對暈染現象進行去除。
1.2.1弱熒光圖自適應增強
(1)原圖像進行疊加,I=1.5×I(這步操作的實質是對亮度進行疊加);
(2)重新判斷是否為弱熒光,如果是,則重新轉入步驟(1),否則停止。實驗效果如圖2所示。
1.2.2暈染現象的自動去除
(1)將判別為“暈染嚴重”的原始圖像轉化為藍色亮度圖;
(2)運用Otsu法進行閾值分割,目標標記為1(白),背景標注為0(黑);
(3)填補小于閾值Pc個像素點的連通區域(孔洞);
(4)去除小于閾值Pc個像素點的連通區域(非細胞核區域);
(5)將標記為目標的區域恢復成RGB圖,其他部分保持黑色背景;
(6)重新判斷是否暈染嚴重,如果是,則重新轉入步驟(2),否則停止。實驗效果如圖3。
其中Pc默認為原圖總像素點的4%,這個百分比是根據多次實驗效果得出的經驗值,表示該圖片中的細小孔洞,可以自適應各種尺寸的原始圖像。
2FISH圖像細胞核的提取
2.1傳統方法
對細胞核提取的常用方法主要依據四類原理,分別是:閾值分割、邊緣檢測、傳統區域思想以及基于特殊算法的理論[34]。
閾值分割雖然快速簡便、不需要先驗知識,卻沒有考慮與鄰域像素點之間的關聯性,分割較為粗糙,容易發生誤判;邊緣檢測雖然是基于各個像素點與其鄰域的差異,但是細胞核內熒光信號產生了大量的梯度變化,給真實邊緣的檢測增加了困難;傳統區域思想需要先驗知識并對圖像有一定要求,且不考慮空間信息,容易造成過分割;而基于特殊算法的理論,則因為其特定的應用條件、復雜的參數或對圖像計算量的要求等,在FISH圖像的細胞核提取中并不適用。
2.2本文方法
綜合以上算法的優缺點,本文考慮到像素點間的關聯,選取馬爾科夫隨機場(MRF)[57]與無監督的聚類算法相結合來進行圖像分割,提取FISH圖像的細胞核。
從算法計算量和精度的角度考慮,在MRF建模中,選用二階8鄰域系統的Potts模型作為標記場模型,有限高斯混合模型(FGMM)建立觀測場,迭代條件模式(ICM)作為最優化分割算法,其中Potts模型中的勢函數β改進為可變勢函數βb。
2.2.1可變勢函數
勢函數β的大小對分割結果影響很大。以圖4a為例進行分割,選取其中β=0.5和β=5的情況,分割結果如圖4(b)和圖4(c)。
顯然,當勢函數β增大時,標記場就越占主導,區域性就越好,分割結果細節也就越差;當勢函數β變小時,標記場的影響就弱了,觀測場占的比重變大,分割結果細節信息豐富,區域性差。由此引入可變勢函數βb,符合“前期著重在區域性的控制,后期集中在細節信息的判斷”的規律,勢函數應該是逐漸變小的。
綜上所述,設計可變勢函數如下:
令初始勢函數β=1,總迭代次數限制為maxIter,當前迭代次數為Iter,則當Iter<maxIter時,構造可變勢函數βb,表達式為:
上式保證在迭代次數Iter增加時,勢函數βb是緩慢變小的,并且不會偏離最初由經驗確定的β值太多。
2.2.2FISH圖像細胞核的提取具體步驟
(1)將原始圖像轉化為藍色亮度圖;
(2)設定實驗圖像分類數K=2,初始勢函數β=1,最大迭代次數maxIter=10;
(3)應用Kmeans聚類算法得到初始分割;
(4)估計觀測場參數μ和σ2;
(5)計算FGMM模型建立的觀測場能量;
(6)計算Potts模型建立的標記場能量;
(7)根據能量最小原則,估計新的分割;
(8)判斷是否滿足迭代終止條件(MAP準則和最大迭代次數),滿足則算法停止,得到最佳分割,否則更新勢函數βb的值,并重新轉入步驟(3)。
2.2.3實驗效果
分別用Otsu自動閾值法、傳統的Kmeans聚類算法以及本文算法對FISH細胞圖像進行分割,效果如圖5所示。可以看出,本文算法比前兩種產生的分割結果更加連續,且錯判產生的孔洞現象更少。這說明:融合了MRF模型的Kmeans聚類分割方法,在兼顧了區域完整性的同時較好地保有了細節信息。而引入可變的勢函數βb的優勢,在前文已有分析。在判定為細胞核的一些區域內,仍然存在一些細小的孔洞,用前文處理暈染圖片時使用的方法修復,效果如圖6所示。
3粘連細胞核的分離
對粘連細胞核分離的常用方法主要依據三類原理,分別是:基于數學形態學、基于形狀特征以及特定理論的方法。
3.1傳統方法
當目標粘連緊密時,應用基于數學形態學的方法通常得不到理想的種子點個數。
基于形狀特征原理,主要是采用尋找凹點進而分離的方法。將細胞核的粘連方式分為串聯和并聯兩類,根據每個區域凹點奇偶性或者其他準則,來判斷屬于哪一類粘連。然后運用不同的凹點匹配策略,進行凹點連線劃分。但大部分的方法并沒有考慮更加復雜的串并聯混合情況,FISH細胞核恰屬于復雜粘連情況,同時,FISH細胞核邊緣不規則,容易出現“假凹點”。
基于特定理論的方法中,比較適合FISH圖像復雜結構的是文獻[8]中提出的基于水平集和隨機霍夫圓檢驗方法來分離原生質細胞核。但該算法融入了水平集算法,需要設定的參數非常多,隨著粘連細胞核個數的增加和粘連情況的復雜,相應的參數也更加難以全面設置,并且需要用到統計學的霍夫投票法決定區域的分割歸屬問題,計算量較大,影響了總體分析效率,故不采用。此外,其他文獻中基于主動輪廓模型[910]和圖論[1112]等方法的改進,都因計算量比較大,不予采用。
3.2本文方法
在Harris和Susan算法的基礎上,改進設計出“深度凹陷點”的檢測方法,尋找因粘連造成的真正凹陷,同時判斷出粘連現象的存在與否。接著,創新引入“自然凹陷力”的概念,令深度凹陷點的凹陷有規律有方向地加深,并逐漸產生區域斷裂,最終實現粘連的分離。
3.2.1深度凹陷點檢測
本文將角點分為以下4種點情況:鈍角凸點、銳角凸點、輕微凹陷點、深度凹陷點。本文定義的深度凹陷點必須滿足以下條件:以該角點作為圓形模板的中心,角點的兩條線段在目標區域內構成的夾角必須大于225°。
本文設計的深度凹陷檢測方法:
(1)設FISH細胞核二值圖I中,目標(細胞核區域)標記為1,背景標記為0,同時構造半徑R=5的圓形模板M,模板內標記為1的像素點總個數為MMAX;
(2)利用Harris角點檢測算法對I進行掃描,得到一個角點集合J(j1,j2,...,jn);
(3)將圓形模板M的中心與J(j1,j2,...,jn)逐點重合;
(4)借鑒Susan算法的思想,得到每一個角點位置上的USAN值MUSAN;
(5)當MUSAN>5/8×MMAX時,該角點判定為深度凹陷點,存入集合H中,用于下一階段運算。
3.2.2粘連判斷
當某個目標連通區域內存在深度凹陷點時,該區域存在粘連現象,需要實現細胞分離,否則是獨立細胞核。
3.2.3自然凹陷力
設想:在現實世界中,要讓這些粘連的細胞核產生分離,可以對每一個深度凹陷處施加作用力,要求該作用力的大小一致,方向順應每個凹陷處的凹陷方向,這樣在凹陷處就會不斷地加深凹陷程度,粘連的細胞核們也會逐漸被擠壓得分離開。當某幾處作用力匯集到一點時,該局部的粘連區域就被分離;當圖像中所有深度凹陷處施加的作用力都匯集到某一處時,則粘連部分被完全分離。
為了滿足實時性的需求,本文采用純幾何的線性思想來模擬自然凹陷力的作用,如圖7所示。
本文設計的自然凹陷力具體作用過程為:
(1)取深度凹陷點集合H(H1,H2,...,Hn);
(2)定位至其中一點Hi(i=1,2...,n),以該點為圓心、R=8(多次實驗的經驗值)為半徑構造一個圓,設該圓交Hi兩條邊的交點分別為J1和J2;
(3)作線段J1J2的中垂線(圖中HiHi′→所指的方向即為凹陷方向),在目標內交圓于Hi′點,將凹點Hi移動至Hi′,則該凹陷局部區域的邊界,由原先的弧J1Hi⌒和弧HiJ2⌒,變為由線段J1Hi′和線段Hi′J2 構成,實現該區域凹陷程度的加深;
(4)逐個定位至H中的其他點,重復步驟(2)和(3),遍歷一輪后,將產生的集合H′作為新的凹陷點集合H,完成一輪自然凹陷力作用;
(5)定位至更新過的Hi點,重復步驟(2)~(4),直至新產生的Hi′不再在目標內時,停止Hi點的繼續凹陷,跳至H中的其他點繼續操作,直至所有的H′都在背景中時(表示粘連產生的凹陷區域都完成分離),停止所有操作。
3.2.4本文粘連分離方法
(1)讀取一張原始FISH細胞核圖Iy;
(2)利用前文設計的方法,將Iy分類并預處理為理想圖I,使用前文設計的細胞核提取方法,將I中的細胞核提取出來,并將圖像轉化為二值圖I0;
(3)對I0做邊界提取,記錄目標初始邊緣ED0;
(4)利用半徑R=3的近圓形結構元素SE,對I0圖像做腐蝕運算,分離輕微粘連的細胞核;
(5)利用前文設計的“深度凹陷檢測方法”,檢測出當前圖中深度凹陷點,存入集合H;
(6)利用前文“自然凹陷力”,逐點加深H點處的凹陷,最終使得細胞核粘連區域全部得以分離;
(7)對分離后的各個區域進行連續粗化運算(保持不連通性),使各個區域復原成原始大小,直至區域邊緣達到ED0的極限,且結果不再變化為止;
(8)對當前二值圖I0做邊界提取,記錄當前目標的邊緣ED,則ED為細胞核的分離界線;
(9)將分離界線轉化為紅色,疊加于圖像I上,作為輸出結果。
3.2.5實驗效果
分別選取“簡單粘連”和“復雜粘連”的FISH細胞核圖像進行分離實驗,結果如圖8、圖9所示,實驗效果理想。
4細胞核計數和信號點提取
4.1細胞核計數
讀取一張經過粘連分離后的細胞核二值圖I0,繼而計算標記為目標(標記為1)的連通區域數,即為細胞核個數。
4.2信號點提取
紅色信號點的提取方法:先將G和B的值減為0,得到R紅色熒光圖,再通過閾值分割和極限腐蝕法得到幾何中心,用于后續分析。同理,可用于綠色信號點的提取。
5結論
系統主要實現4個功能:(1)FISH圖像預處理;(2)FISH細胞核的提取;(3)粘連細胞核的分離;(4)細胞核技術和信號點提取。上述設計,都在滿足精確度和視覺效果要求的范圍內,盡可能構造計算量小、直觀性強的方法。但仍存在著不足:無法實現某些特殊情況下的粘連分離,比如在細胞核嚴重團簇、細胞核發生多層粘連時,內層細胞核相互擠壓,沒有形成凹陷,使之無法分離。這有待進一步改善。
參考文獻
[1] 柳威, 謝鳳, 陳臨溪. CAbl在腫瘤發生及治療中的重要作用[J]. 臨床與病理雜志, 2012, 32(6):516-523.
[2] 唐磊. 基于腫瘤分類與生長建模的癌癥藥物療效預測平臺設計與應用[D]. 合肥:中國科學技術大學, 2012.
[3] 楊澤新.基于顏色和形狀的圖像檢索技術研究與實現[D].武漢:華中科技大學,2006.
[4] 許新征,丁世飛,史忠植,等 .圖像分割的新理論和新方法[J].電子學報,2010,38(Z1):76-82.
[5] 劉國英. 基于Markov隨機場的小波域圖像建模及分割[M]. 北京:科學出版社, 2010.
[6] 白雪. 基于三馬爾可夫場的SAR圖像分割[D]. 西安:西安電子科技大學, 2012.
[7] 段汕, 陳曉惠, 鄭晨. 基于區域特征的模糊多尺度Markov模型在紋理圖像分割中的應用[J]. 中南民族大學學報(自然科學版), 2010, 29(3):93-99.