主題亮點

智慧製造大數據分析平台開發與良率提升
System development of big data analytics for intelligent manufacturing and yield enhancement
製造業面臨外部環境快速變化,內部需持續提升生產良率與降低製造成本等競爭壓力,各國無不積極推動工業4.0、物聯網、工業網路(Industrial Internet)、智慧工廠(smart factory)以解決製造業面臨的困難。在生產製造的複雜程序中,隨著感測技術與聯網技術的提升,越來越多的生產過程與測試設備的巨量資料得以被紀錄,包括生產歷史資料、設備感測參數資料、產品檢測資料等,除了有效率存取龐大的工程資料外,製造業更需要的是利用大數據分析技術建立預測的分析模式以提升產品良率,找到可能的關聯模式以提高生產線產出、降低生產成本。隨著對產品與製程的精密要求越來越高,提高設備工程能力與即時回饋補償是提升製造良率的關鍵,透過線上測器與量測設備資料以即時監控以提早發現設備中的各種異常,當發現量測品質偏離目標值則快速地進行調整與回饋,以減少不必要的停機與浪費與提升設備利用率。此外,為了確保生產的產品良率,製造過程中均會量測相關的品質參數與指標以掌握生產線上現況,雖然量測的結果可作為檢驗設備是否異常,然而卻可能會損失產能,因此,發展預測模型提供產品品質估計,在尚未發生異常時即馬上預警,採取對應的處理措施以確保產品良率;亦或者利用設備機台所蒐集到的參數建立預測模式,作為製程品質預測的依據。在無法對產品實際量測下,藉由機台參數以估計產品的品質,可即時偵測產品與設備狀態,並減少檢驗時間。

智慧製造研究團隊針對製造業資料特性,發展國內智慧製造大數據分析平台,整合由資料管理、分析建模、以及終端應用與視覺化,所開發之大數據分析系統特點包括:

1.           大量及時資料的擷取與分散式運算處理
2.           快速建模與預測性分析技術
3.           視覺化工具開發
4.           系統彈性維護與擴充

圖一:智慧製造雲端大數據分析平台

本研究團隊發展之製造業大數據雲端分析系統,包含:製造業大量資料的儲存與快速擷取平台生產線狀態監控與預測分析缺陷關聯參數分析資料視覺化工具。本研究團隊建立之大數據雲端平台架構可作為不同產線或廠區間資料快速彙整與儲存,產線資料的共享,所開發之大數據分析系統儲存架構為HDFS(Hadoop Distributed File System)架構,將檔案切割成固定大小的檔案並儲存在不同的機台,因此在讀取時可平行讀取藉此降低讀取時間,因為可跨伺服器儲存,資料儲存量得以有效擴充與運用。雲端的架構使得不同產線的資料達到共享,並使得生產線的調配更具彈性,相同的產品也可透過不同生產線的模型來分析預測。此外資料視覺化工具的導入,提供多元生產資訊的呈現與檢視,協助工程師即時掌握生產線上關鍵資訊。研究團隊部分研究成果已開始應用至合作廠商生產線測試使用,提供工程師良率監控與診斷之依據。
1.       本研究團隊建構特徵比對之Mapreduce演算法,基於設備感測資料的變化與生產歷史資料特徵進行比對,如圖二所示,不僅改善過去比對技術耗時難以實際應用的困難,也可分析週期性機台參數比對分析並預測生產線狀況,當發生異常時提出可靠的數據分析提供給工程師,解決過去憑藉統計量的變化作為異常判斷的依據,例如:平均、變異數等,降低誤警(false alarm)與縮短工程師異常診斷的時間。分析結果如圖三所示,提出之比對演算法基於大數據平台利用MapReduce架構平行分散運算,平均執行時間可大幅度縮短約7.5倍,使工程師得以運用更多時間在事故排除與良率提升的工作上。
圖二:設備異常比對偵測

圖三:計算效率比較
2.       以某光學薄膜製造廠為實證案例,機台參數剛發生異常時並不會馬上造成產品缺陷,當缺陷機偵測出缺陷時代表某些機台參數可能早已有問題,本研究團隊發展之大數據分析系統可及時監控產線狀況,當發生異常缺陷時,過濾可能造成異常的參數比例至5%,減少工程師逐一檢查與歸納可能造成異常的參數所需時間,可投入更多的時間在事故排除與改善方法執行上。
 (本文由本中心智慧製造研究團隊提供)

健康醫療大數據時代來臨
Big Data in Health Care
大數據(Big data)可以說是近年來最熱門的資訊議題之一,隨著生活上各式各樣隨手可得的數位化資料,且不需要太高的金錢與時間成本,即可獲得龐大的資料,因此,大數據分析(Big data analytics)儼然已成為一種協助決策的重要依據。在健康醫療領域方面,隨著生物科技與藥物開發技術的進步,更加速了醫療數據的爆炸性成長,這些資料包括基因體與蛋白質體序列、基因表達數據、轉錄體序列、蛋白質譜、蛋白質三維結構、醫學訊號與影像等;隨著生物科技的進步,許多生物研究相關儀器(例如:生物晶片、DNA & RNA定序儀及蛋白質譜儀等)皆可在成本較以往為低的條件下,在短時間內產生大量分析數據;其中,次世代定序(Next-generation sequencing[1-2]是近年來最熱門的一項生物技術,能夠利用不到一周的時間,即可完成傳統DNA/RNA定序方法需花10年的工作,並且金錢成本也快速下降。然而,面對如天文數字般無時無刻增長的龐大數據,我們該如何去處理與分析呢?於是,近幾年生物資訊學(Bioinformatics)又再次受到重視。生物資訊是一門結合生物、資訊、統計、物理、化學等領域之跨領域科學,它的研究方向與應用範圍仍在不斷演進中,近年來本中心結合大數據、雲端運算與生物資訊技術,並成立「醫療健康大數據研究團隊」,積極切入健康醫療研究領域,研究主題包含:「個人化醫療與基因檢測」、「微生物檢測與功能性分析」、「癌症生物標誌與藥物設計」。

個人化醫療與基因檢測
美國總統歐巴馬於今年120日提出「精準醫學計畫(Precision Medicine Initiative)」,預估投資2.15億美元,並表示將要募集100萬人的基因資料,透過研究不同族群、各個年齡層的個人化基因檢測,推動利用個人化基因資訊來協助治療癌症等疾病,藉由此計畫發展出更精準且全面的健康醫療大數據分析方法,此計畫將在人類歷史上再次締造突破醫學發展的地位。當天許多美國大型藥廠與生技公司高層主管亦出席會議並進行交流,包括默克(Merck)、IlluminaAffymetrixVertex Pharmaceuticals、以及羅氏藥廠投資的Foundation Medicine等,顯見推動「精準醫學計畫」,必須集結基因檢測、生物資訊、生技製藥等產業力量才能達成。從現今歐、美、亞洲各國投入生技製藥發展趨勢來看,Business Insight預估個人化基因檢測市場規模在2015年可達62.7億美金(資料來源: http://www.nownews.com/n/2015/02/05/1596288 ),主要著重在遺傳疾病與癌症檢測為主。

國內亦有多家生技公司整積極切入個人化基因檢測市場,「訊聯生物科技」所開發之非侵入性胎兒染色體檢測(Non-Invasive Prenatal Testing),便是透過抽取孕婦的靜脈血,對其血漿中所含有的胎兒DNA資訊[3],結合次世代定序晶片和生物資訊技術進行分析,即可準確檢測胎兒是否患有唐氏症愛德華氏症巴陶氏症等染色體疾病(見圖四)。此外,「賽亞基因」開發肥胖體質檢測產品-體質基因檢測(Weight-Related Genotyping,透過檢測特定基因位置之個人基因型,由此可區分出「脂質型肥胖」、「澱粉型肥胖」、「代謝型肥胖」、「臟器型肥胖」或「頑固型肥胖」等肥胖體質類型,並透過分析結果來給予不同肥胖體質類型的受測者,減重、飲食與運動上的建議。
 
圖四:個人化基因檢測:非侵入性胎兒染色體檢測
本團隊積極整合大數據(Big Data)與生物資訊(Bioinformatics)技術,搭配高通量生物晶片與次世代定序技術,進行個人化醫療與基因檢測,並積極與鄰近醫療單位和生技公司進行產、官、學合作,相關研究議題包含糖尿病引起之腎病變檢測、子宮頸癌之標記基因檢測、大腸癌之標記基因檢測、免疫細胞之活化反應路徑分析、肺結核之潛伏期標誌基因檢測與致病機制分析等。本團隊亦積極與「康健基因生技公司」合作,整合生物實驗、建構基因體資料庫與次世代定序技術所產生的大數據資料分析平台;僅需使用棉棒採集口腔壁上之檢體,即可提供客戶一次檢查,卻終身受用的個人基因檢測服務,預測難以避免的疾病風險,更與多家醫院、診所合作,為病患進行個人化醫療之相關檢測。大數據技術正開啟個人化醫療的新頁。

微生物檢測與功能性分析
在地球自然界中一個完整的環境生態系統,除了肉眼可見的生物(動物或植物)外,更多的是肉眼所看不見的微生物,包含真核微生物(Eukaryotic microbes)、細菌(Bacteria)、古生菌(Archaea)以及病毒(Virus)。若欲描繪一個真實環境的微生物群落組成,最有效的方式就是直接萃取環境中的RNA後進行次世代定序,藉由比對微生物的Ribosomal RNA(rNRA)來拼湊出該環境中的微生物組成,透過生物資分析技術來進行全面性的微生物群集、活躍物種及轉錄體功能性分析與檢測,進而描繪出該環境之微生物真實生活面貌[4]。近年來本團隊整合了生物資訊與大數據分析技術,發展出新型微生物群落與功能性分析平台,旨在利用高通量生物定序技術針對特定生態環境,舉凡土壤、海水、人類消化道、女性陰道、飲料及食用產品等,進行全面性Metatranscriptomics創新分析平台之開發,使其能描繪出環境內真實且完整的微生物分佈比例及活躍轉錄體之功能與特性,可作為疾病診斷、投藥標靶及食品衛生相關檢測之主要參考依據,此分析技術更能廣泛應用於任何有微生物存在之環境。此研究計畫「利用生物資訊方法與轉錄體生物晶片探究微生物群落」更獲得科技部103年度百人拓荒計畫之補助(見圖五之研究計畫架構圖),實屬難得,也顯見此新興領域之未來潛力。

近期本研究團隊首開先例以台灣茶葉為檢測對象,進行「微生物檢測及功能性分析」,發現茶葉中的主要微生物族群是 Firmicutes Bacteroidetes,同時也為人體腸道微生物的主要類群。這兩類微生物在文獻中,被指出與肥胖有關:肥胖者之Firmicutes 比例較高,Bacteroidetes 則較為低;瘦者則反之。Bacteroidetes也被報導可抑制脂肪累積,並促進瘦素分泌。另外,VeillonellaceaeFusobacteriaceaePrevotellaceaeBacteroidaceae等菌屬則與肝硬化、非酒精性脂肪肝疾病(NAFLD)和脂肪肝炎(NASH)患者相關。不同茶葉品種會有不同的微生物群落,此研究提供一個不同的觀點來檢測茶葉的品質與特性!本團隊期盼能以「發展前瞻與創新技術,增進未來產業競爭力」為首要目標,希望能藉由此平台開創台灣農產品檢測之先例,促使台灣農產品兼具品質與創新,提高整體農產品之品質並享譽於國際。此平台更可應用於腸道、口腔、陰道等人體微生物生態系統檢測,或土壤、河川、空氣等環境微生物檢測,亦可應用於食物、飲料、蔬果、調味料等食品檢測,此技術更可應用於益生菌之檢測與開發。

圖五:新型微生物群落與功能性分析平台之研究計畫架構圖

新型藥物開發分析系統
近幾年全球掀起一股生技製藥熱潮,國內亦有多家生技公司進行新藥研發並進行臨床實驗,如智擎以治療胰臟癌為主的新藥PEP02、基亞以國人常見的肝癌新藥PI-88為主(PI-88擁有「雙重抗癌效果」,能抑制類肝素及血管生長因子)、永豐餘集團投資的太景生技則擁有奈諾沙星口服劑型肺炎新藥、中裕是以研發愛滋病單株抗體藥物TMB-355為主(創辦人為愛滋病權威何大一博士),然而這些藥物開發的金錢與時間成本非常高,且往往到了最後進入美國FDA臨床試驗的結果多是不符預期,對於許多中小型的生技公司而言,實在難以負擔如此大量的金錢與時間來進行產品的開發,因此結合基因檢測與藥物篩選的分析平台,成為現階段藥物開發的前端重要研發過程。

近期本團隊與「康百事生物資訊公司」合作,進行「新型藥物篩選系統」之開發,透過大數據中心之高端運算與儲存設備來進行大規模基因表達資料庫之建立,再透過個人化基因晶片之檢測數據來進行藥物篩選,可針對不同的疾病(如肝癌、肺癌、胃癌、大腸癌等)進行基因表達數據之分析並與資料庫進行比對,提供醫生進行更精準之藥物治療(見圖六)。此分析系統亦可與藥廠合作,進行大規模舊藥新用之分析,找到舊藥的新療效。台灣在中草藥方面的研究亦是世界知名,未來此系統可與中草藥開發商合作,找到中草藥在特定癌症或疾病之療效,顯見此新型藥物篩選系統之未來之市場價值不凡。

圖六:結合基因檢測與藥物開發之分析系統。
個人化醫療照護
個人化醫療照護除了基因治療領域外,近年透過資訊科技發展,大數據分析技術亦成為目前醫療照護的新趨勢之一,當中包含電子病歷系統、醫院資訊系統、政府醫療數據資料交換平台與其衍生醫療照護應用系統。透過這些系統的建立累積了巨量的臨床資訊與個人健康照護資訊,同時也使得醫療衛生領域得以利用這些巨量的臨床、公衛資料進行分析評估並提供治療處置的決策支援資訊,更提供了醫事機構分析病患個人醫療利用的情形或輔助政府機關進行公共衛生政策的規劃與制定。

醫療照護機構導為了實現大數據分析應用,許多醫療院所企圖透過資料庫即時分析,並導入各式即時監控數據設備進行資訊的蒐集與決策運用,例如行動護理系統(Nursing Information System, NIS)、病患RFID偵測系統、行動醫療系統以及診斷決策支援系統等等,有別於過去只有加護病房(ICU)才具備的生理徵象及時偵測設備,當下的趨勢在於藉由普及化數據蒐集設備,快速記錄病患資訊,並且透過行動裝置即時顯示結果,跳脫過去手寫病摘、生理紀錄不易存取檢索的缺點,大幅提高資訊可利用性。此外近年更有醫院藉由數據的蒐集進而開始進行醫事流程的改善,透過監控住院病患生理健康狀況,在病患住院治療期間隨時進行生理數據分析以及疾病風險評估,動態調整病人照護方針以提供個人化醫療照護與精準治療。例如過去筆者所進行之藉由多重疾病共病性(Multimorbidity)、電子化病歷(Electronic Medical Record, EMR)資訊、檢查檢驗資訊、生命徵象(Vital Sign),及醫療利用(Medical Utility)之數據分析,進而分析住院病患之風險層級,使病人在住院過程中受到數位化照護,並達成在高風險事件發生前或發生當下即早進行偵測與處理,增進病人醫療安全與降低住院風險效用。

個人化精準醫療的發展與實現,仰賴生物科技、基因工程的進步,還有資通訊科技及大數據分析技術的導入,無論任何的分析應用,都離不開最重要的資料收集與數據庫分析能力,然而在巨量資料的時代中,如何具備Tera Byte等級大數據分析處理能力,將會是掌握發展關鍵之鑰。

參考文獻:
 (本文由本中心生醫資訊資料分析團隊提供)

沒有留言:

張貼留言