成大數據科學研究所

成大數據科學研究所 國立成功大學數據科學研究所
Institute of Data Science, National Cheng Kung University

真 · 數據科學尖兵招募
大數據狂潮席捲全世界,《哈佛商業評論》更將數據科學家譽為「21世紀最性感的職業」。想具備資料分析技能?想正確解讀分析結果?想遊刃有餘於不同類型的數據?想知道如何處理數以億計的巨量資料?還是想從歷史數據預測未來?並應用各種人工智慧方法於真實生活中?成大數據科學研究所是您的首選,加入本所就對了!
加入本所,您將能進入跨領域、跨人才、跨技術的自由學習大平台。本所擁有多樣且具彈性的學習特色:


師資橫跨不同的領域,可提供專業且完整的資料分析技術。
學生可至外系、所修習適當課程。充實研究問題之領域知識。
學生可參與各領域之研究計畫,尤其結合成大附近南部科學工業園區及各級醫學產業需求,數據科學的理論與實務將在產學合作中能得到完整的訓練。
老師帶領參加各種數據分析競賽,從而培養有效率的合作團隊,挑戰世界各處數據專家。

研討會重要時程. 早鳥優惠截止日期:2026年3月31日 (星期二). 投稿/摘要上傳截止日期:2026年5月8日 (星期五). 線上報名截止日期:2026年5月8日 (星期五). 交通補助申請截止日期:2026年5月8日 (星期五)
26/03/2026

研討會重要時程
. 早鳥優惠截止日期:2026年3月31日 (星期二)
. 投稿/摘要上傳截止日期:2026年5月8日 (星期五)
. 線上報名截止日期:2026年5月8日 (星期五)
. 交通補助申請截止日期:2026年5月8日 (星期五)

26/11/2025
17/11/2025

【喜賀】統計系大四張凱華同學參加114年UR大專學生專題研究海報展暨海報競賽 獲得跨域社會科學組優良獎

統計系大四張凱華同學在鄭順林老師指導下,進行AI人工智慧運動科學數據分析的研究,申請國科會大專生計畫獲得通過,計畫題目為: 集成學習模型可解釋性探討-應用於世界頂尖桌球選手之技戰術分析。研究主要方向為AI人工智慧方法中集成學習(Ensemble Learning)模型的可解釋性,應用運動科學數據分析於世界頂尖女子桌球選手之技戰術分析。

張凱華同學以國科會計畫執行初步成果,參加成功大學114年UR大專學生專題研究海報展暨海報競賽,獲得跨域社會科學組優良獎。

本系對張凱華同學的努力與成果表示肯定與祝賀!

競賽海報網址:
https://ur.ncku.edu.tw/book/集成學習模型可解釋性探討-應用於世界頂尖桌球選手之技戰術分析/

[NCKU/DS News!]數據所許志仲副教授帶領ACVLAB團隊-數據所李家銘 數據所準新生林宇凡及邱勃誠 獲國際獎項 (ICIP,Auto-WCEBleedGen Challenge,全球第二)許志仲副教授帶領ACVLAB,參加IEE...
22/03/2024

[NCKU/DS News!]
數據所許志仲副教授帶領ACVLAB團隊-數據所李家銘 數據所準新生林宇凡及邱勃誠 獲國際獎項 (ICIP,Auto-WCEBleedGen Challenge,全球第二)
許志仲副教授帶領ACVLAB,參加IEEE訊號處理協會(Signal Processing Society, SPS) 旗下的頂級會議ICIP(IEEE Conference on Image Processing)舉辦的Auto-WCEBleedGen Challenge (Automatic Classification between Bleeding and Non-Bleeding frames and further Detection and Segmentation of the Bleeding Region) 競賽,榮獲世界第二。本競賽主要目的是透過AI來預判腸胃道出血,具有重大臨床應用意義。胃腸道 (GI) 出血是一種以胃腸道出血為特徵的疾病,胃腸道包括食道、胃、小腸、大腸(結腸)、直腸和肛門。由於血液流入胃腸道,就會出現一系列風險,從直接危險到潛在的長期後果。胃腸道出血過多失血可能導致血壓下降、器官和組織供氧減少以及可能危及生命的器官功能障礙。因此,若有可靠的AI來進行準確的出血預測,將可大幅降低判斷時的人力需求。

本次競賽團隊由碩一李家銘為首,以及兩位成大數據所準新生,林宇凡及邱勃誠兩位同學組成團隊參與此次競賽。此競賽的目的在於設計一個多任務學習框架(multi-task learning),需同時完成疾病分類與病灶的精確定位,並提供具解釋性的結果供腸胃科醫生分析。本次競賽僅由學生自行討論,藉著碩一李家銘同學豐富的經驗,設計了兩階段的(Divide and Grounding)訓練架構,並且透過 affirmative ensembling 有效集成不同模型,以提升整體效能,最後斬獲全球第二之佳績,也僅次於全球知名的印度理工大學 (IIT) 之研究團隊。

IEEE ICIP為IEEE旗下影像處理領域中旗艦研討會,每年吸引許多影像與訊號處理的專家學者參與。IEEE ICIP 2023於印度 Jammu舉行,總共吸引全球超過 1200 人位研究人員及從業人士參與,並由 MISAHUB(醫學成像和信號分析中心)主持相關內容。本年度IEEE ICIP將在十月下旬於阿拉伯阿布達比舉辦,預計同樣也會受到相關領域專家學者與會。我們亦受邀線上參與本次競賽中來發表解法細節,相信在與國際專家學者交流底下,必然收穫滿滿。本會議受到國際許多知名影視訊處理研究團隊的重視,此次兩位碩零同學能在初次參賽便有此亮眼成績,實屬不易,更難得的是在ICIP中亦獲得多個研究團隊之重視與討論,可見本團隊提出之解法確有獨到之處。

Website: https://misahub.in/ICIP/index.html

29/02/2024

[NCKU/DS News!]
!!!!!!恭賀!!!!!!
【喜訊】恭喜數據所許志仲老師指導研究助理蔡其翰與台灣兩位數據科學家-周培廉(kaggle name:outrunner 聰泰科技),董昱驣(kaggle name:atom1231 佳世達科技),參加IceCube - Neutrinos in Deep Ice,獲得金牌的獎項。

成大數據所許志仲副教授ACVLab旗下蔡其翰(kaggle name:fate成大數據所研究助理)、聯手與台灣兩位數據科學家,周培廉(kaggle name:outrunner 聰泰科技),董昱驣(kaggle name:atom1231 佳世達科技),參加IceCube - Neutrinos in Deep Ice,從全球813隊中擊敗許多知名資料科學研究團隊,獲得金牌的獎項。
本次競賽 IceCube是一個位於南極的天文觀測站,旨在探測和研究宇宙中的neutrino(譯中微子或中微子)。觀測站的探測器位於南極冰層下方,深入地下約1至2公里,是一個由數千個光探測器組成的巨大的探測器陣列。
中微子是一種質量極小、沒有電荷的粒子,它們可以穿越大部分物質而不和之相互作用,這使得它們難以被檢測。然而,當中微子與冰中的原子相互作用時,可能會產生一些帶有能量的次級粒子,這些次級粒子可能會發射出光子而被探測器檢測到。
IceCube舉辦這個競賽主要的目的是根據探測器陣列的讀數來預測中微子的方向,這是一個在高能物理存在已久的”事件重建問題”,許多科學家已在此研究了幾十年。主辦方期待能透過這個競賽找出更準確以及足夠快的方法,以推進科學研究。
這是中微子的一個案例,我們需要從感測器的訊號(大小小的點)去預測中微子的方向(紅色的線),實際上很多案例看起來像雜訊,完全看不出感測器訊號與中微子方向的關係
本次競賽的獲勝關鍵在於引入了Transformer model,GNN model, LSTM model與Sakt model做深入研究,然後利用數學模型與物理概念把中微子事件依據其物理特性分成6組難易不同的組別,每個組別使用不同的權重對3種模型進行ensemble(模型集成),最終在813個隊伍中獲得第全球6名成績,成功獲得kaggle競賽金牌。

Kaggle是一個數據科學競賽平台,舉辦各式各樣的競賽,吸引全球數據科學家和頂尖工程師參與,甚至包括像任職Nvidia、META、Microsoft、Google這樣的頂尖AI公司的工程師,共同挑戰各種數據科學問題。要取得佳績,選手必須在限定的時間內,對給定的大量資料進行處理、特徵工程,並設計出創新且高效的AI模型。每場競賽都會有新難題需要解決。獲獎選手展現了對各種演算法的靈活運用,以及針對實際複雜問題建模與優化的能力。此番獲獎,不僅是對成大、數據科學研究所、ACVLab,以及其翰與其隊友能力的最佳肯定。

競賽網址 : https://www.kaggle.com/competitions/icecube-neutrinos-in-deep-ice
排行榜 : https://www.kaggle.com/competitions/icecube-neutrinos-in-deep-ice/leaderboard
本團隊solution : https://www.kaggle.com/competitions/icecube-neutrinos-in-deep-ice/discussion/403153

Reconstruct the direction of neutrinos from the Universe to the South Pole

29/02/2024

[NCKU/DS News!]
!!!!!!恭賀!!!!!!
【喜訊】恭喜數據所許志仲老師指導研究助理蔡其翰&研究生馬欣蒂參加Kaggle比賽奪得金牌!

成大數據所許志仲副教授指導研究助理蔡其翰(kaggle name : fate)與研究生馬欣蒂(kaggle name : cindy ma)組成的團隊,日前參加全球最大數據科學競賽平台Kaggle舉辦的年度盛事,在眾多選手中脫穎而出,奪得該競賽的最高榮譽金牌。這項極具競爭力的國際賽事,每年吸引來自全球數以萬計的頂尖數據科學家參賽,奪金之險峻可想而知。本次獲勝的競賽是在kaggle上的UBC 舉辦的Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)競賽。台灣每年平均能獲得金牌的人數皆於3-5人之間,其翰與欣蒂能獲此殊榮實屬不易。
UBC-OCEAN這個競賽是由UBC主辦的,主要是對卵巢癌不同亞型及異常型做分類。由主辦方的說明影片得知,卵巢癌主要是透過病理組織切片來判斷的,但卵巢癌是一個包括5種主要亞型的癌症,不同亞型有不同的嚴重度與治療方法,目前領域專家對不同亞型判斷的kappa coefficient有0.89,然而普通的病理學家kappa coefficient大概只有0.54-0.67(判斷一致性低),所以主辦方出於這個原因辦了這個競賽。

這個競賽的困難點有幾個:
1.Data來自各大洲的二十幾個醫學中心(training data只有13個醫學中心),這些來自各個醫學中心的病理切片染色方法不盡相同
2.Data包括Whole Slide Imaging(WSI)以及Tissue Microarray(TMA),training data有5百多個WSI以及25個TMA案例,但我們主要預測的TMA佔大多數
3.要預測罕見的亞型Outlier,但training data完全沒有Outlier案例

本團隊研究方法主要是把WSI切成tiles (原始 WSI尺寸很大,此為常見手法),然後用模型預測tiles得到預測值與真實亞型的不一致性當成偽標籤,再把偽標籤當成輔助損失 (aux loss),與真實亞型一起重新訓練;最後用偽標籤當成是否微異常值的判斷標準,如果不是異常值再判斷是屬於何種亞型。
我們是金牌區少數不用External Data (競賽官方之外data)的團隊,也是少數不用Multiple instance learning方法的團隊;我想我們獲勝的關鍵在於預測TMA的Outlier的案例的能力比其他隊伍更好,才能在眾多頂尖隊伍的夾殺下,獲得第9名(金牌)的成績。

Kaggle是一個數據科學競賽平台,舉辦各式各樣的競賽,吸引全球數據科學家和頂尖工程師參與,甚至包括像任職Nvidia、META、Microsoft、Google這樣的頂尖AI公司的工程師,共同挑戰各種數據科學問題。要取得佳績,選手必須在限定的時間內,對給定的大量資料進行處理、特徵工程,並設計出創新且高效的AI模型。每場競賽都會有新難題需要解決。獲獎選手展現了對各種演算法的靈活運用,以及針對實際複雜問題建模與優化的能力。
其翰表示,能夠代表台灣拿下金牌,實現他從事數據科學研究以來的目標。這不僅是團隊的最大榮耀,也展現台灣已經有能力與世界一流高手一決高下的實力。

競賽網址:https://www.kaggle.com/competitions/UBC-OCEAN
排行榜 :https://www.kaggle.com/competitions/UBC-OCEAN/leaderboard

29/02/2024

[NCKU/DS News!]
!!!!!!恭賀!!!!!!
【恭賀】許志仲老師帶領數據所研究生曾文海、吳明軒、黃韋晧、李家銘參加ACM Multimedia Asia (MMAsia) 比賽-獲得世界第二!!

本校數據所許志仲副教授帶領數據所研究生曾文海、吳明軒、黃韋晧、李家銘四位同學,參加 ACM Multimedia Asia (MMAsia) 中舉辦的自駕車魚眼影像物件偵測上 (Embedded AI Object Detection Model Design Contest on Fish-eye Around-view Cameras) 獲得世界第二的佳績。MMAsia是電腦視覺的頂尖會議,每年吸引許多學術圈與知名業界研究人員參與,也因此上面的各種學術競賽總是特別競爭,這些競賽不見得參加人非常多,但都是知名學術與研究團隊,因此要從中獲得好成績相對不容易。我們本次由於時間有限,因此在模型選擇與資料處理上面格外小心,但也因為數據所的訓練就是理解資料,因此在正確的分析結論下,加上同學日夜搏鬥,終於獲得國際第二的佳績,實屬不易。

由於自駕車受到極大的重視,而且自駕車有許多需要注意的問題,不論車道辨別、物件偵測、車禍預測、可行駛路徑,都是自駕車必須要考慮的問題。其中自駕車應用最重要的一環就是視覺感知,也就是透過攝影機來偵測或理解道路的資訊,以輔助決策。本次MMAsia舉辦的競賽是道路上即時物件偵測,由於偵測目標分為行人、車輛、腳踏車、摩托車,很多場景其他三類對比車輛來說相對很小,傳統在物件偵測中,單一畫面直接偵測極小物件通常會因為特徵圖過小而產生特徵消失問題 (Feature vanishing),導致最後下游偵測器無法偵測到。我們經過分析之後,發現Parallel Residual Bi-Fusion Feature Pyramid Network (PRB-FPN) 可有效的避免特徵消失的問題,提高物件偵測方法對於小物件的偵測能力,同時能保有Real time (即時) 的效果。然而對於此次競賽,所提供測試和訓練的資料是不相同的,測試的資料是魚眼圖像,但是我們的訓練資料是一般圖像,所以我們利用Knowledge Distillation (知識蒸餾) 以及Pseudo-label (偽標籤),來幫助模型在不同的資料形態下還能保有原本的預測能力。基於巨人肩膀上,我們引入了PRB到Yolov7中,建構了一個新的模型,有效的將成績進一步往上提升,最終獲得第二名的好成績。值得一提的是,大多數遇到這種資料不相同時會使用圖片變換,先將魚眼圖片轉成一般圖片再進行預測,但這樣對於實際應用上並不是理想策略,除了效果僅有些許的改善,更重要這種方法並不通用,需要針對不同的魚眼相機做出不同的轉換,因此我們不採用此策略,也因此,任務變得更加艱難,要從中想出新的應對方法,相對更不容易。此次能獲得佳績,四位同學的努力功不可沒。

相關競賽連結:https://aidea-web.tw/topic/2be7c481-0e16-43b8-8d5d-fb181172144b?focus=intro

Address

大學路一號
Tainan
701

Alerts

Be the first to know and let us send you an email when 成大數據科學研究所 posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Contact The University

Send a message to 成大數據科學研究所:

Share