科技與工程學院

Permanent URI for this communityhttp://rportal.lib.ntnu.edu.tw/handle/20.500.12235/5

沿革

科技與工程學院(原名為科技學院)於87學年度成立,其目標除致力於科技與工程教育師資培育外,亦積極培育與科技產業有關之工程及管理專業人才。學院成立之初在原有之工業教育學系、工業科技教育學系、圖文傳播學系等三系下,自91學年度增設「機電科技研究所」,該所於93學年度起設立學士班並更名為「機電科技學系」。本學院於93學年度亦增設「應用電子科技研究所」,並於96學年度合併工教系電機電子組成立「應用電子科技學系」。此外,「工業科技教育學系」於98學年度更名為「科技應用與人力資源發展學系」朝向培育科技產業之人力資源專才。之後,本院為配合本校轉型之規劃,增加學生於科技與工程產業職場的競爭,本院之「機電科技學系」與「應用電子科技學系」逐漸朝工程技術發展,兩系並於103學年度起分別更名為「機電工程學系」及「電機工程學系」。同年,本學院名稱亦由原「科技學院」更名為「科技與工程學院」。至此,本院發展之重點涵蓋教育(技職教育/科技教育/工程教育)、科技及工程等三大領域,並定位為以技術為本位之應用型學院。

107學年度,為配合本校轉型規劃,「光電科技研究所」由原隸屬於理學院改為隸屬本(科技與工程)學院,另增設2學程,分別為「車輛與能源工程學士學位學程」及「光電工程學士學位學程」。

News

Browse

Search Results

Now showing 1 - 10 of 13
  • Item
    結合影像與四輪控制之智能車體與人體追蹤系統
    (2025) 呂彥澂; Lu, Yen-Cheng
    本研究設計一套可以辨識並追蹤人體的智慧型四輪驅動車。結合了四輪驅動車與影像辨識模型,車體由四顆馬達驅動四個車輪,具備靈活的運動控制能力,達成穩定追隨目標的控制。在影像辨識上,車體搭配深度攝影機擷取前方人體影像,透過關節偵測工具MediaPipe Pose擷取人體背部關節的移動資訊,並使用GRU時間序列模型學習並記憶主人的關節動作模式。當系統辨識出該模式與記憶資料相符時,會將此人標記為主人(Master),並啟動自動追隨模式。在運動控制方面,利用運動方程式得出的轉速控制馬達,並透過增量型PID控制器調整轉速,讓車子轉彎與前進更穩定。此研究整合了影像辨識、深度學習與四輪控制技術,有效提升四輪驅動車對指定目標的辨識準確率與追蹤穩定性,未來可應用於智慧陪伴、物流配送及購物跟隨等場域。
  • Item
    結合頭部姿態估計與補償的視線追蹤
    (2025) 陳璽文; Chen, Xi-Wen
    本文提出了一種基於可見光影像的視線追蹤系統,採用單一高速相機,取代傳統依賴紅外光源或專用傳感器的方案,從而顯著提升了使用者體驗。然而,這種設置在補償頭部移動方面面臨更大的挑戰。為解決此問題,我們設計了一種新型視線追蹤系統,結合了精確的頭部姿態估計方法。該方法通過識別臉部特徵點並解決 2D 到 3D 的對應問題,獲取特徵點的 3D 坐標,進而估算頭部運動。該系統能夠實時更新眼球模型並準確計算虹膜區域的初始位置。實驗結果表明,當使用者進行輕微頭部移動或旋轉時,該系統能有效提高視線追蹤的精度與準確性。
  • Item
    用於光學同調斷層掃描之基於深度學習和聯邦學習框架之視網膜積液分割技術
    (2024) 林志韋; Lin, Chih-Wei
    在眼科領域,光學相干斷層掃描(OCT)是檢測眼病的關鍵技術。偏鄉資源有限僅能使用輕量化設備,但其計算能力不足,難以支撐較為大型模型的訓練,以及數據缺乏和隱私問題阻礙醫院數據共享。首先針對輕量化設備,基於LEDNet設計了高效的LEDNet(α)模型,通過調整通道、添加Shuffle Attention模塊和Group Normalization。使用成本低廉的樹莓派5進行訓練,適合偏鄉需求,為解決隱私問題,引入聯邦學習,通過上傳本地模型參數聚合全局模型,避免資料直接上傳。本研究提出Krum(α)算法,在客戶端損失函數中添加近端項並考慮模型自適應性,改善淘汰機制,改進基於歐氏距離淘汰惡意模型的Krum算法。最後實驗結果顯示,在AROI、DUKE、UMN和RETOUCH數據集上,AROI積液類別提高了3.4%,DUKE提高了5.9%,UMN提高了2.4%,RETOUCH提高了1.4%。
  • Item
    針對空拍影像物件偵測之改良型YOLOv7演算法研究
    (2024) 鍾宜修; Chung, Yi-Hsiu
    近幾年無人機的技術發展迅速,飛行距離越來越遠、體積也不斷縮小,甚至能自動飛行,因此能應用的範圍也越來越廣泛,例如交通監測、工業或自然環境巡檢等等。另外隨著人工智慧的興起,現在無人機也會結合人工智慧演算法協助其辨識影像。由於無人機所拍攝的影像內物件往往尺寸偏小,且無人機本身的運算支援有限,因此如何提升小物件的辨識效果且同時降低模型運算時所需的資源至關重要。本論文以YOLOv7為基礎模型進行改良,提升它對小物件的偵測效果且同時降低模型參數量及計算量,我們以VisDrone-DET2019資料集來驗證模型改良成效。總共修改五種方式,第一種方式是將ELAN (Efficient Layer Aggregation Network)替換成M-ELAN (Modified Efficient Layer Aggregation Network),第二種方式是在高階特徵層添加M-FLAM (Modified Feature Layer Attention Module),第三種方式是將特徵融合的結構從PANet (Path Aggregation Network)改成ResFF (Residual Feature Fusion),第四種方式是將模型內下採樣的模塊改成I-MP模塊 (Improved MaxPool Module),最後一種方式是將SPPCSPC (Spatial Pyramid Pooling Cross Stage Partial Networks)替換成GSPP(Group Spatial Pyramid Pooling)。綜合以上方法,將mAP (mean Average Precision)提升1%,同時模型參數量卻下降24.5%,模型計算量GFLOPs (Giga Floating Point of Operations)也降低13.7%。
  • Item
    用於光學相干斷層掃描之基於深度學習和聯邦學習框架之視網膜層分割技術
    (2024) 張博翔; Chang, Po Hsiang
    在本研究中,我們提出了一種輕量級模型FPENet(α),以FPENet為基底,用於處理專為邊緣設備設計的 OCT 影像中視網膜層分割。視網膜層分割是眼科診斷的重要工具,但其在資源有限的邊緣設備上應用時存在計算成本和精度之間的瓶頸。FedLion(α)在使用 HCMS資料集、NR206資料集及OCT5K資料集進行訓練和測試時,實現了高精度和高效率。該模型經過最佳化,實現了精度和計算成本之間的平衡。FPENet(α)可以有效地捕捉不同尺度的特徵,同時大幅降低計算成本,非常適合部署在如Raspberry Pi等資源有限的邊緣設備上,其輕量化設計使其在計算資源和內存容量方面具有顯著優勢。聯邦學習的部分我們以FedLion為基礎添加了L2正則化與學習率遞減,提出FedLion(α),有效處理數據非獨立同分布的問題。數據顯示使用FPENet(α)與FedLion(α)進行聯邦學習,相較於原先只使用FPENet(α),在HCMS資料集平均DICE係數提升了0.7%,在NR206資料集提升了3.75%,在OCT5K資料集提升了9.1%。
  • Item
    基於深度學習之職安監測系統開發
    (2023) 王千瑞; Wang, Chien-Jui
    在台灣,每年施工造成意外的比例與職業傷害皆位居前茅,對勞工的生命與產業的生產力造成重大影響,其中勞工不安全行為是意外發生的首要原因。防制此行為的傳統方式是在施工現場架設監視器或派人監工,但由於人力問題,監督的效果與效率並不理想,基於此本研究開發以深度學習為基礎之職安監測系統來協助施工現場的職安管理。科技的進步大幅提升影像辨識能力與速度,本研究利用經過模型架構優化和訓練過程優化的新穎物件偵測器YOLOv7,針對施工現場影像進行訓練並建立職安狀態辨識模型後,對施工中的影像進行偵測,將未符合職安規定的事件篩選出來,最後將辨識結果以LINE Notify即時通報。與YOLOv5演算法進行比較,YOLOv7模型在演算法有改進之外,本研究透過訓練資料集的修正與增加以及模型的重新訓練等方式改善職安監測系統的辨識能力,使模型的mAP提升了約4%。本研究所建立的辨識模型在訓練階段的最佳mAP@.5高達0.98,此高mAP@.5表示可減少誤報與漏報情況的發生。誤報率太高會造成現場施工的困擾,並對通報失去信心;漏報率太高代表違反職安事件的偵測效果不彰,此將影響即時預警的功能。高mAP@.5所帶來的效益將提升施工現場的安全管理,減少意外的發生,強化本研究在產業實務應用的可行性與價值性。
  • Item
    基於深度學習與物聯網之道路施工職安監控系統
    (2022) 游孟修; Yu, Meng-Hsiu
    目前新北市、台北市、桃園市、高雄市在道路挖掘施工時皆規定需要在 工地架設攝影機來即時錄影監控,本研究為了能監控攝影模組的狀態,透過 SSTP 與攝影模組的路由器建立連線以取得溫度、電壓等數值,再使用 Node.js 建立監控平台,記錄攝影機的運作狀態,並偵測回傳的數值,若發現異常狀 態,則使用 Line Notify 推播,以降低監控人員需要觀看螢幕的時間,並更容 易找出設備異常的可能原因。此外,本研究運用 YOLOv5 深度學習之方式建立職安狀態辨識模型, 並與其他物件偵測演算法比較。使用模型即時對施工監控影像進行物件偵測, 記錄違規的樣態,如未配戴安全帽或未配戴反光背心的施工人員,系統將違 規的時間點記錄下來,若超出一定的時間範圍就以 Line Notify 推播,期望減 少施工時發生意外的可能性。
  • Item
    基於YOLO深度學習用於小型漂浮物檢測的新型卷積演算法
    (2023) 沈峻宇; Shen, Jun-Yu
    海洋中的不當廢棄物已導致全球危機,為了緩解這個問題,要在海洋及河流的廢棄物到達環境負荷上限之前對其進行檢測和清理,本研究提出了一種基於 YOLOv4 的算法來檢測河流中的漂流廢棄物,算法結合了改進後的RegP池化層並添加到空間金字塔中的池化層與減少輸出部分的檢測層,以改進特徵提取並防止丟失重要或微小細節,並且針對微小的物品進行檢測。實驗結果中評估了本研究的方法在 FloW和Pascal VOC資料集上的性能,與現今的最先進的技術相比,結果表明提出的方法具有更好的mAP準確率,具體來說,在FloW上分別提升了7.91%和11.36%,並且也與多個在漂流廢棄物檢測的先進方法進行對比,獲得了最佳的準確率,在Pascal VOC上的實驗證實了本研究的方法在不同尺寸大小的物件上的有效性,最後測試了在WIDER FACE上對小尺寸的人臉進行檢測實驗,在準確率上也有一定的提升。本研究提供了一個有前途的解決方案,有助於檢測和清除河流中的廢棄物。
  • Item
    基於深度學習之光流法應用於全天空影像之日射量估計與預測
    (2023) 陳家豪; Chen, Chia-Hao
    因應太陽能發電日益重要,又因太陽能發電量受制於日射量的影響,同時考量太陽能發電是間歇性的能源,故提出一種基於深度學習光流應用於全天空影像之日射量估計與預測的方法。由於日射量變化容易受到天氣狀況影響,本文藉由全天空影像,建立一個以影像特徵為基礎之日射量估計與預測系統,其影像特徵包括,利用紅藍比例法計算影像中雲層比例、雲層厚度,及藉太陽位置演算法得到影像中太陽位置,分析太陽附近雲層特徵,萃取全域與局部的雲層權重。同時用基於深度學習的光流法推算雲層移動的狀態,並製作未來數分鐘之天空預測圖像,將這些預測圖像作長短期記憶(LSTM)之輸入特徵,日射量作為訓練輸出,其深度學習光流法是透過卷積神經網路來實現。本文將資料集區分為月、季、半年與一年,分別進行10分鐘至60分鐘的日射量預測。同時,本文使用多個效能指標評估效果,包括平均絕對誤差(Mean Absolute Error)、均方根誤差(Root Mean Square Error)與判定係數(R^2)。最後,與文獻的方法進行比較,本文所提的方法具有較好的結果。
  • Item
    基於深度學習之多連接模塊對於物件偵測的影響
    (2022) 李政霖; Li, Cheng-Lin
    在本論文中,我們提出與YOLOv5不同的加深網路模型的方法,並設計了三種適用於特定資料集的多連接模塊(Multi-Connection)。多連接模塊的主要目的是重用特徵並保留輸入特徵以供向下傳遞。我們在8個公開的資料集驗證我們的方法。我們改進了YOLOv5中的殘差塊(Residual block)。實驗結果顯示,與YOLOv5s6相比,YOLOv5s6加入多連接模塊型一在Global Wheat Head Dataset 2020上的平均精度(mAP)提高1.6%; YOLOv5s6加入多連接模塊型二在PlantDoc 資料集上的 mAP 提高2.9%;YOLOv5s6加入多連接模塊型三的mAP在PASCAL Visual Object Classes(VOC)資料集上提高了2.9%。另一方面,我們也比較了一般的傳統深化模型的方法。一般來說,加深網絡模型會提高模型的學習能力,但我們認為對於不同的資料集,採用不同的策略可以獲得更高的準確率。此外我們設計多連接模塊型四,應用在交通號誌偵測上,多連接模塊型四之一基於殘差塊做堆疊增加網路深度,來加強網路的學習能力,並加入壓縮和激勵模塊(SE block),來強化特徵圖資訊,另外透過一個額外的跳連接鼓勵特徵重用。多連接模塊型四之二,主要是將多連接模塊型四之一的通道減半,來減少模型計算量跟參數量。多連接模塊型四之三我們基於多連接模塊型四之二多增加一個3乘3的卷積提升模型學習能力。我們選擇TT100K資料集來訓練模型,我們也收集了臺灣交通號誌當作客製化資料集,去驗證我們的方法,目的是要設計出一個高效性能的模塊,所以設計出多連接模塊型四之三。在TT100K資料集中多連接模塊型四之三獲得最好的表現,與YOLOv5s6相比計算量僅增加了11%,mAP提升了3.2%,犧牲一點計算量換來模型準確率有感的提升,此外我們也在其他公開的資料集驗證我們的方法,多連接模塊型四之三的表現也是非常有效益的。