追求卓越臺灣大學拔尖研究團隊展示13項領先國際之資訊電子科技研究成果11月1日舉辦成果發表會

近年多媒體技術的發展一日千里,令人眼花撩亂,目不暇給。結合網際網路的無所不包及無遠弗屆,深入我們日常生活,提供更有聲有色、多采多姿的數位世界。

臺灣大學在資訊電子科技的研究成果,一向傲視國際。11月1日將公開展示三大類13項領先國際之多媒體技術,包括曾獲得全球多媒體頂級大會ACM Multimedia 最佳論文大獎的自動分類拼貼照片及配樂技術、全球第一台具備顯微功能的手指操作的桌面電腦、以及全球唯一自動製作標題、摘要、主題樹及目錄等的電視新聞蒐尋及瀏覽系統等。

這次展出的成果共有三大類計十三項,分別是: (A) 生活與娛樂類,包含五項成果; (B) 視覺與互動類,亦含五項成果;(C)新聞與資訊類,含三項成果。這是臺灣大學的「優勢重點領域拔尖計畫」項目下的「資訊電子科技整合研究中心」最新研究成果。發表會將邀請相關產業界人士參與,推動產學合作的前景可期。

展示會將由臺大校長李嗣涔主持,李校長指出,產業發展是國家繁榮的重要關鍵之一,而「數位內容」是我國重點產業目標「兩兆雙星」中的「雙星」之一;高科技產業要具備國際競爭力,必須學術界走出象牙塔,把學術研究與日常生活結合,才能作出真正有助產業的研究成果,這是臺灣大學努力的諸多方向之一。此次有成果發表的臺大團隊成員,包括:李琳山、吳家麟、洪一平、歐陽明、陳宏銘、莊永裕、陳光華、陳炳宇等多位教授。以下重點介紹展出項目:

(A) 生活與娛樂類

在 (A) 生活與娛樂類中,「拼貼幻燈秀」(A1)主要考慮在數位相機的環境下,每個家庭、每一個人常常都隨時有大量數位照片,卻沒時間去整理,因此發展出全套自動整理相片並製作幻燈秀的技術,可以自動將多張主題相關的數位照片歸類找出,並以拼貼方式呈現,再配合音樂旋律節奏播放,讓不同照片與音樂之間產生視覺、聽覺的加成效果。

其技術內容包括利用照片的色彩分佈和時間資訊進行影像自動分群,將主題相關的照片拼貼在一起;偵測音樂的節奏,作為畫面切換的依據;自動判斷照片的視覺興趣區,設定照片在版面中的大小及位置等。

本技術得到全球多媒體頂級大會ACM Multimedia 最佳論文大獎,是全世界上百篇頂級論文中的第一名作品,獲得全球學術界的肯定。這是電資學院資訊網路與多媒體研究所吳家麟教授的團隊的成果。

(B) 視覺與互動類

在 (B) 視覺與互動類中,「指觸顯微桌」(B1)與微軟即將推出的產品碰巧有類似概念,把桌面變成一個顯示幕,使用者直接用手指觸動操控,不需任何按鍵或滑鼠;而本項成果最大的特色,則是有雙重解析度,在使用者有興趣的區域提供「顯微鏡」般的效果,這是我們所知的全世界第一台具備這種顯微功能的指觸桌。其技術內容包括具有雙重解析度的背投影桌面,配合電腦視覺技術,偵測並追蹤使用者的手指動作,達到直覺的指觸互動。

此次展示時顯示在桌面上的將是Google Map,使用者可以用雙手自然而快速的瀏覽於世界上各個角落,同時提供大範圍的視野以及小區域的細節,在街道穿梭的同時也能有整體位置的概念,見樹也見林。這是電資學院資訊網路與多媒體研究所洪一平教授的團隊的作品。

(C) 新聞與資訊類

在 (C) 新聞與資訊類中,「今天有什麼我感興趣的新聞:電視新聞瀏覽器」(C1)考慮到今日社會電視新聞頻道眾多,每日可以看到的新聞不計其數,但使用者轉遍各台,卻不易找到他感興趣的新聞,或他想知道的事。

本技術乃自動辨識、分析、瞭解電視新聞的語音旁白,將系統接收到的所有電視新聞自動分類,根據內容一方面建成全面性的二維主題樹,一方面可以根據使用者的查詢指令,把找到的使用者想查詢的新聞,建成局部性的主題樹,且自動製作每一則新聞的摘要、標題及完整的新聞目錄。

使用者因而可以很方便的運用主題樹,新聞目錄及標題摘要等,瀏覽他感興趣的新聞,或直接搜尋他想知道的事。此次展示的系統,為現今所知全球唯一具備如此完整功能的多媒體語音瀏覽系統,也是華語語音技術領先全球所有語言的系統,英語或世界上其他任何語言均尚未見到有相同功能的系統問世。

本技術為延續卓越計畫「多媒體生活環境的數位內容科學」成果的延伸版本,曾應邀在美、歐、日共十餘個城市展示,包括至少兩個全球語音界頂級大會Interspeech,SLT的邀請參展。這是電資學院電信所李琳山教授的團隊的作品。

除上述 (A) (B) (C) 三大類各以其第一項為例詳細說明外,其他十項成果如下:

(A2)繽紛魔鏡-本技術將美學和諧色彩理論應用在服飾搭配上,共運用2880種色系變化的建議組合,幫助使用者選擇搭配衣服的顏色,可以不用換衣服就知道不同顏色的衣服穿在身上的效果。使用者只要站在「魔鏡」之前,拿任何一件衣服或褲子、裙子對著鏡子一比,系統就會自動顯示和諧配色的建議方案。

(A3) 3D跳舞機-本技術媲美Wii的互動機制,但Wii只能做手的動作,還須手拿遙控器,這台跳舞機不用遙控器,只要站在攝影機前,跟著螢幕動作全身舞動即可。系統取得影像之後,將人與背景分離,並比對人的動作是否正確。未來可能應用包括醫學復健、舞蹈學習與減肥運動等。本技術獲得美國電腦圖學頂級大會ACM Siggraph邀請參展及法國Laval Virtul虛擬實境會議邀請參展。

(A4)我拍的視訊影片不會晃動了-本技術使用最新技術,大幅降低因未使用腳架拍攝所造成的視訊畫面晃動及模糊效應,可以獲得平穩及視覺舒適的影片。

(A5) 名畫提醒您多喝水-本技術採用一個智慧型飲水杯來偵測使用者是否喝水及飲水量,另使用數位相框顯示一幅使用者喜歡的動態名畫。當使用者長時間未喝水時,系統就會自動提高動態名畫的風速,讓畫中的水波、船隻及樹木有劇烈的搖動,並發出呼呼的風聲,以提醒使用者應該要喝水了;當使用者飲用了適當的水量後,系統即降低風速,回復微風時的動態名畫。因此假如您不喝水,小心畫裡的風和日麗倏忽翻臉變天;風起雲湧!

(B2) 3D魔幻水晶球-本技術透過紅外線攝影機及多個壓力感測器,來偵測使用者的動作並操作水晶球。壓力感測器可以偵測使用者的手是否碰觸到球,紅外線攝影機則隱藏於水晶球下方,利用影像分析使用者的手勢。我們利用3D環物攝影技術將故宮典藏文物數位化,並運用特殊設計的光學機制讓文物虛擬顯現於水晶球中,使用者可以透過觸摸水晶球轉動在水晶球之中的文物,從不同角度欣賞文物之美。

(B3) 智慧型可程式光圈相機-本技術利用動態改變的光圈形狀與多工法擷取相機中的完整四維光場,使用者可以再調整任何所想要的對焦位置及光圈景深,產生不同效果的各種相片。拍照因而變得更簡單、更有彈性、更有趣,不會錯過任何精彩的影像,而且還可以產生立體景物。

(B4) 一個也跑不掉:高效能人臉偵測-本技術以機器學習演算法為基礎,利用影像的彩色資訊,對多視角的人臉,針對每一視角分別作出各自的人臉偵測器,得到比現有技術大幅提升的效能,可以快速且正確地由輸入影像中找到每一個人臉的位置,一個也跑不掉。可應用於安全監控系統、人臉辨識、網路攝影機及數位相機之自動對焦等。

(B5) 大小眼觀察家-本技術包含了一台固定式廣角攝影機及一台高速可旋轉攝影機,以及兩台投影機,其中高解析度之投影機亦配備可旋轉之鏡頭。使用者可以對著牆上的巨幅廣角畫面點選感興趣之處,高解析度之攝影機便會旋轉,提供該處的細緻影像,與廣角全局影像有無接縫的疊合。此技術可以應用在居家照護以及安全監控等方面。

(C2) 有口皆碑還是過街老鼠:輿論意見自動追蹤器-本技術使用『情緒詞字典資料庫』,分析文件的意見傾向,例如意見為正面、負面或中性。使用者只要輸入一個查詢的主題,選擇資料來源,系統就可搜尋使用者想要的相關文件並分析文件的意見傾向,將結果以天為單位整理排列,可以看出輿論意見分佈及隨時間變化的情形,並將文章依據重要性以標題排列,供使用者參考。

(C3) 天下知識垂手可得:隨選網路資源-本技術是一套網路資源的整合查詢與管理系統,包含列舉、描述、解析三種功能。網路世界中所有有價值的資源均可由列舉模組登錄於系統,賦予具有唯一性的辨識碼;描述模組進一步對資料進行描述;解析模組再讓使用者直接應用辨識碼來查詢。系統提供簡單檢索與進階檢索兩種檢索功能。